登录
微信登录
打开手机微信,扫描二维码
扫描成功
请勿刷新本页面,按手机提示操作
中科曙光不会以任何理由要求您转账汇款,谨防诈骗
您的微信还未注册
中科曙光不会以任何理由要求您转账汇款,谨防诈骗
您可以同时关注中科曙光微信公众号
使用微信扫一扫即可登录! 查阅资料更方便、 快捷!
您已经注册账号和
关注微信公众号
2025年1月
服务热线:400-810-0466
发布时间: 2018-06-20
2018年5月8日,阐述我国科研人员在棉花变异基因组研究中取得重大进展的两篇论文同时在国际学术权威刊物《Nature Genetics》在线发表,中国农科院棉花研究所(棉研所)、安阳工学院重点参与了两篇论文的研究项目。这两项研究成果为棉花遗传研究和分子育种奠定了科研基础,为深化作物基因组研究提供了重要依据。这其中离不开现代技术对样本基因的深入研究。
在其中一篇论文所阐述的“亚洲棉多样性及演化的遗传学基础研究”项目中,曙光针对项目特点,为其提供了总体运算峰值13.248 TFLOPS(13.248万亿次浮点运算/秒)、总存储容量2PB(聚合带宽15GBps以上)的基础环境,充分支撑了对243份二倍体棉花种质材料的重测序,研究结果加深了我们对中国亚洲棉群体进化的认识,为将二倍体棉花优良抗逆性状导入广泛种植四倍体棉花奠定了重要的遗传基础,同时也会加快棉花育种进程。曙光自主研发的ParaStor系统在该研究的基础环境中发挥了重要作用。
性能高效,缩短测序时间的利器
在基因数据的应用过程中,科研人员都希望能够在尽可能短的时间内完成测序工作,使结果尽早实现科研或商业化应用。但在测序过程中会产生大到GB,小到KB的数以十亿计的业务数据。如何在随机读、并发读、顺序读等多种读写模式下从海量存储中快速获取基因数据成了科研人员要面临的挑战。
曙光ParaStor系统通过独有的小文件聚合技术,将众多较小的block聚合成一个较大的数据流,充分利用ParaStor数据节点10Gb的带宽性能,满足快速存储与读写需求。在文件分布策略上,ParaStor通过文件切片及N+M纠删码的冗余机制,能够把单个文件系统扩展到EB级规模,极大地改善了磁盘子系统的性能。ParaStor在研究过程中连续多次扩容,实现了存储性能和容量的线性增长,大幅提升了业务计算性能。ParaStor的缓存加速功能,则自动将热点基因数据存放在快速访问上,实现访问加速。多项技术共同造就了ParaStor的卓越性能,帮助科研人员完成挑战,实现重测序工作的高效进行。
运行稳定,保证测序业务的不中断
大量重测序数据的处理,对存储系统造成了非常大的访存压力。同时,任何的IO中断都会影响测序计划。而在使用过程中,硬盘、节点、网络等硬件设备却是“故障高发地”,如何保证基因测序工作稳定进行显得尤为重要。
ParaStor在设计时就把重要部件发生问题作为常态考虑在内,在控制器、网络、磁盘等层面都设计了冗余保护,可容忍多块硬盘或多个节点同时失效,且失效后业务不中断、数据不丢失,大大提高了系统的可靠性,为重测序工作的稳步推进提供了有力保障。
管理自动化,简化测序工作的复杂度
在研究过程中,科研人员更愿意将精力投入到数据处理和分析中,尽可能减少在IT设施运维上的精力分散,ParaStor易管理的特点则充分满足其需求。
ParaStor内置的自动管理机制极大简化了管理员的操作,多样的报警机制则可及时可靠地将故障通知给管理员,减少运维时间成本。利用ParaStor的管理工具,管理员可通过浏览Web页面轻松完成系统的部署、监控、管理和维护。管理工具的架构同样具有良好的扩展性,使管理员的工作量不会因数据的增加而加大。
曙光ParaStor分布式存储系统有效提升了基因测序的工作效率,保证了测序工作的顺利进行,减轻了运维人员的压力,为科研人员专注于核心工作,取得成果突破提供了有力支撑。曙光将充分发挥在信息技术领域积累的丰富经验与技术优势,为前沿科学技术研究提供强有力的IT支持,助力建设创新型国家和世界科技强国目标的早日实现。