探寻五千年历史变迁,浪潮AI加速中国考古DNA研究

  • 日期:08-17
  • 点击:(1358)


我想在2天前分享wave circle

中国第一个“考古DNA实验室”,由Inspur AI计算的FPGA产品解决方案,其分析时间为古人类全基因组样本(WGS),从原来的2周到近9个小时。

神秘的古代DNA研究有多难?

五千年来,所有民族都在中国的土地上生活,扩散和融合,留下了许多未解之谜。为了理解这些奥秘,考古学和民族学专家以各种方式进行了探索。近年来,人们开发出一种新的方法 - 古DNA技术,为考古研究提供了更为直接有力的证据,开辟了新的视角。

image.php?url=0MnPzdrWlW

古代DNA是指从古代人类和动物遗骸中提取的古代生物分子和古生物学的化石。将古代DNA数据与现代基因库的数据相结合,我们可以构建一个特定生物类别的系统发育树,从而进一步探索人类进化和迁移,种族整合,早期农业发展,动物和植物的归化和归化。诸如流程等重大问题。

在这种情况下,DNA本身也易于水解和破裂。同时,即使细胞被保存,它们也会遇到其他微生物的存在,产生的酶会破坏原始细胞中的DNA;因此,死亡动物和人类遗骸的DNA很难完整保存。

这些原因使得古代DNA基因序列片段比现代DNA短,导致比现代DNA更复杂的DNA测序。不仅读取和比较的数据量更大,而且在测序之前需要除去DNA片段两端的接头序列以进行数据清理和处理。

中国第一个考古DNA实验室如何解决问题?

为了更好地保护中国的遗传资源,促进中国的国家遗传研究,1998年,吉林大学考古系和生命科学学院合作研究古DNA,并在中国建立了第一个“考古DNA实验室”。边境考古研究中心人类学实验室和考古DNA实验室联合开展了重大研究项目,取得了许多国家乃至全球领先的研究成果。

image.php?url=0MnPzd4su9

随着DNA考古研究的逐步深入,考古DNA实验室中有1万多种古人类和古代动植物样本,居全国第一。在中国边境地区建立古老的DNA基因库的时机已经成熟。然而,样本数量的增加也带来了新的问题。原始计算设备很难在短时间内完成大量基因测序数据处理工作。全基因组样本分析(WGS)和全外显子组样本(WES)分析是DNA研究的两个必不可少的分析过程。然而,使用当前基于CPU的计算架构开发的GATK最佳实践工作流程需要数天甚至数周才能完成个人的基因组变异识别。

此外,较短的古DNA基因序列序列导致更大的数据处理和更高的计算能力要求。在数据清洗和测序过程中,有必要使用许多不同于现代DNA测序的应用软件。如何实现这些应用的快速移植和开发也是一个挑战,影响着古DNA的研究速度。

“我们一直在使用桌面工作站对古DNA进行测序数据处理。通常需要至少两周才能完成古代人类的全基因组样本分析。在此过程中,还面临着由停机造成的处理中断的风险。效率,我们必须在边境地区建立一个古老的DNA基因库几乎是一项不可能完成的任务。“吉林大学边疆考古研究中心副主任蔡大伟教授说,”但这个问题必须尽快解决。可能,古老的DNA研究不能拖延一下。 “。

浪潮为解决这个问题提供了新思路。作为中国人工智能计算的领导者,浪潮开发了用于基因测序的FPGA加速计算解决方案。 FPGA具有可编程,并行计算和低延迟的优点,可实现基因测序和语音。 AI和HPC场景(如识别,视频处理和风险管理)可提供强大的加速功能。经过严格测试和全面调查,吉林大学考古研究所决定与浪潮合作,将FPGA技术应用于古DNA基因测序,并在中国DNA考古领域创建首个FPGA基因测序加速应用程序。

加速39次,基因测序处理速度实现飞跃

新的基因测序加速计算解决方案使用浪潮的F10A FPGA加速卡作为核心计算模块,集成了Fengke的GATK基因处理软件。浪潮F10A是业界密度最高,性能最高的FPGA加速器,支持OpenCL。它是半高半长,仅消耗35W。它可用于各种复杂的计算环境,如数据中心,边缘和桌面。每瓦性能为42GFlops。您可以加载专业的软件算法库。集成的FOKK基因处理软件完全符合标准的生物信息学分析工具,包括所有GATK最佳实践流程,如BWA,picard和GATK。它完全符合原有的软件模型,调用命令与原版本一致,中间生成与原始样本一致的中间结果文件,方便用户使用和调整。

image.php?url=0MnPzdYDVw浪潮F10A加速卡

测试表明,浪潮FPGA基因测序加速计算程序可在9.64小时内完成全基因组分析,48分钟内完成外显子组分析,与基于CPU的方案相比,遗传数据处理速度提高39倍。

目前,基于新的基因测序加速计算系统,吉林大学考古DNA实验室的科学家正在研究中国北方草原游牧民族的人体骨骼,如匈奴,东湖,鲜卑,乌桓,契丹和蒙古。出土的动植物进行古DNA的提取和研究,实现新疆古丝绸之路沿线民族之间的关系,人口,经济文化生活,自然环境的迁徙和混合过程。和人际关系。研究不断为古代历史,文化和民族研究提供新信息,开辟了新的领域。蔡大伟教授及其团队正在研究国家社会科学基金的重大项目“古代动物DNA视角下的丝绸之路文化交流研究”,从古代动物DNA开始,恢复古代动物起源和传播的历史过程。丝绸之路上的群体,露出丝绸。东西方文化交流的历史细节。

收集报告投诉