据科技日报报道,23日,华大生命科学研究院与之江实验室联合发布全球首个百亿参数可部署的基因组通用基础模型Genos。该模型支持多达百万碱基对的超长上下文分析,并实现单碱基分辨率的精准识别。
人类基因组由30亿对碱基组成。“人类基因组计划”破译了序列,但序列上碱基的具体功能仍需要精准识别和解析。
现有模型大多基于1—2个参考基因组开展训练,难以体现人类遗传资源的多样性。而Genos整合了人类泛基因组参考联盟、人类基因组结构变异图谱计划(HGSVC)等多个权威公开资源,首次将全球范围内636个“端粒到端粒”级别的高质量人类基因组作为训练数据。这些数据覆盖了全球不同人群,有助更全面理解人类遗传多样性。
据悉,Genos模型已在HuggingFace、魔搭等平台全面开源开放,提供12亿和100亿参数两个版本,满足不同需求。
声明:本网转发此文,旨在为读者提供更多资讯信息,所渉内容不构成投资、建议消费。文章内容如有疑问,请与有关方核实,文章观点非本网站观点,仅供读者参考。
保险金信托燃爆会成为高净值客户“标配”吗?
保险金信托,作为信托和保险跨界合作的产物,越来越受到高净值客户的...
养老投资基金为什么是FOF
岁月匆匆。在人生长河中,我们常常被时间裹挟着奔跑,往往忽略了对未...
银行主推银保产品增额终身寿险抢占“C位”
近日,部分储户向《证券日报》记者表示,银行理财经理再度将银保产品...
沉寂许久的电力板块,终于把许多重仓“理所当然”的
基金经理“电”了一下。在亏钱不亏排名的聪明策略下,跟随主流资金重...
布局数字经济投资机遇华夏基金旗下ETF收益领跑
《投资者网》孟行今年A股市场行情热点频出,受益于政策面等多重利好...
中小公募发力本土区域市场“下沉”求突破
科技改变未来,伴随经济社会生活高质量发展跑出加速度,与美食烹制相...