Evo:AI模型精准解读和生成基因序列
November 20, 2024
位于Arc研究所的科学家们推出了Evo,这一突破性的人工智能(AI)模型训练于270万微生物基因组。Evo在AI与遗传学的交汇处代表了重要的进展,结合了解读和生成基因序列的能力,具有无与伦比的精确度。
Evo的工作原理
与传统的基于文本训练的AI语言模型不同,Evo利用DNA、RNA和蛋白质序列来同时学习和预测基因模式。这种创新的方法模仿了像ChatGPT这样的大型语言模型的结构,但其训练涵盖了遗传编码的复杂性,而非人类语言。
Evo的主要特点包括:
- 生物分子的综合理解: Evo跨多个生物数据类型学习模式,使其能够预测DNA变更的影响并设计新的基因序列。
- 新的基因设计: Evo已经设计了功能性基因编辑工具,为合成生物学的突破铺平了道路。
- 全基因组长度的创作: Evo生成超过100万碱基对的新颖基因组长度序列。虽然这些序列尚无法形成可行的有机体,但它们展示了AI处理大规模遗传数据的能力。
安全第一
出于伦理和安全考虑,研究人员故意从Evo的训练数据中排除了影响人类的病毒基因组。这一预防措施旨在减轻潜在的误用,并强调在遗传工程等敏感领域开发强大AI工具的责任。
Evo重要性
Evo能力的影响深远:
- 加速研究: Evo可以大幅减少分析基因数据所需的时间,提高对疾病和生物系统的理解。
- 药物开发: 通过设计新蛋白质,Evo可能革新治疗开发,包括罕见病的治疗。
- 疾病突变预测: 预测基因突变如何促进疾病可帮助开发预防策略。
- 合成生物学: Evo创造基因蓝图的能力可能为生物修复、农业等合成生物体打开新的大门。
伦理考虑
尽管潜在的好处非同寻常,但Evo的能力也引发了关于伦理使用和社会影响的严重问题。能够“像写电子邮件一样轻松编写基因代码”如果不被适当监管,可能导致误用或意外后果。与所有变革性技术一样,挑战在于最大化受益的同时最小化风险。
未来展望
Evo仍处于早期阶段,研究人员预计随着模型的发展将有重大改进。在微生物基因组之外,Evo可能扩展到遗传学的其他领域,进一步模糊人工智能与生物智能之间的界限。
随着社会逐渐应对“AI与DNA”的影响,Evo成为了突破性创新所带来的承诺与责任的证明。
有关更多详细信息,请访问发表在《科学》上的原始研究: https://www.science.org/doi/10.1126/science.ado9336