您的位置:主页 > 公司动态 > 公司新闻 > 公司新闻
Meta裁掉的AI卵白质团队,被英伟达盯上了-外盘期
还记得被Meta裁掉的AI卵白质团队吗?
整个团队被无情裁掉后,其中8位科学家开办了一家名为EvolutionaryScale的AI 卵白质初创公司,去年被福布斯爆料已经融资4000万美元。
现在,EvolutionaryScale正式以种子轮推出,最终是1.42亿美元种子轮,远远高于此前爆料的4000万美元!
本轮投资由GitHub 前首席执行官 Nat Friedman、Daniel Gross 和 Lux Capital 领投,亚马逊和英伟达的风险投资部门 NVentures 也介入其中。
只管无法逾越Xaira Therapeutics这样的超级初创(以10亿美元资金设立),然则1.4亿美元的种子轮融资在生物手艺领域已经高得离谱。
就在统一时间,EvolutionaryScale还宣布推出其卵白质大语言模子ESM3。
该模子宣称其拥有98B参数,已经到达GPT3的参数规模,可以对卵白质举行序列、结构和功效的设计。
1、Meta的AI卵白质团队,归来!
2023年上半年,扎克伯格在Meta执行了”效率之年“,几个月之内大裁一万人,其中就包罗由十几名科学家组成的Meta-FAIR卵白质小组。
裁员的主要缘故原由是,他们以为这个团队“太学术化了”,公司希望放弃部门基础研究,转而支持能够发生收入的人工智能项目。
资源的残忍就在于,该团队业内并不算岌岌无名,而是依附ESMFold打响了名声。
ESMFold宣布于2022年7月,这是一个基于Transformer的150亿参数语言模子,此前是参数*的卵白质语言模子。
ESMFold展望出来的卵白质不仅和 AlphaFold 2 具有相似的准确性,但 ESMFold 推理速率更快,能够探索宏基因组卵白的结构空间。
此外,ESMFold进一步展望了约6亿个卵白质结构,这些卵白质来自此前从未被表征过的细菌、病毒和其他微生物,这些宏基因组也被称为生物界的“暗物质”。
被裁后,ESMFold 团队的 8 名首创职员确立了 EvolutionaryScale,再次并肩作战,该初创公司致力于基于人工智能手艺的卵白质展望模子研究。
首创人 Alexander Rives认真向导此前的ESMFold 团队,他是美国纽约大学盘算机科学博士,Facebook 前人工智能科学家,专注于生物学的大规模语言模子。
同时,他也是Fate Therapeutics、Syros Pharmaceuticals(均在纳斯达克上市)和Kallyope的团结首创人。
脱离Meta,再确立EvolutionaryScale,更像是重操旧业,也是Alexander Rives一直坚持的研究偏向。
有意思的是,公司名称“EvolutionaryScale”,正是在ESM模子(Evolutionary Scale Modeling )基础上设立的。
甚至后续推出的ESM3也是沿用了在Meta时期的名称,完全可以看作他们在Meta时期事情的后续。
2、ESM3:模拟5亿年的进化
就在宣布种子轮的统一天,EvolutionaryScale宣布了最新的ESM3模子,简朴来说这是一种多模态 卵白质天生语言模子。
该模子高达980亿参数,与GPT3的参数相当,也是有史以来用于训练生物模子的盘算量*的模子,花费了一万亿次浮点运算。
ESM3 较之前的版本举行了重大更新,从生物体和生物群落中采集的近 28 亿个卵白质序枚举行了训练,使科学家能够促使模子以越来越高的准确度识别和验证新卵白质。
ESM3 通过将多尺度数据纳入训练历程,它不再像 ESM2 那样只关注氨基酸序列数据而是整合了
原子坐标:提供有关卵白质结构的信息
序列数据:提供卵白质的基本组成部门
功效数据:说明卵白质在生物系统中的作用
多尺度方式使 ESM3 能够执行多个义务:领会卵白质的序列编码、展望结构以及功效。
沃飞长空完成B轮数亿元融资,加速低空交通落地
同时,数据解释随着规模的扩大,ESM3对于卵白质设计的能力也最先展现,它实现了却构天生中实现原子级精度的能力,对于设计功效性卵白质至关主要。
团队还验证了该模子的天生能力,以绿色荧光卵白(通常称为 GFP)为例,该卵白质能够自然吸收蓝光并发出绿光,被用于实验室追踪卵白质。
EvolutionaryScale经由了迭代,仅仅通过两次实验就找到了一个与自然亮度相当的荧光卵白质,也被称为esmGFP,新天生的esmGFP和自然GFP仅有58%的序列相似(229个氨基酸)。
然而在大自然界,发生新荧光卵白的进化历程需要数个世纪的时间,更不要说仅有58%的序列相似,也就是说esmGFP等效于进化模拟器执行的跨越 5 亿年的自然进化。
不外,生物学的数据异常稀缺,更不要说更高质量的数据,980亿参数详细怎么来的?
现实上,团队之前曾使用 AI 展望仅通过序列领会的卵白质的结构,而合成的数据是ESM3 的要害,为该模子的功效、规模提供了分外的途径。
ESM3向未来迈出了一步,在他们看来未来 AI 将成为一种工具,可以从*原理设计生物学,就像设计结构、机械和微芯片以及编写盘算机程序一样。
业内人士称,ESM3 标志着卵白质语言建模领域的潜在范式转变。它代表着从专注于扩大氨基酸序列数据规模的时代向更注重整合多样化、多尺度数据源的时代迈出的*步。
现在, ESM3的预印本已经放出,而且开放封锁测试版 API。团队还宣布,将宣布一个ESM3 1.4B参数版本的权重和代码,可以用于非商业化使用场景。
该模子即将在NVIDIA BioNeMo上推出,完整的 ESM3 系列模子将很快作为NVIDIA NIM微服务提供应特定客户,与 NVIDIA 互助举行运行时优化。
3、一场豪赌,英伟达又投了
细看Evolutionary Scale背后的投资人,会发现所有都是TMT投资人,包罗GitHub前首席执行官Nat Friedman、著名软件领域投资人Daniel Gross。
Lux Capital确立于2000年,总部位于纽约,该公司倾向于投资新兴科技公司,重点关注3D打印、机械学习和人工智能、航行和手术机械人等领域。
同样作为产业投资人,英伟达和亚马逊又双叒叕脱手了,为ESM3提供了算力支持。也就是说,该公司没有一家生物科技领域的支持者。
ESM3模子使用英伟达H100 Tensor Core GPU实现了有史以来生物基础模子中最多的盘算量。
980 亿参数的 ESM3 模子使用的浮点运算次数比其前身 ESM2 多出约 25 倍,数据量多出 60 倍。
要知道,这家公司自己就是一个“伟大的赌注”。公司此前的一份BP中,频频强调天生式人工智能模子可能需要十年才气辅助设计创新药物。
这个重大赌注是扩大其模子训练,以整合卵白质以外的数据,并为生物手艺应用确立一个通用的人工智能模子。
生长阶段大致是:扩大人工智能模子——为其提供更多数据并增添其规模——将发生“生物人工智能的能力突破”。
这也是为什么Evolutionary Scale会把模子参数越炼越大,但生物领域会不会像通用大模子那样泛起“涌现”能力还欠好说,尤其是生物界的许多知识仍然是未知的。
现实也是云云,生物学领域的人工智能在短期内不太可能提供丰盛的商业回报。像薛定谔这样的商业公司市值都低于30 亿美元。
在成本制订上,Evolutionary Scale 预计*年将破费 3800 万美元,其中超 42% 的资金,也就是 1600 万美元用于盘算用度。
第二年高达 1.61 亿美元,第三年高达 2.78 亿美元,其中,盘算用度划分为 1 亿美元和 2 亿美元,占比逐年增添。
凭证Evolutionary Scale的构想,他们希望通过平台互助、使用费和收益分成等方式赚钱。
例如,EvolutionaryScale 可能会与制药公司互助,将ESM3 整合到他们的事情流程中,或者与研究职员分享使用ESM3 实现商业化的突破性发现的收入。
除此之外,Evolutionary Scale的平台还可能用于环保、质料、农业等普遍与生物科技相联系的领域。
这也是为什么,ESM3模子要上架 Amazon Bedrock、Amazon Sagemaker、AWS HealthOMICs 和 NVIDIA BioNeMo,他们希望通过这些渠道更多地获取用户。亚马逊和英伟达的客户都将能够使用自己的数据对 ESM3举行微调。
Evolutionary Scale还把DeepMind 的分拆公司 Isomorphic Labs看成自己*的对手,后者已经和礼来、诺华等签署了价值30亿美元的药物研发互助。
一个细节是,ESM3是在Andromeda 集群上训练的,这一算力集群拥有包罗近3000块英伟达H100 GPU在内的大量算力基础设施,正巧是投资人Daniel Gross所有。
该算力集群造价1亿美元,被Daniel Gross用来换AI初创公司的股权,以是Evolutionary Scale中1.4亿美元的种子轮有一部门可能是通过算力支付,就像阿里投资月之暗面一样。
首创人示意,公司正在研发更大的模子,公司现在的资金可以维持约莫两年。就让我们期待一下ESM4。