新闻详情

DeeCamp2022 结营:30支队伍探索AI+生命科学新边界,蛋白质组学AI大数据模型夺冠

8月31日,DeeCamp2022人工智能练习营总冠军辩论暨结营仪式在立异工场北京总部线上举行。经过一上午的精彩辩论,应战大规划蛋白质组学信息发现赛题的ProteinMiner团队摘得DeeCamp2022总冠军的荣誉,别的五支部队取得优胜奖。

DeeCamp人工智能练习营是立异工场建议的一项面向全球大学生的公益项目,专心培养使用型AI人才,迄今现已举行六届。DeeCamp2022的主题是“用AI探求生命科学新鸿沟”,由立异工场和清华大学智能工业研讨院(AIR)联合主办,来自全球各个地区顶尖高校的核算机、生命科学等专业的150位学员自发组成30支部队,经过两个月的课程学习和项目实践,终究共六支部队入围终究辩论环节。

立异工场董事长兼CEO李开复、清华⼤学智能工业研讨院(AIR)院长张亚勤、沙特阿卜杜拉国王科技大学终身正教授兼我国人民大学高瓴人工智能学院拜访讲座教授高欣、深圳湾试验室体系与物理生物学所资深研讨员周耀旗、清华大学智能工业研讨院副院长刘洋、清华大学智能工业研讨院(AIR)首席研讨员聂再清、我国人民大学数学科学研讨员龚别致、立异工场履行董事兼前沿科技基金总经理任博冰担任评委并到会了断营仪式。

立异工场董事长兼CEO、HICOOL商学院荣誉院长李开复博士表明,AI+科学穿插是立异工场猜测未来5到10年间会引爆的立异增加新范式,AI+生命科学更是谋福人类、影响深远的黄金赛道。这也是6年来一向倡议“学以致用”的DeeCamp初次聚集AI+生命科学这一出题的深意地点。这次入围总决赛的6支团队都是由AI和生命科学相关专业的优异同学组成,在顶尖科研、工业导师辅导下,在蛋白质结构猜测、全基因组表达猜测等各种场景进行探求,应战了多个实在国际的难题。很快乐决赛同学在这次大赛中锋芒毕露,等待在不久的将来,成为我国“AI+生命科学”赛道的立异前锋。我期许有志创业的DeeCamp同学,也能够把这次的项目实践视为工业价值的开始探求,一同重视协助高科技创业者的北京HICOOL创业大赛及HICOOL商学院的丰厚资源。

DeeCamp2022联合主办方、清华大学智能工业研讨院(AIR)院长张亚勤院士表明:“生命科学与生物医药范畴正在步入数字化 3.0 年代,以人工智能和数据驱动的第四科学研讨范式,将辅佐人类探求并处理生命健康的问题,加快生命健康与生物医药范畴向着更快速、更精准、更安全、更普惠的方向稳步开展。这既是AI for Science的严重时机,一同也将谋福全人类。我很快乐做为本次DeeCamp导师和评委,曩昔两个多月,我看到同学们在“AI+生命科学”的大出题下,积极探求AI与生命科学的穿插开展之路,也都取得了不错的作用。最终,再次恭喜冠军团队,也期望同学们都学有所成,满载而回!”

)再次参赛终夺冠,努力推进个性化免疫治疗开展

在整个上午的精彩辩论后,立异工场董事长兼CEO李开复博士对六支入围部队表明了必定:“本次大赛中,同学们都有令人冷艳的体现,特别是在短短的一个月时刻就环绕立异的课题取得超卓的作用。立异工场十分重视生物核算的开展,现已环绕‘AI+遗传中心法则’方面孵化了多家公司,包含AI+基因修改、AI+蛋白、AI+RNA等。本届DeeCamp同学们的体现让立异工场对这些前沿范畴的立异打破充满了等待,等待新代代AI+生命科学的人才投入,为未来生物核算带来更多惊喜。”

清华⼤学智能工业研讨院(AIR)院长张亚勤院士表明,很快乐持续和立异工场联合主办本届DeeCamp。生命科学范畴步入数字化3.0年代,DeeCamp2022聚集AI+生命科学,不只代表了当下整个科学界的研讨趋势,也代表了我国的科技和工业开展趋势。AI与数据赋能的全新的科学范式,不只会前进科学研讨的功率,也将会谋福整个人类社会。

随后,张亚勤院士发布了DeeCamp2022总冠军荣誉的归属。应战大规划蛋白质组学信息发现赛题的ProteinMiner团队,成为本届DeeCamp的年度冠军团队。

蛋白质是生命活动的实在承当者。获取蛋白质的序列和结构信息,关于疾病的研讨、药物的研制尤为重要。质谱作为一种生物表征仪器,在蛋白质测序范畴有着分配性的位置。但面对大规划的不知道序列蛋白,现有的质谱从头测序技能仍面对精度低的问题,而这是推进新抗原发现驱动的个性化免疫疗法亟待处理的难题。

ProteinMiner立足于AI与大数据驱动的蛋白质的质谱测序技能,努力于前进大规划地发现不知道的蛋白序列与结构信息的才能。ProteinMiner初次提出预练习的AI谱图言语大模型,前进质谱从头测序的精度,加快免疫相关的新抗原/抗体的发现,以推进个性化免疫治疗的进程。此外,ProteinMiner提出谱图分类深度模型,完成快速的交联质谱数据的判定,构建试验数据支撑的组学规划的蛋白质空间间隔信息数据库。

ProteinMiner团队的组成来源于咱们屡次协作的信任,队长毛鹏志是中科院核算所核算蛋白质组学/信息检索方向的博士生,队员还包含香港中文大学(深圳)核算机视觉硕博生叶崇杰、中科院核算所生物信息学博士生齐晓宁、香港中文大学(深圳)数据科学与大数据技能专业本科生薛浩楠。

夺冠后,队长毛鹏志表明,很感谢DeeCamp2022供给的资源和渠道,让自己能够找到情投意合的成员们,把自己的主意落地为实践,有时机取得学术和使用场景的打破。“全部才刚刚开始。这次夺冠是咱们取得的小的里程碑,咱们会持续坚持做下去,期望能够做出对学术界有影响,协助工业界降本增效,带来实践的效益的产品。这条路还有很远,十分感谢和爱惜DeeCamp为咱们供给了发动资金。”

毛鹏志与团队成员叶崇杰都是第2次参加DeeCamp,上一年他们也曾在一个团队并肩斗争,尽管铩羽而归但反而激起再次参赛的斗志。叶崇杰说,“第2次参加DeeCamp,是出于对DeeCamp和组委会的信任,也是因为对同伴的信任。我和鹏志有一同的愿景,我也信任他的才能和责任心,能够带领咱们取得成功。”

值得一提的是,部队里的薛浩楠同学,刚刚升入本科三年级的学习。被问到参加科研高手聚集的DeeCamp2022的感触时,他表明,自己十分爱惜DeeCamp供给的时机,不只能够深度体会技能落地与功用完成,还能够一窥生物信息这个当下最前沿的技能范畴。这些都是自己在课堂上难以一线接触到业界前沿技能+工业实践的时机,未来自己也有志持续在工程范畴持续探求和生长。

别的五支入围总决赛的部队取得了优胜奖。

以镁伽科技为工业导师的InfGene团队结合神经网络和树模型的优势,发现分形自编码器(FAE)能够选取比较 L1000 Panel 愈加精简的代表性基因集作为特征,在XGBoost模型上到达比L1000 Panel更优的全基因组表达猜测体现。该办法可进一步节省大规划丈量本钱,构成可专利的新Panel,并拓宽使用至树立安排特异性Panel,推进精准医疗。

多肽药物因一起的理化性质在如今的医药商场占有较高的比例,而亲和力是判别其能否成药的首要进程。Another random number团队发现在多肽中广泛存在着非标准残基,这些残基在前进与蛋白的亲和力、改进进入生物体内的各项性质起着至关重要的作用。为此,团队采用了大规划的预练习模型学习了蛋白与多肽的序列信息,并将多肽的结构信息作为特征引进模型练习,以期开发一个能够精确猜测多肽与蛋白的亲和力,为多肽药物的亲和力挑选及体内性质改造供给协助。

药物研制首要经过药物来按捺方针蛋白(PoI)的活性来发挥作用。现在干流的做法是找到一种小分子药物经过bind到蛋白活性区域上,然后让蛋白无法发挥功用。但不是一切蛋白都有这种蛋白结合口袋,事实上人体内只要大约2%的蛋白能够成药。而PROTAC技能能够经过使用身体内自有的蛋白降解进程,给PoI打上降解符号,然后直接把PoI直降解掉。这其间,猜测PROTAC三元复合体的结构是PROTAC研讨的要害一环。Alphinity团队聚集三元复合体的结构猜测,使用pre-train的欧式等变图神经网络提出了该范畴的第一个AI处理方案,将一次inference的时刻从小时级降低到秒级,期望能够为PROTAC的研制带来新的或许。

Maifold团队使用AlphaFold2及AlphaFoldMultimer猜测得到的蛋白结构,对已知会发生相别离的蛋白或蛋白复合体进行结构猜测。再结合图神经网络对蛋白质结构进行表征,经过GCN的办法练习分类模型,对蛋白单体或蛋白复合体的相别离才能进行猜测。

酶有你我怎样活啊部队整理了BRENDA数据库和文献中的Km和Kcat数据,构成了开始的数据集。经过揭露的数据集,团队整理了酶与底物的负例数据,并将酶的序列和AlphaFold猜测的结构进行了匹配,构成了包含酶结构数据的酶活性数据集。经过天然断点法将酶活性的值进行了等级区分,规则了酶的活性等级然后进行分类猜测。根据transformer模型,归纳考虑酶序列、酶结构与化合物数据对酶活性进行猜测,并评价了作用。

(二)四组专项冠军,直指生物医疗技能与社会痛点

最终,由沙特阿卜杜拉国王科技大学的高欣教授发布了DeeCamp2022四支专项冠军部队的归属。

最佳立异奖的得主DeepStruction团队规划了可用于药物发现的端到端分子生成渠道Molecule Brewer,供给网页端一站式、个性化服务。团队根据多模态思维,构建了“结构+序列”的分子生成模型,集成并开掘蛋白多构象结构信息,高效猜测蛋白-分子亲和性,可视化蛋白要害位点,助力靶点发现及蛋白改造。团队原创的BrewerScore类药性打分函数,比较QED有更低假阳性率,所建立的21个药物相关分子性质猜测模型在TDC榜单均独占鳌头,有用前进了药物分子挑选功率。根据该渠道,团队还创设了单蛋白孤儿病-靶点-潜在药物分子数据库,以AI之名,飨公益之心。

最佳技能奖的得主AlphaMed团队体系地探求了干流的人工智能蛋白质规划办法,并提出了能够取得更先进作用的新办法Adesign。他们的办法引进了视点信息,为神经网络注入蛋白主链序列先验信息,简化了蛋白图编码器,并在解码器端移除自回归机制来前进模型的推理功率。Adesign模型在AlphaFold DB和实在数据集CATH 4.2上,别离取得了超越60%和51%的精确率;在推理速度上较此前的办法快至少40倍,到达了毫秒级高效蛋白质规划的作用。

作为药物组成中的要害进程,先导优化因为依托专家凭阅历规划,并需求重复组成进行试验验证,也成为药物组成中花费最高、时刻最长的进程之一。为处理这个问题,啊对对队团队打造了面向药物化学工作者的智能先导化合物优化渠道DiffLead,使用人工智能辅导化合物优化,缩短研制周期、降低本钱。渠道立异性地提出了条件等变原子涣散算法,在涣散进程中充沛考虑到先导化合物的等变性和蛋白质口袋的条件信息,并手动搜集了首个实在先导优化数据集PDBLead用于练习,前进了优化后化合物与蛋白质口袋的亲和力。团队也斩获了DeeCamp2022最具工业价值奖。

现在,数千万我国人正遭受稀有病的摧残,而单个稀有病商场小,信息涣散,新药开发极为困难。现在急需能高效整合疾病信息,启示药物研制的东西。为此,最具社会价值奖得主make一同赢部队,以临床常识图谱为根底,聚集稀有病,从药物、疾病及多组学视点进行拓宽,然后整合药理学、遗传学和病理学等相关生物数据及使用NLP的文献信息,构成面向医师、患者、药企、研讨院所四类用户且具有生物解释性的稀有病常识图谱,并取得具有启示性的稀有病相关潜在信息。

(三)聚集AI+生命科学,探求前沿科技改动人类命运

人工智能+生命科学的穿插在2021进入迸发元年。在 Science 杂志发布的2021年度十大打破中,其间六项都来自生物学和医学范畴,人工智能蛋白结构猜测技能AlphaFold 和RoseTTAFold 成功猜测蛋白质结构更是被评为最大打破。

跟着高通量技能的开展,生物大数据呈现胀大式增加,AI算法在生命科学中得到了广泛的使用。例如随机森林(Random Forest)算法能够用于对性状相关基因组水平突变位点的猜测;卷积神经网络(Convolutional Neural Network, CNN)被广泛使用于蛋白质基团距离核算及医疗印象辨认技能等。AI与生命科学协同进化,不断延伸出新的科学鸿沟,AI与核算生物学、组成生物学、药物研制结合而催生的新穿插范畴,正在以史无前例的发展被开垦着。

2022年,第六届DeeCamp初次聚集AI+生命科学范畴,以“用AI探求生命科学新鸿沟”为主题,召唤全球 AI 和生命科学范畴的菁英们,迎候最激动人心的应战,探求改动人类命运的或许性,助力生命科学范畴我国AI使用型人才培养。

DeeCamp在2017年由立异工场建议,从开始小规划的试验性练习营,到今日每年训练几百名来自高校的AI+人才,旨在为学生供给技能学习、工程实践、产品转化和商业考虑的完好进程,推进产学研深度结合。举行至今,DeeCamp已累计收到2万余名在校大学生报名,选取并培养了1500余名学员,是现在规划最大、周期最长、最具特征的AI公益练习营。

六年间,DeeCamp取得了多位尖端学者和专家的支撑,包含李开复、张亚勤、吴恩达、陈润生、周耀旗、高欣、张宏江、周志华、周明、马维英等名师亲身授课,解说当下全球AI范畴热门研讨方向,以及“AI+”的未来时机与应战,一同涉猎AI技能产品落地、AI赋能年代的出资与创业等商业考虑。

一同,DeeCamp六年来也得到了来自工业界的数十家企业/组织的支撑,供给了名贵的课题资源、事例资源及导师资源。

镁伽科技创始人兼首席履行官黄瑜清先生表明:“十分快乐此次镁伽能作为战略协作同伴参加DeeCamp2022,与全球顶尖AI和生命科学范畴的菁英们一同探求前沿科技为推进人类健康前进带来的或许性。众所周知,生命科学现已开展成为数据驱动的学科,人工智能正在改动生命科学范畴的‘游戏规则’。而镁伽一向把数据作为中心财物,为算法的数据搜集规划相关试验,并使用大规划主动化试验渠道发生数据。此次DeeCamp2022,镁伽凭借在生命科学智能主动化范畴多年堆集的技能阅历和数据优势,约请相关范畴的资深科学家与同学们进行深度沟通和才智磕碰。未来,期望同学们能以DeeCamp2022的这次阅历作为起点,为推进我国AI+生命科学的进阶奉献更多力气!”

DeeCamp2022战略协作同伴HICOOL商学院一向努力于培养“硬科技企业家”,经过堆集的硬科技创业孵化阅历和资源,对科创企业和人才进行培养孵化。本次与立异工场和清华大学一同打造的DeeCamp面向全球顶尖高校人才进行技能训练和工业实践的试炼,应战实在国际的问题,做“有用的立异”。有志创业的同学也可重视HICOOL。近期,HICOOL商学院接受落地的国家(中关村)火炬科创学院也已正式发动,并建议建立百亿“火炬科创基金”,未来会支撑更多高科技人才创业立异,推进新年代科技立异开展。

DeeCamp2022协作同伴,亚洲根底设施出资银行战略与方针主任(数字科技)Paul Lam 林兴义表明,疫情催生了商场对医疗卫生范畴的科技立异需求,促进着该范畴根底设施的开展以进一步前进其可及性与普惠性。作为成立于数字年代的国际多边组织,亚投行努力于支撑咱们的成员和客户经过数字化技能使用,以科技赋能根底设施建造,推进包含卫生和教育范畴在内的根底设施相关工业转型晋级。

深圳市工程生物工业立异中心负责人罗巍表明:“作为高端生物工业的重要组成部分,组成生物学的发展备受瞩目。近年来,AI 智能与组成生物学结合的趋势越来越显着,传统的生物学依托阅历或发现来搜集常识,这个劳作密布的进程伴跟着很多试错,AI技能经过大型生物数据集得出结论的潜力,将给生物学带来巨大改动。大数据年代,AI 技能在杂乱目标的特征表征、多模态交融、样本主动生成等问题中体现出一起的优势,为组成生物学的使用插上了腾飞的翅膀。此次DeeCamp2022,立异中心作为大赛的协作方也约请深圳先进院组成生物学研讨所资深科学家与同学们进行深度沟通和才智磕碰,一同也恭喜本届活动圆满成功,同学们都能收成满满!”

转瞬六年时刻,DeeCamp陪同几千名莘莘学子,一路拓荒最前沿的AI技能与论题,不断应战自我,为我国人工智能范畴运送最新鲜的血液。本年,DeeCamp首先拥抱最前沿的趋势和改变,聚集AI+Science将会为科学研讨范畴带来的扭转乾坤之变,努力于为硬科技立异浪潮开掘和培养最优异的青年我国人才。未来的十年,等待看到越来越多的DeeCamp学员,逐步生长为我国硬科技立异的中坚力气,用AI探求科学,用科学影响国际。

返回资讯列表