2023年生命过程分子语言逻辑结构的AI解析专项
总体科学目标
围绕重要生理、病理过程,发展针对生物分子语言解读的人工智能新技术,解析生物分子的语言结构、逻辑和关联,揭示生命过程的因果规律,促进多学科融合,推动生命科学研究范式变革,为服务基础研究“四个面向”的战略任务提供理论储备和技术保障。
资助方向
围绕上述科学目标,拟资助开展以下研究:
(一)基因组语言的AI解析与干预。
基于认知智能大模型技术,结合多模态实验数据,解析DNA和RNA序列的分子语言结构和逻辑,对生物序列中不同功能模块进行分析建模,从而支撑对新型核酸药物进行序列设计与递送优化。资助方向包括但不限于:生物序列语言的结构与逻辑的表征和学习,核酸药物设计和翻译效率的优化,小RNA药物的设计,纳米颗粒为代表的递送方法设计,RNA药物新靶点的鉴定,RNA剪接位点预测等。
(二)蛋白质结构语言的AI解析与设计。
基于混合增强智能技术,结合生物物理、生物化学原理等规则,融合蛋白质结构、互作等多模态生物大数据,表征和学习蛋白质结构语言的逻辑与结构,实现对蛋白质等生物大分子的动态结构、相互作用规律的理解。资助方向包括但不限于:蛋白质动态结构预测、蛋白质-小分子/核酸/糖类动态复合物结构预测、蛋白质结构的聚类分析,蛋白质结构设计新方法新技术研究,以及新型功能性蛋白质结构与修饰设计。
(三)细胞多模态预训练大模型构建、分析与应用。
基于不断积累的高维度、多模态细胞多组学数据,构建细胞层面的多模态预训练大模型,系统解析细胞功能与演化的深层规律,并在调控机制挖掘、疾病机理解析、新型疗法开发等方面探索预训练大模型的应用新范式。资助方向包括但不限于:适应细胞特点的预训练大模型框架,多模态数据融合方法,时空组学的统一建模策略,模型解释策略和透明化方法,跨尺度调控机制挖掘,预训练大模型的典型示范应用等。
(四)生理、病理过程分子语言的AI解析与应用。
利用元学习技术的知识融合与泛化能力,整合分子组学与影像、视频等多模态数据,围绕节律、睡眠、社交活动等生理过程及相关疾病,融合从细胞到组织、器官的跨层次动态分子网络,理解化学修饰信号交流与传递的作用机制,解析生理、病理过程中分子语言的动态变化及决定因素。资助方向包括但不限于:动态化学修饰底物预测的小样本学习,修饰调控因子的零样本学习,生理、病理过程的动态修饰酶-底物网络建模,分子组学与表型、临床数据的跨尺度整合。
(五)时空响应的功能系统与稳态的多尺度分子语言集成逻辑结构与表征特性研究。
利用生成式人工智能技术在跨尺度知识理解与思维链推理能力,研究功能系统中的分子、细胞、系统层面多尺度分子语言的集成逻辑结构和表征特性。通过剖析时空变化下的跨尺度分子语言在功能系统中的相互作用和变化规律,理解功能系统稳态与动态响应机制,揭示跨尺度分子语言组成功能系统后产生新特性和新功能的“涌现(emergence)”规律。资助方向包括但不限于:免疫、神经、内分泌等重要生命系统的起源、多尺度分子语言的融合、互作和变化规律以及响应时空变化的内稳态产生的自然逻辑等。
资质认定
本专项项目直接费用总额度约为2000万元。计划资助10项,资助强度约为200万元/项。项目资助期限均为3年,申请书中研究期限应填写“2024年1月1日-2026年12月31日”。
申报事项
(一)申请条件。
本专项项目申请人应当具备以下条件:
1. 具有承担基础研究课题的经历。
2. 具有高级专业技术职务(职称)。
在站博士后研究人员、正在攻读研究生学位以及无工作单位或者所在单位不是依托单位的人员不得作为申请人进行申请。
3. 鼓励45岁以下的青年科研人员作为申请人申请。
(二)联合申请要求。
本项目可由一位申请人单独申请,也可由两位申请人联合申请。联合申请时,两位申请人(依托单位可以相同或不同)应属于不同领域或不同方向,一方申请人不作为另一方申请项目的主要参与者。联合申请双方需围绕同一个研究目标,分别撰写申请书【具体要求参见(四)申请注意事项】。
(三)限项申请规定。
1. 本专项项目申请时不计入高级专业技术职务(职称)人员申请和承担总数2项的范围;正式接收申请到国家自然科学基金委员会做出资助与否决定之前,以及获得资助后,计入高级专业技术职务(职称)人员申请和承担总数2项的范围。
2. 申请人和主要参与者只能申请或参与申请1项本专项项目。
3. 申请人同年只能申请1项专项项目中的研究项目。