中国超所人工智能学院,北大为何押注“科学智能”?
图源:Unsplash
撰文 | 张天祁
过去几年,“人工智能学院”在中国高校中迅速铺开,据不完全统计,已经有所高校开设了“人工智能学院”。在这一波浪潮中,北京大学深圳研究生院选择了建立一所面向“科学智能”(AI for Science)的学院,把人工智能的重心放在基础科学问题上。
传统的AI教育更多是培养算法和工程人才,而 AI for Science 的目标,则是用AI去重塑和加速基础科学的发现过程。正如AlphaFold对生物学产生的影响,这种模式试图将AI从一个应用工具,转变为驱动物理、化学、材料等基础科学产生源头创新的关键。
“我们认为,未来从事数学、物理、化学、生物、材料等基础研究的科学家,应当积极拥抱AI,适应这种科研范式变革,否则他们的研究很可能就会落后”。北京大学深圳研究生院副院长、科学智能学院执行院长田永鸿在与《知识分子》的对谈中,这样表达学院选择AI for Science的考量。
知识分子:我们注意到现在很多高校都在成立人工智能学院,为什么北京大学深圳研究生院会选择“科学智能”(AI for Science)这个方向?
田永鸿:之所以选择AI for Science这个方向,主要有两个层面的考量。
首先,我们看到一个清晰的趋势:人工智能正在深刻地改变科学研究的范式。一个非常典型的例子就是蛋白质折叠预测。AlphaFold一出来,在一两年之内,几乎把全球所有的蛋白质结构都预测完了。这就是AI的魅力。它作为一个强大的工具,正在重塑科学研究的模式。
我们认为,未来从事数学、物理、化学、生物、材料等基础研究的科学家,应当积极拥抱AI,适应这种科研范式变革,否则他们的研究很可能就会落后。
其次,这个选择也与北京大学整体的发展布局相契合。北京大学深圳研究生院建院二十多年来,形成了学科交叉氛围浓厚的学术环境。这为我们探索AI for Science的新模式提供了一块创新的试验田。北大本部在数、理、化等基础学科上力量非常雄厚,我们希望在深圳先探索经验,如果成功,未来可以将这些好的经验和模式推广到北大本部乃至全国,起到一个探索的作用。
知识分子:在您看来,当前制约“AI+Science”快速发展的最大瓶颈是什么?科学智能学院的成立,能在多大程度上改变这种局面?
田永鸿:核心要解决的,就是人才短板问题。
现在在很多传统行业,比如医药领域,大家都知道AI重要,但具体怎么做很少有人知道。举个例子,我们对一些公司的调研时发现,从他们的院长到研究员,都意识到要用AI工具。但他们实际在用的,很多还是十年前的传统统计学习方法。对于大模型等新技术,他们一方面觉得很重要,另一方面又不知道该怎么用。
连领军企业都面临这种困惑,可想而知广大企业有多么缺少既懂AI又懂基础科学的复合型人才。我们希望通过建立这个学院,能够大量培养这样的人才,以解决现存的短板问题。
知识分子:过去很多“AI for Science”项目,往往是由具体的实验室或科研团队以跨学科合作的方式完成的。为什么现在需要将AI for Science系统化,专门建立一个学院来培养交叉人才呢?这种培养模式和传统的跨学科合作有何不同?
田永鸿:坦白说,传统的跨学科合作模式我们已经走了很多年,但始终存在一些难以解决的痛点。
首先是合作问题。比如一个做生物的老师和一个做 AI 的老师要合作,对方可能自己的项目都忙不过来,未必有精力参与,这种情况大量存在。即便合作了,第二个难题是成果的知识产权归属。项目做完后,论文谁做第一作者,谁做通讯作者?直到今天,这依然是高校里难以解决的难题。
搞科学的人往往认为,自己定义了科学问题、提供了数据,理应是主导。而做AI的人则认为自己提供了关键的工具和方法,也应获得相应的认可,这个矛盾很难调和。
最关键的,对于参与合作的学生来说,完成的交叉学科学位论文,由哪个学科的学位委员会来评审和把关?传统的学科体系是分离的,搞数学的、化学的、计算机的各有各的委员会和评价标准。一篇交叉学科的论文,两边的评委可能都看不懂,也找不到合适的评审人,导致学生的毕业和评价都面临困难。
知识分子:科学智能学院的模式,与传统跨学科合作相比,有什么不同?
田永鸿:我们推行双导师制,两位来自不同学科的老师从一开始就有共同的责任,他们的成果就是培养AI for Science的人才。这样一来,合作的意愿问题自然就解决了。两位导师共同指导一个学生,知识产权的问题也更容易通过协商解决,学生的归属是明确的,不必再去争“一作”或“通讯作者”。
学院会设立专门的交叉学科学位评定分会,来负责评审这类跨学科的论文。这样从制度上改变了过去那种依赖个人自学或零散合作的模式,使得交叉人才的培养能够系统化、制度化,从而真正推动AI for Science的发展。
知识分子:您刚才提到了双导师制,这个制度在实际运作中是如何分工的?
田永鸿:双导师制是我们针对当前现实的一个核心设计。坦白说,现在全球范围内既懂AI又懂Science的科学家凤毛麟角,我们很难找到足够多的单一导师来培养这样的学生。所以,我们采用两位导师共同指导一个学生的模式。这两位导师最好过去有合作基础,至少也要有强烈的合作意愿。
在指导过程中,他们的分工是明确的。科学导师负责定方向,也就是判断哪些科学问题是值得做的、是这个领域几十年来没解决的难题。AI导师则负责定技术路线,他要分析这个科学问题是否能用AI技术来加速或解决。
两者结合,共同指导学生。也意味着学生汇报工作时,两位导师需要同时参加。这个制度增加了导师的时间成本,学生的学习时间和内容也更多,但独特的培养和研究经历也会带来更优秀的竞争力。
知识分子:谈到评价,过去有一种说法,交叉学科在现有的科研评价体系里其实是比较吃亏的。作为一个新学院,科学智能学院会如何改革科研评价体系,避免被现有体系同化?
田永鸿:科研评价是指挥棒,如果指挥棒没弄好,交叉学科一定做不好。我们当然不可能凭学院之力彻底解决这个历史问题,但我们正面临一个很好的改革机遇。现在全社会已经认识到,发展交叉学科是必须要做的事情,整个学术界对交叉学科的包容度也在提高。
在学院内部,我们已经有了一些初步的探索。首先,对于学生的评价,北京大学专门设有一个交叉学位评定分会,我们AI for Science的学生论文就归这个分会来评审。这个分会是从交叉学科的视角来评价学生的学位论文。
其次,在教师的科研成果认定上。学院会在自己的学科领域内,率先认可共同第一作者、共同通讯作者具有同等贡献,在计算工作量、认定成果时予以同等考量。我们认为,在一项AI for Science的研究中,科学和AI两个方面的贡献是同等重要的。这个成果是双方紧密合作才能做得又快又好,必须抛弃传统的主次之分观念。
当然,我们一所学院的探索只是局部的。更大范围的评价体系改革,还得靠国家来调整这个指挥棒。这会是一个长期的过程,不可能一蹴而就,但我们希望通过这样的探索,慢慢引导形成一种新的、认可交叉融合的科研文化。
知识分子:在课程设置上,AI会与哪些学科交叉?
田永鸿:在课程设置方面,我们首批设立的交叉方向主要集中在AI与物理、化学、生命科学和材料科学的融合。当然,这只是我们的起点。未来,AI的应用会渗透到更多理工学科,如能源、环境等,甚至会扩展到人文社科领域。
在我们当前的培养体系中,课程设计概括为“一体六向”。“一体”指的是所有学生都要修的公共基础课程平台。这个平台包括三类课程:一是导论课,如《人工智能导论》和《科学智能导论》;二是计算与智能课,涵盖机器学习、科学计算和编程;三是交叉基础课,如《科学第一性原理》和科学实验方法。
在完成这个“一体”的学习后,学生再根据自己的兴趣和方向,进入不同的专业选修课模块,也就是所谓的“六向”。例如,选择AI for Life Science方向的学生,会选修计算生物学、蛋白质组学、AI药物设计等课程;而AI for Materials方向的学生,则会学习计算材料学、材料模拟等专业课程。
知识分子:在具体的平台建设上,学院如何规划“AI for Science”的落地?
田永鸿:AI for Science 的研究与教学,与传统 AI 有很大不同。传统 AI 培养中,一个学生可能有算力平台支撑就够了。但我们不仅需要算力和数据,更关键的是要有一个“干湿闭环”的实验平台。这里的“干实验”指 AI 模型的设计与计算,“湿实验”则是真实的物理、化学、生物实验。我们希望将两者紧密结合,让学生在校期间就能在这样的平台上训练,掌握新的科研模式。
举例来说,假设要设计一种新药分子,首先会在计算机上用 AI 大模型生成候选分子序列,筛选出最有希望的几个,并自动生成实验方案,由自动化实验机器人执行合成与验证。自动化设备不仅提高效率,也降低了 AI 背景学生操作复杂实验的门槛。实验完成后,数据会自动回传、可视化分析,并反馈给模型,形成高效的自动化迭代闭环。这样的设施与环境,是传统 AI 或传统实验室所不具备的。
知识分子:在数据资源和算力共享方面,学院会如何推动“AI for Science”的基础设施建设?
田永鸿:在建设这样的平台过程中,我们的目标不仅是提供 AI for Science 的科研基础架构,更重要的是推动科学数据的共享。长期以来,许多科学家习惯将自己的数据牢牢掌握在手中,结果就形成了成千上万个零散孤立的“数据孤岛”。
但在未来的大科学研究中,只有把分散的数据汇聚起来,才能取得真正突破。那些率先收集、整理并共享大科学数据的团队,将更有机会产出重大成果;而坚持“数据私有化”的模式,则会大大放慢研究进展,甚至难以取得实质性成果。这一趋势也会推动科学界的数据共享模式发生根本变化。
我认为这是一个重大的机遇。铺设这样的新型设施,就像建设高铁或发展电动汽车一样,是具有长远价值的基础性工作,对国家科技发展意义重大。
知识分子:学院地处粤港澳大湾区,这里有非常活跃的创新文化和企业集群。学院会如何与产业界合作?
田永鸿:我们正在和多家企业探讨合作,合作形式可以很多样,比如共建实验平台,或者采用企业出题的方式,由企业提供真实的产业疑难,作为我们学生的实训课题。而我们的角色,就是把企业带来的这些实际问题进行提炼和升华,剥离掉具体的工程细节,找出其中最本质的科学或技术挑战,让我们的师生来攻克。
知识分子:现在很多人在讨论,AI有没有可能自主发现一些新的科学定律,而不只是在现有框架内做一些高效的预测和计算?您对此有什么看法?
田永鸿:这可以说是AI for Science研究的终极目标之一。随着技术的发展,这种可能性是一定会有的。在当前阶段,AI的主要作用还是加速科学发现。
它体现在“干实验”环节,我们用大模型高效探索合成路径;也体现在“湿实验”环节,我们用自动化机器人并行做实验,效率远超人工。过去做碳纳米管材料,一天可能才能做一组数据,现在,机器人一晚上就能得到十组,而且数据重复性非常高。这种速度本身就对科研推动巨大。
实际上,AI自主发现的苗头已经出现。我们下一步就是要让AI模型通过学习海量的科学数据,进一步具备提出科学假设,甚至对某些科学问题进行自主探索的能力。我相信这一天的到来不会太久。当然,要解决像哥德巴赫猜想那样更深层次、更难的问题,还需要很长的时间。