当前位置:首页 >期刊论文 >《最新论文》>正文

人工智能也可以有“基因”?

 2025/10/17 16:36:54 《最新论文》 作者:bet36体育在线:科学报 陈彬 我有话说(0人评论) 字体大小:+

与人类相比,目前的人工智能的知识学习效率是更高效还是更低效?

“这并不是一个很好回答的问题。”在接受《bet36体育在线:科学报》采访时,东南大学首席教授耿新表示,如果只是学习某个单一知识点,人工智能可能在极短时间内就能掌握,但如果是一些相对复杂的知识——

“比如,一个从未见过狗的孩子,只需仔细观察几张狗的照片,就能很快识别出现实中的狗,甚至能区分不同品种的狗;但要想让人工智能明白‘狗’是什么样子,往往需要提供几万个训练样本。”他解释说。

在耿新看来,人工智能在这方面远不及人类的一个主要原因,在于前者缺乏一种与学习相关的“基因”。而他目前从事的研究就是想让人工智能获得这种“基因”。

近日,耿新团队在人工智能神经网络学习范式方面取得的最新进展在《人工智能》在线发表。

“随机初始化”和“基因初始化”

针对人工智能中与学习相关的“基因”,耿新团队提出了一个原创性概念——学习基因(Learngene),

“学习基因可以被简单看做人工神经网络中的一种可‘遗传’的信息片段。我们希望它能像生物基因一样,将与特定任务无关的普适知识‘封装’起来,然后传递给新的模型,从而实现更高效、更通用的知识迁移。”耿新说。

这个概念并不容易理解,要想弄清其含义,可以回到“认识狗”的例子中。

耿新解释说,对于人工智能来说,理解“什么是狗”与学习其他复杂知识体系的底层逻辑是相似的,都需要依赖海量样本,通过多轮训练,才能建立起对于某个事物的基本概念。

在人工智能大模型的规模已达到万亿级参数的大背景下,为了让人工智能模型识别更复杂的概念,人们所需的训练样本无疑会是一个天文数字。

每一个人工智能模型在认识“狗”之前,都需要依赖海量的数据样本。然而,当新一代人工智能模型被研发出来,这样的流程又必须重新进行,因为目前的人工智能模型不管有多么先进和复杂,其诞生时都处在一个“随机初始化”的状态。

“所谓‘随机初始化’,简单来说,就是在新的大模型框架构建出来后,研发人员总要给它设置一个初始参数,这个参数通常是随机生成的,且与此前的大模型没有任何关联。”耿新解释说。

如此一来,无论之前的人工智能模型学习到多少知识,其“经验”都无法遗传给新一代模型。于是,“上一代”模型经历的学习过程,“下一代”模型自然要重来一遍,这在无形中便耗费了巨量的计算资源。

但问题是——人类婴儿同样无法从父辈直接继承其记忆与知识,为何他们仍能够快速学习,而不用“重来一遍”?

“这就是最奇妙的地方。”耿新告诉《bet36体育在线:科学报》,人类的遗传机制虽不能传递父辈的具体记忆或知识,但却遗传了一种更关键的能力——元学习能力。

他表示,元学习是一种学习机制,它不直接指向具体的知识或技能,而是关注学习过程本身的优化。因此,“元学习能力”可以理解为一种“如何去学习的能力”。

“从某种意义上说,刚出生的婴儿也处于一种‘初始化’状态,但这种‘初始化’并非随机,而是一种‘基因初始化’。”耿新指出,虽然婴儿尚未掌握具体知识,但人类在漫长进化过程中获得的“元学习能力”,却已经根植于每个人的基因中。正是这种基因的存在,使得人类具备了远超当前人工智能的学习能力。

那么,人工智能可以获得这样的“基因”吗?

让模型不必“从零起步”

对于这个问题,耿新团队进行了多年研究。

“要实现不同模型之间知识的遗传,需要满足几个条件。其中最关键的一点是学习基因作为模型信息片段不能太大。换言之,要实现信息的高度压缩。”耿新进一步指出,根据人类大脑神经元的数量粗略计算,如果要将描述这些神经元所需要的信息量压缩到人类基因组能存储信息量的水平,其压缩比要达到惊人的100万:1。

相比之下,目前人工智能系统通过人类算法设计所能实现的压缩比,最多只有约1%。“也就是说,我们可以做到从一个模型中提取约1%的信息量,并将其传递给新模型,从而使后者具备此前模型的部分功能。”耿新说。

需要注意的是,这些从原模型中提取的信息并非某类具体知识,而是针对人工智能系统的“元学习能力”。一旦这种信息可以被提取和传递,新一代人工智能便在原本“随机初始化”的基础上,获得了一定的“学习基因”。

自2022年起,耿新团队便致力于实现这一设想。最终,他们成功设计出一套完整的遗传强化学习框架,用以模拟生命的学习与演化过程。借助该框架,新模型不必完全“从零起步”,即可具备先天能力。

不久前,该团队在此前研究的基础上,进行了一个有意思的实验。

“我们设计了多代的智能体种群,每一代智能体在出生时都能够继承前几代的某些‘学习基因’。”耿新介绍说,但该继承过程需要经过一定的竞争与淘汰,这几乎模拟了生物种群的繁衍与进化过程。

研究团队将该“种群”进行了迭代训练。结果发现,“如果将第1代与第100代智能体进行比较,会发现后者的学习速度要快得多。甚至有些四足机器人刚‘出生’便能站立,几乎不会摔倒。”

耿新表示:“这充分表明,学习基因不仅在效率上显著优于传统模型的训练方式,而且能通过可遗传知识的不断积累而持续进化,为后代模型提供越来越强大的学习潜力。”

为人工智能自我演进打下基础

需要指出的是,虽然学习基因能显著加快人工智能模型的学习速度,但这并不意味着其最终的学习效果和质量必然优于传统训练方式。正如耿新所说,“学习基因或许能够提升人工智能模型学习效果的上限,但受限于当前的算力,这一点尚无法得到充分验证”。

即便如此,目前的研究成果仍令人振奋。

耿新向《bet36体育在线:科学报》表示,“学习基因”概念的提出及其潜在影响,可能为人工智能的自我演进奠定基础。

据介绍,目前人工智能的代际演进并非自主完成,而是必须依靠人力。比如,科学家需要研发出更新的算法,设计出更先进的网络架构;工程人员则要对训练数据的规模和类型进行调配,对模型的超参数进行调整。这些环节都要耗费大量人力。

“人工智能未来的发展方向之一,是实现其自身的自主进化和演进。这就要求不同人工智能模型之间能够形成一种可遗传知识的‘代际传递’。否则,这种演化可能沦为低效的重复计算。”耿新说。

他同时表示,目前关于学习基因的研究仍存在诸多挑战,例如如何实现跨架构的学习基因传递、如何进一步提升信息的压缩比等。但无论如何,这一探索方向仍然值得持续推进。(来源:bet36体育在线:科学报 陈彬)

相关论文信息:https://doi.org/10.1016/j.artint.2025.104421

版权声明:本文转载仅仅是出于传播信息的需要,并不意味着代表本网站观点或证实其内容的真实性;如其他媒体、网站或个人从本网站转载使用,须保留本网站注明的“来源”,并自负版权等法律责任;作者如果不希望被转载或者联系转载稿费等事宜,请与我们接洽。