首 页 资讯 宏观 金融 行业 国企 民企 人物 新资讯

首页>经济>行业

AI开发化繁为简背后,大模型从不排斥“小尺寸”

2024年04月16日 14:57  |  来源:人民政协网 分享到: 

人民政协网4月16日电 “过去,开发者用代码改变世界;未来,自然语言将成为新的通用编程语言,你只要会说话,就可以成为一名开发者,用自己的创造力改变世界。这一天并不遥远,我们看到,因为有了强大的基础大模型,有了很多低门槛,甚至零门槛的开发工具,开发者的生产力将得以大大提高。”4月16日,百度创始人、董事长兼首席执行官李彦宏在Create 2024百度AI开发者大会上强调,未来开发应用就像拍个短视频一样简单,人人都是开发者,人人都是创造者。他同时正式发布了文心大模型4.0工具版。

文心大模型4.0工具版可以被视为一个智能工具箱。其中,强大的基础模型系列,也就是文心大模型系列,包括了:旗舰版的ERNIE3.5和4.0,和轻量版的ERNIE Speed、Lite、Tiny等。

在分享百度基于大模型开发AI原生应用的具体思路时,李彦宏提出,MoE(混合专家模型)、小模型和智能体是值得关注的三个方向,“这是我们根据过去一年的实践,踩了无数的坑,交了高昂的学费换来的”。

“未来大型的AI原生应用基本都是MoE架构。”李彦宏表示,MoE不是一般的学术概念,更非依赖一个模型来解决所有问题,而是大小模型的混用。但什么时候调用小模型、什么时候调用大模型、什么时候不调用模型,这要针对应用的不同场景来做判断。

“小模型推理成本低,响应速度快,在一些特定场景中,经过SFT(监督)精调后的小模型,它的使用效果可以媲美大模型。这就是我们发布ERNIE Speed、Lite、Tiny三个轻量模型的原因。我们通过大模型,压缩蒸馏出一个基础模型,然后再用数据去训练,这比从头开始训小模型,效果要好很多,比基于开源模型训出来的模型效果更好,速度更快,成本更低。”李彦宏这样说。

而智能体则是当下很热的一个话题,随着智能体能力的提升,大量新的应用还将被不断催生出来。在李彦宏看来,智能体机制,包括理解、规划、反思和进化,它让机器像人一样思考和行动,可以自主完成复杂任务,在环境中持续学习、实现自我迭代和进化。“在一些复杂系统中,我们还可以让不同的智能体互动,相互协作,更高质量地完成任务。这些智能体能力,我们已经开发出来了,并且向开发者全面开放”。

据了解,在MoE、小模型、智能体这三个方向上,百度都已经为大家匹配好了“开箱即用”的工具,即三大AI开发工具:智能体开发工具AgentBuilderAI原生应用开发工具AppBuilder;各种尺寸的模型定制工具ModelBuilder。

资料显示,发布13个月以来,文心一言经历了从3.0版本到3.5,再到4.0版本的进化,目前用户数已突破2亿。业界认为,文心4.0在理解、生成、逻辑、记忆四大能力方面,均达到业界领军水平。(崔吕萍)

编辑:秦云