首页>经济>行业

AI开发化繁为简背后，大模型从不排斥“小尺寸”

2024年04月16日 14:57 | 来源：人民政协网分享到：

人民政协网4月16日电 “过去，开发者用代码改变世界；未来，自然语言将成为新的通用编程语言，你只要会说话，就可以成为一名开发者，用自己的创造力改变世界。这一天并不遥远，我们看到，因为有了强大的基础大模型，有了很多低门槛，甚至零门槛的开发工具，开发者的生产力将得以大大提高。”4月16日，百度创始人、董事长兼首席执行官李彦宏在Create 2024百度AI开发者大会上强调，未来开发应用就像拍个短视频一样简单，人人都是开发者，人人都是创造者。他同时正式发布了文心大模型4.0工具版。

文心大模型4.0工具版可以被视为一个智能工具箱。其中，强大的基础模型系列，也就是文心大模型系列，包括了：旗舰版的ERNIE3.5和4.0，和轻量版的ERNIE Speed、Lite、Tiny等。

在分享百度基于大模型开发AI原生应用的具体思路时，李彦宏提出，MoE（混合专家模型）、小模型和智能体是值得关注的三个方向，“这是我们根据过去一年的实践，踩了无数的坑，交了高昂的学费换来的”。

“未来大型的AI原生应用基本都是MoE架构。”李彦宏表示，MoE不是一般的学术概念，更非依赖一个模型来解决所有问题，而是大小模型的混用。但什么时候调用小模型、什么时候调用大模型、什么时候不调用模型，这要针对应用的不同场景来做判断。

“小模型推理成本低，响应速度快，在一些特定场景中，经过SFT（监督）精调后的小模型，它的使用效果可以媲美大模型。这就是我们发布ERNIE Speed、Lite、Tiny三个轻量模型的原因。我们通过大模型，压缩蒸馏出一个基础模型，然后再用数据去训练，这比从头开始训小模型，效果要好很多，比基于开源模型训出来的模型效果更好，速度更快，成本更低。”李彦宏这样说。

而智能体则是当下很热的一个话题，随着智能体能力的提升，大量新的应用还将被不断催生出来。在李彦宏看来，智能体机制，包括理解、规划、反思和进化，它让机器像人一样思考和行动，可以自主完成复杂任务，在环境中持续学习、实现自我迭代和进化。“在一些复杂系统中，我们还可以让不同的智能体互动，相互协作，更高质量地完成任务。这些智能体能力，我们已经开发出来了，并且向开发者全面开放”。

据了解，在MoE、小模型、智能体这三个方向上，百度都已经为大家匹配好了“开箱即用”的工具，即三大AI开发工具：智能体开发工具AgentBuilder；AI原生应用开发工具AppBuilder；各种尺寸的模型定制工具ModelBuilder。

资料显示，发布13个月以来，文心一言经历了从3.0版本到3.5，再到4.0版本的进化，目前用户数已突破2亿。业界认为，文心4.0在理解、生成、逻辑、记忆四大能力方面，均达到业界领军水平。（崔吕萍）

编辑：秦云

人民政协报政协号客户端下载 >

首页>经济>行业

AI开发化繁为简背后，大模型从不排斥“小尺寸”

友情链接：