9月22日消息,在2023第十二届中国智能产业高峰论坛(CIIS 2023)上,百度集团副总裁、深度学习技术及应用国家工程研究中心副主任吴甜表示,提升大语言模型能力主要面临三方面的技术挑战,一是要提升效果,二是要追求效率,三是要实际可用。
大模型技术在过去几年取得了快速的发展,特别是重新定义了人机交互方式,从图形用户界面(GUI)走向了自然语言交互(LUI)。大语言模型具备了理解、生成、逻辑、记忆这四项重要能力,可与人进行自然的交互,辅助人完成文图创作、规划、解题、编程等学习、工作、生活和陪伴等场景下方方面面的需求。
从“文心一言”的技术架构图来看,其底层是从数万亿数据和数千亿知识中融合学习得到的预训练大模型,可谓“读书破亿卷”。在预训练大模型的基础上,采用有监督精调、人类反馈的强化学习、提示(Prompt)技术等让文心一言的输出更符合人们对它的预期。同时百度还研发了知识增强、检索增强、对话增强等独有技术,从准确性、逻辑性、时效性、安全性等方面提升文心一言的模型效果。