北京日报客户端 | 记者 赵语涵
最近,人工智能模型ChatGPT成为关注焦点,国内多家互联网公司也纷纷表示将推类似模型。2月20日消息,复旦大学自然语言处理实验室方面表示,国内第一个对话式大型语言模型MOSS已由邱锡鹏教授团队发布至公开平台(https://moss.fastnlp.top/),邀公众参与内测。结果消息引发广泛关注,记者21日早间登录网站发现,由于访问量过大,网站被“挤爆”暂无法内测。
(相关资料图)
记者登录网站后,看到一则来自MOSS的声明。声明称,“首先非常感谢大家的关注!MOSS还是一个非常不成熟的模型,距离ChatGPT还有很长的路需要走。我们一个学术研究的实验室无法做出和ChatGPT能力相近的模型,Moss只是想在百亿规模参数上探索和验证ChatGPT的技术路线,并且实现各种对话能力。”
声明表示,“我们最初的想法只是想将MOSS进行内测,以便我们可以进一步优化。没有想到会引起这么大的关注,我们的计算资源不足以支持如此大的访问量,并且作为学术团队我们也没有相关的工程经验,给大家造成非常不好的体验和第一印象,在此向大家致以真诚的歉意。”团队还表示,在MOSS完成初步的验证之后,会将MOSS的经验、代码、模型参数开源出来供大家参考。
对于MOSS的命名,团队在声明中表示,第一代模型的时候,正值流浪地球2热映,片中MOSS给团队每个人都留下了深刻的印象,因此便使用了这样一个名称来指代我们的模型。
据悉,MOSS可执行对话生成、编程、事实问答等一系列任务,打通了让生成式语言模型理解人类意图并具有对话能力的全部技术路径。邱锡鹏表示:“尽管MOSS还有很大改善空间,但它的问世证明了在开发类ChatGPT产品的路上,国内科研团队有能力克服技术上的重要挑战。”MOSS研发项目得到了上海人工智能实验室的有力支持。
MOSS开发的基本步骤与ChatGPT一样,包括自然语言模型的基座训练、理解人类意图的对话能力训练两个阶段。在对话能力训练阶段,OpenAI收集了至少几十万条人类指令,让各行各业的专业标注员写出指令回复,再将它们输入模型基座,以帮助ChatGPT逐步理解各种指令。复旦团队则采用不同的技术路线,通过让MOSS和人类以及其他对话模型都进行交互,显著提升了学习效率和研发效率,短时间内就高效完成了对话能力训练。
邱锡鹏坦言:“MOSS与ChatGPT的差距主要在自然语言模型基座预训练这个阶段。MOSS的参数量比ChatGPT小一个数量级,在任务完成度和知识储备量上,还有很大提升空间。”
此前,有媒体测试MOSS回答问题的水平。当提问“一些人觉得,人工智能将取代很多人的工作,你觉得呢”时,MOSS回答:“我认为人工智能不会完全取代人类,而是在一定程度上帮助人们完成工作。例如,机器可以提高数据分析、决策制定等过程中的效率,并可以节省大量时间和精力。此外,AI也可以用来协助人类完成更复杂的任务,比如诊断疾病、开发新产品等。总之,AI可以使人类的工作更加高效,但它不会完全取代人类。”
可以看出,MOSS的回答语言流畅、逻辑清晰且观点正确。但科研团队也坦诚表示,当前版本的MOSS表现不够稳定,有些回答存在事实差错或逻辑不顺。“MOSS的英文回答水平比中文高,因为它的模型基座学习了3000多亿个英文单词,中文词语只学了约300亿个。”
图片来源:MOSS内测网站