2024-11-07 09:50来源:本站
OpenAI发布了一款名为“01”的人工智能模型,旨在更像人类一样进行推理。
在复杂的任务中,尤其是在科学、编码和数学方面,O1比以前的模型表现得更好。
专家们仍持怀疑态度,认为人工智能离实现通用智能还有很长的路要走。
感谢您的报名!转到时事通讯偏好
人类智能和人工智能之间的界限变得越来越窄。
OpenAI在周四发布了o1,这是该公司在一篇博客文章中表示,“旨在花更多时间思考,然后做出反应”的一系列新人工智能模型中的第一个。
与以前的模型相比,新模型可以处理复杂的任务,并且可以解决科学、编码和数学方面更困难的问题。从本质上讲,它们比现有的人工智能聊天机器人更像人类。
本文仅对Business Insider订阅者开放。成为业内人士,现在就开始阅读。有账户吗?.
虽然OpenAI的前几代模型在SAT和统一律师资格考试(Uniform Bar Examination)等标准化考试中表现出色,但该公司表示,01更进了一步。它的表现“类似于博士生在物理、化学和生物学方面具有挑战性的基准任务。”
例如,它在国际数学奥林匹克的资格考试中以很大的优势击败了gpt - 40——OpenAI在5月份推出的一个多模态模型。该公司表示,gpt - 40只正确解决了13%的考试问题,而01的得分为83%。
他们推理能力的急剧提升,部分来自于一种被称为“思维链”的提示技巧。OpenAI表示,o1“学会了识别和纠正错误。它学会把棘手的步骤分解成更简单的步骤。当当前的方法不起作用时,它会学会尝试不同的方法。”
这并不是说与早期的型号相比,没有一些权衡。OpenAI指出,虽然人类测试者更喜欢在数据分析、编码和数学等需要大量推理的类别中使用gpt - 40的反应,但在个人写作等自然语言任务中,gpt - 40仍然胜出。
长期以来,OpenAI的主要任务一直是创造通用人工智能(AGI),这是一种模仿人类能力的人工智能形式。今年夏天,当o1仍在开发中时,该公司公布了一个新的五级分类系统,用于跟踪其实现这一目标的进展。据报道,公司高管告诉员工,o1已接近第二级,即具有人类水平解决问题的“推理者”。
宾夕法尼亚大学沃顿商学院(University of Pennsylvania’s Wharton School)教授莫里克(Ethan Mollick)已经使用了o1一个多月,他说,该模型的好处或许最能体现在它解决填字游戏的方式上。对于大型语言模型来说,填字游戏通常很难解决,因为“它们需要迭代解决:尝试和拒绝许多相互影响的答案,”莫里克在他的Substack上写道。大多数大型语言模型“每次只能在它们的答案中添加一个标记/单词”。
但当莫里克要求01解决一个填字游戏时,它在回答之前思考了“整整108秒”。他说,该书的思想既“具有启发性”,又“令人印象深刻”,即使它们并不完全正确。
有关的故事
然而,其他人工智能专家并不那么相信。
纽约大学认知科学教授加里·马库斯告诉商业内幕网,该模型是“令人印象深刻的工程”,但不是一个巨大的飞跃。他说:“我相信它会像往常一样被炒得沸沸扬扬,但绝对不会接近AGI。”
自从OpenAI去年发布GPT-4以来,它一直在发布连续的迭代版本,以寻求发明AGI。今年4月,GPT-4 Turbo向付费用户开放。其中一个更新包括生成“更具对话性”的回复的能力。
该公司在7月份宣布,它正在测试一款名为SearchGPT的人工智能搜索产品,只面向有限的用户群体。