OpenAI 发布了其期待已久的“草莓”模型
2024-09-19 11:51:58行业资讯

OpenAI 发布了其期待已久的人工智能模型,之前代号为“草莓”。

openai-released-strawberry-o1-preview-model.jpeg

正如预期的那样,这个被称为“OpenAI o1-preview”的新模型——这是该公司全新的命名方式——根据该公司的一项更新,其“在响应前被设计为花费更多时间进行思考”,在其能够处理的“复杂任务”和“更难问题”方面突破了界限。

该模型长期以来一直有传言称是该公司实现人工智能通用化目标的一个突破,人工智能通用化是指人工智能在理论上能够超越人类的一个节点。重点是赋予该模型一种“推理”感,例如,使其能够解决更复杂的数学问题。

如果这家公司所言属实,那么它已经具备了一些相当厉害的学术资质。

OpenAI 声称该模型“在具有挑战性的物理、化学和生物学基准任务中的表现与博士生相似”。

但正如其名称所示,o1 预览版仍处于非常早期的状态,预计未来还会有很多更新。

“作为一个早期模型,它还没有许多使 ChatGPT 有用的功能,比如浏览网页获取信息以及上传文件和图像,”该公司写道。“在许多常见情况下,GPT-4o 在短期内将更有能力。”

目前,OpenAI 的 o1 将对 ChatGPT Plus 和团队用户开放。该公司还计划为 ChatGPT 的所有免费用户推出一个更轻量级的版本,称为 o1-mini,但尚未透露何时会推出。

OpenAI 表示,在设计其最新的人工智能模型时,将安全性放在首位。在其“最艰难的越狱测试”之一中,新模型得分为 100 分中的 84 分,而其前身 GPT-4o 仅为 22 分。

OpenAI 的研究负责人杰瑞·特沃雷克说:“新模型是使用全新的优化算法以及专门为其定制的新训练数据集进行训练的。”

该公司声称,o1 可以被“医疗保健研究人员用于标注细胞测序数据,被物理学家用于生成量子光学所需的复杂数学公式,以及被所有领域的开发人员用于构建和执行多步骤工作流”。

由于其新的“思维链”流程,它在选择最佳答案之前会对一个查询的多个答案进行评估。这可能需要一段时间,尤其是与我们从 ChatGPT 获得的几乎瞬间的答案相比。

在演示中,该模型花了 30 秒来解决一个涉及公主和王子年龄的推理难题。

至于其“产生幻觉”事实的倾向,这是一个历史上一直困扰着人工智能聊天机器人的明显问题,OpenAI 似乎更加现实。

特沃雷克说:“我们注意到这个模型产生的幻觉更少,但我们不能说我们解决了幻觉问题。”

该公司首席执行官山姆对新款产品发表了看法,称它“仍然有缺陷,仍然有局限性,而且它似乎在初次使用时比你使用一段时间后更令人印象深刻”。

“一位提问者问这位高管,这是否等同于通用人工智能?”

“不,”他回答道。