昨日,OpenAI发布了其最新的经济实惠的小型模型——GPT-4o mini,它比标准的GPT-4o 模型资源消耗更少且运营成本更低,使开发人员能够将人工智能技术集成到更广泛的产品中。
这对于开发者和应用程序来说是一次重大升级,但它也扩展了功能,并减少了ChatGPT免费版本的限制。
从今天开始,GPT-4o mini 现在通过 ChatGPT 网络和应用程序向免费、Plus 和 Team 层级的用户和开发者提供,而 ChatGPT Enterprise 订阅用户将在下周获得访问权限。
从今天开始,GPT-4o mini 将取代该公司现有的小型模型 GPT-3.5 Turbo 供最终用户使用。
如果开发者还不想切换到 4o mini,仍可通过 API 使用旧型号。该公司表示最终会淘汰旧型号,但尚未确定日期。
GPT-4o 自 5 月以来已向免费的 ChatGPT 账户提供,但在需求方面存在限制。
根据更新的常见问题页面,GPT-4o 本身仍然存在这些限制,但当达到限制时,您现在将降级为 GPT-4o mini 而不是 GPT-3.5。
理论上,对于那些尚未升级到ChatGPT Plus的用户来说,这是一个重大胜利。
根据人工分析的数据,OpenAI 的最新人工智能模型在 MMLU 推理基准测试中得分 82%,比 Gemini 1.5 Flash 高出 3%,比 Claude 3 Haiku 高出 7%。作为参考,迄今为止 MMLU 基准测试的最高分是由谷歌的顶级人工智能 Gemini Ultra 创下的,得分为 90%。
此外,OpenAI 声称 GPT-4o mini 的运营成本比 GPT-3.5 Turbo 低 60%。开发人员将为每百万输入令牌支付 15 美分,为每百万输出令牌支付 60 美分。
据报道,OpenAI 表示 GPT-4o mini 是“当今可用的最有能力和最具成本效益的小型模型”。
这些成本节约从何而来?嗯,并非每一项可由人工智能增强的任务都需要像GPT、Claude或Gemini这样的全尺寸模型的全部权重和能力。
就像用大锤打苍蝇一样,将标准尺寸的大型语言模型用于简单但数量众多的任务是过度的,既浪费金钱又浪费计算资源——这就是诸如谷歌的 Gemini 1.5 Flash、Meta 的 Llama 3 8b 或 Anthropic 的 Claude 3 Haiku 等小型语言模型发挥作用的地方。
它们能够比大型迭代模型更快、更具成本效益地执行这些简单、重复的任务。
据 OpenAI 称,GPT-4o mini 将具有与全尺寸版本相同大小的上下文窗口,即 128,000 个标记(大致相当于一本书的内容量),知识截止日期也相同,为 2023 年 10 月,不过该公司并未具体说明新模型的确切规模。
该模型的 API 目前仅提供文本和视觉功能,但视频和音频功能未来也将推出。
该公告发布于 OpenAI 对其备受期待的 高级语音模式 进行了长时间等待后的更新之后仅几周。
该公司的更新表明,较小规模的 alpha 版本仍将于 7 月底推出,更广泛的推广将在今年秋季进行。
- OpenAI 发布了其期待已久的“草莓”模型 09-19
- ChatGPT语音模式数到100有严重问题 08-08
- 专家称,人工智能泡沫正在破裂 08-08
- 英伟达被发现窃取数量惊人的YouTube视频来训练人工智能 08-08
- OpenAI拥有以99.9%的准确率检测AI写作的软件,但拒绝发布 08-08
- 科技股暴跌是否与人工智能泡沫破灭有关? 08-08
- 随着市场暴跌,人工智能行业可能陷入巨大困境 08-08
- 微软在人工智能上损失了惊人的资金 08-08