昨日,OpenAI发布了其最新的经济实惠的小型模型——GPT-4o mini,它比标准的GPT-4o 模型资源消耗更少且运营成本更低,使开发人员能够将人工智能技术集成到更广泛的产品中。
这对于开发者和应用程序来说是一次重大升级,但它也扩展了功能,并减少了ChatGPT免费版本的限制。
从今天开始,GPT-4o mini 现在通过 ChatGPT 网络和应用程序向免费、Plus 和 Team 层级的用户和开发者提供,而 ChatGPT Enterprise 订阅用户将在下周获得访问权限。
从今天开始,GPT-4o mini 将取代该公司现有的小型模型 GPT-3.5 Turbo 供最终用户使用。
如果开发者还不想切换到 4o mini,仍可通过 API 使用旧型号。该公司表示最终会淘汰旧型号,但尚未确定日期。
GPT-4o 自 5 月以来已向免费的 ChatGPT 账户提供,但在需求方面存在限制。
根据更新的常见问题页面,GPT-4o 本身仍然存在这些限制,但当达到限制时,您现在将降级为 GPT-4o mini 而不是 GPT-3.5。
理论上,对于那些尚未升级到ChatGPT Plus的用户来说,这是一个重大胜利。
根据人工分析的数据,OpenAI 的最新人工智能模型在 MMLU 推理基准测试中得分 82%,比 Gemini 1.5 Flash 高出 3%,比 Claude 3 Haiku 高出 7%。作为参考,迄今为止 MMLU 基准测试的最高分是由谷歌的顶级人工智能 Gemini Ultra 创下的,得分为 90%。
此外,OpenAI 声称 GPT-4o mini 的运营成本比 GPT-3.5 Turbo 低 60%。开发人员将为每百万输入令牌支付 15 美分,为每百万输出令牌支付 60 美分。
据报道,OpenAI 表示 GPT-4o mini 是“当今可用的最有能力和最具成本效益的小型模型”。
这些成本节约从何而来?嗯,并非每一项可由人工智能增强的任务都需要像GPT、Claude或Gemini这样的全尺寸模型的全部权重和能力。
就像用大锤打苍蝇一样,将标准尺寸的大型语言模型用于简单但数量众多的任务是过度的,既浪费金钱又浪费计算资源——这就是诸如谷歌的 Gemini 1.5 Flash、Meta 的 Llama 3 8b 或 Anthropic 的 Claude 3 Haiku 等小型语言模型发挥作用的地方。
它们能够比大型迭代模型更快、更具成本效益地执行这些简单、重复的任务。
据 OpenAI 称,GPT-4o mini 将具有与全尺寸版本相同大小的上下文窗口,即 128,000 个标记(大致相当于一本书的内容量),知识截止日期也相同,为 2023 年 10 月,不过该公司并未具体说明新模型的确切规模。
该模型的 API 目前仅提供文本和视觉功能,但视频和音频功能未来也将推出。
该公告发布于 OpenAI 对其备受期待的 高级语音模式 进行了长时间等待后的更新之后仅几周。
该公司的更新表明,较小规模的 alpha 版本仍将于 7 月底推出,更广泛的推广将在今年秋季进行。
- 微软为企业推出人工智能驱动的员工 10-25
- 电动汽车发展:增长趋势下的挑战与机遇 10-25
- 如果像谷歌这样的大型科技公司被迫拆分,你的网络世界会如何改变? 10-25
- 男子花费 200 万美元找到新的最大质数 10-25
- 随着危机加深,波音公司将裁员17,000人 10-18
- 可穿戴传感器实时监测工厂工人疲劳程度 10-18
- 一个人形机器人的绘画名为“AI God”,售价可能超过12万美元 10-18
- 卡西欧 Moflin:新奇机器人宠物,未来能否如菲比娃娃般风靡? 10-18