昨日,OpenAI发布了其最新的经济实惠的小型模型——GPT-4o mini,它比标准的GPT-4o 模型资源消耗更少且运营成本更低,使开发人员能够将人工智能技术集成到更广泛的产品中。
这对于开发者和应用程序来说是一次重大升级,但它也扩展了功能,并减少了ChatGPT免费版本的限制。
从今天开始,GPT-4o mini 现在通过 ChatGPT 网络和应用程序向免费、Plus 和 Team 层级的用户和开发者提供,而 ChatGPT Enterprise 订阅用户将在下周获得访问权限。
从今天开始,GPT-4o mini 将取代该公司现有的小型模型 GPT-3.5 Turbo 供最终用户使用。
如果开发者还不想切换到 4o mini,仍可通过 API 使用旧型号。该公司表示最终会淘汰旧型号,但尚未确定日期。
GPT-4o 自 5 月以来已向免费的 ChatGPT 账户提供,但在需求方面存在限制。
根据更新的常见问题页面,GPT-4o 本身仍然存在这些限制,但当达到限制时,您现在将降级为 GPT-4o mini 而不是 GPT-3.5。
理论上,对于那些尚未升级到ChatGPT Plus的用户来说,这是一个重大胜利。
根据人工分析的数据,OpenAI 的最新人工智能模型在 MMLU 推理基准测试中得分 82%,比 Gemini 1.5 Flash 高出 3%,比 Claude 3 Haiku 高出 7%。作为参考,迄今为止 MMLU 基准测试的最高分是由谷歌的顶级人工智能 Gemini Ultra 创下的,得分为 90%。
此外,OpenAI 声称 GPT-4o mini 的运营成本比 GPT-3.5 Turbo 低 60%。开发人员将为每百万输入令牌支付 15 美分,为每百万输出令牌支付 60 美分。
据报道,OpenAI 表示 GPT-4o mini 是“当今可用的最有能力和最具成本效益的小型模型”。
这些成本节约从何而来?嗯,并非每一项可由人工智能增强的任务都需要像GPT、Claude或Gemini这样的全尺寸模型的全部权重和能力。
就像用大锤打苍蝇一样,将标准尺寸的大型语言模型用于简单但数量众多的任务是过度的,既浪费金钱又浪费计算资源——这就是诸如谷歌的 Gemini 1.5 Flash、Meta 的 Llama 3 8b 或 Anthropic 的 Claude 3 Haiku 等小型语言模型发挥作用的地方。
它们能够比大型迭代模型更快、更具成本效益地执行这些简单、重复的任务。
据 OpenAI 称,GPT-4o mini 将具有与全尺寸版本相同大小的上下文窗口,即 128,000 个标记(大致相当于一本书的内容量),知识截止日期也相同,为 2023 年 10 月,不过该公司并未具体说明新模型的确切规模。
该模型的 API 目前仅提供文本和视觉功能,但视频和音频功能未来也将推出。
该公告发布于 OpenAI 对其备受期待的 高级语音模式 进行了长时间等待后的更新之后仅几周。
该公司的更新表明,较小规模的 alpha 版本仍将于 7 月底推出,更广泛的推广将在今年秋季进行。
- OpenAI 推出语音模型全家桶 03-22
- 目前国际上有哪些好用的AI代码编辑器? 03-20
- 教育部部署加强中小学人工智能教育 12-09
- 比特币的价格已突破10万美元 12-07
- 美国当选总统唐纳德·特朗普提名前参议员戴维·珀杜出任美国驻华大使 12-06
- 恭喜中国春节申遗成功 12-05
- Sam Altman表示,明年他最兴奋的事情是实现AGI 11-12
- 借助 AI 之力:不懂编程也能制作游戏 11-12