价格骤降96%~97%！OpenAI“杀入”小模型

日期：07-24

每经记者蔡鼎每经编辑兰素英

当地时间7月18日，OpenAI正式推出新一代入门级别人工智能模型“GPT-4omini”，称这款新模型是“功能最强、性价比最高的小参数模型”，旨在服务更广泛的客户群体。这也意味着开发人员如今有了一种轻量级且廉价的工具，让他们能够以更低的成本构建AI应用程序。

外媒报道中称，目前，GPT-4omini模型的应用程序编程接口支持文本和视觉，未来将支持文本、图像、视频和音频的输入和输出。

更重要的是，最新的GPT-4omini比GPT-4o便宜了96%~97%，比起GPT-3.5Turbo也要便宜60%~70%。正因如此，随着GPT-4omini上架，GPT-3.5Turbo的历史使命到此结束。OpenAI还表示，GPT-4omini是首个使用其全新安全策略“指令层级”的AI模型。

对于为何未能更早推出“小而精”的AI模型，OpenAI的API产品负责人OlivierGodement表示，这纯粹是优先级的问题，随着时间的推移，OpenAI注意到开发人员越来越渴望使用较小的模型，这也让公司决定投入资源开发GPT-4omini。

同级别价位最低

据OpenAI，GPT-4omini的API价格将会是15美分/100万Tokens输入，以及60美分/100万Tokens输出。上下文窗口依然是12.8万个Tokens，知识截至日期为2023年10月。公司拒绝透露新模型的参数量大小，仅表示与市面上类似的AI小模型处于同一个级别。

作为对比，GPT-4o的百万Tokens输入和输出价格分别是5美元和15美元，之前的入门款模型GPT-3.5Turbo定价分别是0.5美元和1.5美元。这就是说，最新的“迷你模型”的价格比GPT-4o便宜了96%~97%，比起GPT-3.5Turbo也要便宜60%~70%。正因如此，随着GPT-4omini上架，GPT-3.5Turbo的历史使命到此结束。

根据ArtificialAnalysis的统计，GPT-4omini已经达到美国AI公司主流“小模型”里面价格最低的位置，比起Anthropic、谷歌的同类型竞品都要便宜一截。

OpenAI称，最新的GPT-4omini从18日起向ChatGPT的免费用户以及ChatGPTPlus和ChatGPTTeam的订阅用户开放，并将在其后一周向ChatGPTEnterprise用户开放。GPT-4omini将取代ChatGPT中的旧模型GPT-3.5Turbo。

OpenAI表示，GPT-4omini目前在聊天偏好上的表现优于GPT-4，在大规模多任务语言理解测试（MMLU）中的得分为82%。MMLU是一个文本智能和推理基准，用于评估语言模型的能力。MMLU分数越高，越能表明该模型可以更好地理解和使用各种领域的语言，从而增强现实世界的应用。

而在这项测试中，同为小参数模型的谷歌GeminiFlash得分为77.9%，ClaudeHaiku得分为73.8%。在更大参数的模型中，GPT-3.5在这项测试中的得分为70%，GPT-4o得分为88.7%，谷歌GeminiUltra据称取得了有史以来最高分（90%）。

值得注意的是，研究人员对像MMLU这样的基准测试持谨慎态度，因为不同公司的管理方式略有不同，因此不同模型的得分难以比较。还有一个问题是，模型的数据库中可能有这些答案，也就是说可以作弊，而且通常没有第三方评估人员参与这个过程。

入局小模型的背后

外媒报道中称，GPT-4omini的推出也是OpenAI推动“多模态”（multimodality）技术发展努力的一部分，多模态指的是在一个大模型中提供多种类型的AI生成媒体，如文本、图像、音频和视频。

不仅如此，这一全新小模型也承载着帮助OpenAI走入更广泛的客户群体的期望。OpenAI在今年早些时候的最新一轮融资过后，估值已经超过800亿美元。虽然是全球生成式AI领域估值最高的“独角兽”，但OpenAI仍面临压力：一方面要保持其在生成式AI市场的领先地位；另一方面，由于其在AI基础设施上投入了大量资金以构建和训练模型，因此还要想方设法盈利。

GPT-4omini为开发人员提供一种轻量级且廉价的工具，让他们能够开发出所有的应用程序和工具。相对而言，GPT-4这种更大、更昂贵的模型是他们无法负担得起的。此前，许多开发人员选择转向Claude3Haiku或Gemini1.5Flash。

而且，GPT-4omini是首个使用OpenAI全新安全策略“指令层级”的AI模型。这种方法的目的是使AI系统优先处理某些指令——例如来自公司的指令。

OpenAI的API产品负责人OlivierGodement在接受媒体采访时解释了为何该公司未能更早推出“小而精”的AI模型，他说，这纯粹是优先级的问题，因为OpenAI专注于创建更大、更好的模型，如GPT-4，这需要大量的人力和计算资源。随着时间的推移，OpenAI注意到开发人员越来越渴望使用较小的模型，因此公司认为现在是投入资源开发GPT-4omini的时机。

“我们的使命是使用最前沿技术、构建最强大、最有用的应用程序，我们当然希望继续做前沿模型，推动技术进步。”OpenAI的API产品负责人OlivierGodement在接受媒体采访时说：“但我们也希望拥有最好的小模型，我认为它会非常受欢迎。”

“我认为GPT-4omini真正体现了OpenAI让AI更加普及的使命。如果我们希望AI惠及世界的每一个角落，每一个行业，每一个应用，我们必须让AI更加实惠。”Godement说道。

目前，金融科技初创公司Ramp已经使用GPT-4omini构建了一个工具，可以提取收据上的费用数据。用户无须费力地浏览文本框，只需上传一张收据的图片，该模型就会进行分类。

电子邮件客户端Superhuman也对GPT-4omini进行了测试，并用它创建了一个自动建议邮件回复的功能。

责任编辑：刘德宾

硅谷公司SF Compute发力“共享算力”，阿尔特曼亲弟弟领投美国特勤局副局长罗纳德·罗威被任命为代理局长

价格骤降96%~97%！OpenAI“杀入”小模型

扎克伯格押注 AI：Meta 正推动美国政府使用其 Llama 模型

中国煤炭科工研制矿山企业安全生产智慧监管系统

荣耀Magic7系列体验 AI能力再进化

A股开盘：三大指数集体低开，沪指跌0.39%，智谱AI概念持续活跃

韩国设立国家AI研究实验室以促进产学研合作及参与全球联合研发项目

价格骤降96%~97%！OpenAI“杀入”小模型

扎克伯格押注 AI：Meta 正推动美国政府使用其 Llama 模型

中国煤炭科工研制矿山企业安全生产智慧监管系统

荣耀Magic7系列体验 AI能力再进化

A股开盘：三大指数集体低开，沪指跌0.39%，智谱AI概念持续活跃

韩国设立国家AI研究实验室 以促进产学研合作及参与全球联合研发项目

韩国设立国家AI研究实验室以促进产学研合作及参与全球联合研发项目