就在之前,OpenAI 一直有消息说将推出一款代号为“Strawberry”的 AI 模型,就在昨天,OpenAI 发布了全新的 o1 系列模型。
o1 系列模型是首款拥有推理能力的 AI 模型,o1 模型分为两个版本 o1-preview 以及 o1-mini,其中 ChatGPT Plus 和 Team 用户已经可以在 ChatGPT 中使用这两款推理模型,但是目前每周可发送消息的次数为 o1-preview 30条 o1-mini 50条。
来源:OpenAI
ChatGPT Enterprise 和 Edu 用户也将于下周开始可以使用这两款模型,当然免费用户也将计划可以获得 o1-mini 模型的访问权。当然开发人员也可以调用相关模型的 API 但是价格非常的贵,o1-preview 每 100 万个输入令牌或模型解析的文本块收费 15 美元,每 100 万个输出令牌收费 60 美元。
OpenAI 表示,在训练 o1 模型的时候与之前的训练方式有所不同,使用了全新的优化算法和量身定制的新训练数据进行训练。让 AI 模型有更长的时间进行思考,然后才做出反应,通过训练完善自己的思维过程。
来源:OpenAI
在 OpenAI 公司的测试中,o1 模型在物理、化学和生物的基准测试任务中表现与博士生相似,在 IMO(国际数学奥林匹克)资格考试中 o1 模型得分 83%,而之前发布的 GPT-4o 仅解决了 13% 的问题,在 Codeforces 在线编程竞赛中成绩也达到了 89 百分位。
在安全性方面,o1 模型也得到了很大的提升,在训练模型的时候 OpenAI 提出了新的安全训练方法,利用 o1 模型的推理能力让它们遵守安全和协调准则。在严格的越狱测试之一中 o1-preview 的得分达到了 84 分(百分制),而 GPT-4o 仅有 22 分。
OpenAI 对 o1 模型也进行了演示,他们要求模型解决一些问题,通过回答感觉它在模仿人类的思维。OpenAI 表示不认为人工智能模型思维等同于人类思维,这种表达的目的在于展示模型如何花费更多的时间去处理问题并深入解决问题。
其中 o1-mini 模型是一种速度更快、成本更低的推理模型,在编码方面尤其有效。作为一款较小的模型,o1-mini 比 o1-preview 便宜 80%,使其成为一款功能强大、经济高效的模型,适用于需要推理但不需要广泛世界知识的应用程序。
o1 系列模型是 OpenAI 推出的首款具有推理能力的 AI 模型,除了这款模型之外,OpenAI 还表示将计划开发和推出更多的模型。
本文编辑:@ 小小辉
©本文著作权归电手所有,未经电手许可,不得转载使用。