奇米影视盒 OpenAI 再成“榜一老迈”：o1-preview AI 模子独霸数学等任务

发布日期：2024-09-21 20:38 点击次数：84

IT 之家 9 月 20 日音讯，科技媒体 The Decoder 昨日（9 月 19 日）发布博文奇米影视盒，报谈称在聊天机器东谈主竞技场（Chatbot Arena）上，OpenAI 的新东谈主工智能模子 o1-preview 和 o1-mini 问鼎榜首。

聊天机器东谈主竞技场简介

聊天机器东谈主竞技场是一个相比东谈主工智能模子的平台，它愚弄 6000 多个社区评分对新的 OpenAI 系统进行了评估。

遵守

遵守闪现奇米影视盒，o1-preview 和 o1-mini 尤其在数学任务、复杂领导和编程方面推崇出色。

Lmsys 提供的数学模子上风图表了了地闪现，o1-preview 和 o1-mini 的得分跳跃 1360 分，远高于其他模子的推崇。IT 之家附上相干截图如下：

O1 的指标是为东谈主工智能推理设定一个通用新圭表，即在请问前"想考" " 更长技艺。

但是，O1 模子并非在所有方面齐优于 GPT-4o。很多任务并不需要复杂的逻辑推理，无意 GPT-4o 的反映更快。

能劳动项

o1-preview 和 o1-mini 的票数远低于 GPT-4o 或 Anthropic's Claude 3.5 等锻真金不怕火模子奇米影视盒，每个模子齐独一不到 3000 条驳倒，这么小的样本量可能无法准确代表实质遵守，圆寂遵守的意旨。

色五月