OpenAI于2024年12月21日发布o3模型性能超牛但暂不对普通用户开放

AI导读

OpenAI于2024年12月21日正式发布o3模型，该模型在数学、编程及科学推理领域表现卓越，多项指标超越人类专家水平。测试数据显示，o3在SweepBench基准中准确率达71.7%，较前代提升20%，并在AIEM 2024数学竞赛中接近满分，首次展现AI博士级科学考试解题能力。尽管其部分性能接近通用人工智能（AGI），但暂不向普通用户开放，计划于2025年1月先推出精简版o3-mini，经外部安全测试后再发布完整版本。此次发布标志着OpenAI技术研发进入新阶段，但商业化落地仍需等待安全验证。

以下是关于OpenAI的o3模型的最新内容：

发布情况：OpenAI在2024年12月21日正式发布了o3模型，它是12天发布狂欢的最后一天推出的，标志着这一系列发布活动的结束。
模型特点：
- 在多个基准测试中超越了人类专家水平，尤其在数学、编程和科学推理领域表现突出。能够解决极其复杂的数学问题，在某些条件下接近通用人工智能（AGI）。
- 在编码竞赛平台Codeforces上的得分显著高于其前代模型o1，展现出强大的编程能力。
版本信息：计划在2025年1月底推出o3的精简版o3-mini，随后会发布完整版。
性能与突破：
- 在SweepBench Verified基准测试中达到了约71.7%的准确率，比o1高出20%。
- 在数学竞赛AIEM 2024中接近满分，这是AI首次达到如此高的水平，在博士级科学考试GPQA Diamond中也有显著表现。
市场与用户：目前o3系列模型不会向普通用户开放，OpenAI计划先进行外部安全测试，预计正式发布时间为明年1月（即2025年1月）。