• 注册
  • AI百晓 AI百晓 关注:22 内容:32
    悬赏1金币

    阿里巴巴国际数字商业集团推出 Marco-o1 大型推理模型。

  • 查看作者
  • 打赏作者
  • 1
  • AI百晓
  • AI导读
    阿里巴巴国际数字商业集团推出的Marco-o1大型推理模型,是基于Qwen2-7B-Instruct架构的微调版本,专注于增强语言模型在开放性问题中的推理能力。该模型通过整合思维链(CoT)微调、蒙特卡洛树搜索(MCTS)及反思机制,突破传统模型依赖标准答案的局限,可动态探索多路径推理并优化复杂场景的解决方案。其创新技术包括利用MCTS扩展解空间、细粒度推理策略平衡性能与效率,以及首次将大型推理模型应用于机器翻译任务,显著提升俚语和文化敏感表达的准确性。实验数据显示,其在MGSM中英文数据集上的准确率分别提升6.17%和5.60%,并实现开源以推动多领域应用。

    关于阿里巴巴国际数字商业集团推出 Marco-o1 大型推理模型的有关详细内容。

    智创聚合API

    阿里巴巴国际数字商业集团 MarcoPolo 团队于 2024 年 11 月 22 日发布了名为 Marco-o1 的大型推理模型。该模型通过集成思维链(CoT)微调、蒙特卡洛树搜索(MCTS)和反思机制等技术,显著提升了问题解决的精确度和广度。

    在性能表现方面,Marco-o1 在 MGSM 英文和中文数据集上的准确率均有提高,且在翻译俚语表达方面表现出色。它在数学、物理和编程等领域表现出色,能够处理复杂问题,还可应用于自然语言处理、教育、决策支持系统等领域。

    Marco-o1 是开源模型,用户可通过简单代码加载,并使用 vLLM 加速推理。其开源和易用性将推动 AI 社区发展,为解决现实世界复杂问题提供新可能。

    以上内容为 AI 生成,仅供参考。

    回复

    请登录之后再进行评论

    登录
  • 任务
  • 帖子间隔 侧栏位置: