• 注册
  • 话题贡献者排行

    智创小秘书智创小秘书

    推荐圈子

  • 圈子版务
    圈子版务
    关注我们,获取最新平台动态。
  • 智创聚合API
    智创聚合API
    国内最大的聚合API平台,支持OpenAI、阿里、智谱、360、讯飞、百度等国内外大语言模型。https://s.lconai.com/
  • Midjourney中国社区
    Midjourney中国社区
    Midjourney是一款由Midjourney有限公司开发的数字艺术工具软件,具有生成虚拟世界的强大能力,可根据用户输入的文字或语音在虚拟世界中生成对应场景,使用户能够探索和创造自己的数字艺术作品。
  • Midjourney接口服务
    Midjourney接口服务
    目前接口已经支持码多多AI系统、小狐狸AI系统,如需其它接口请联系微信客服:lonconst
  • 智狐AI-MAX系统
    智狐AI-MAX系统
    智狐AI-MAX系统,企业级AI知识库,可以进行AI对话、AI应用,拥有强大的第三方对接能力。适用企业智能客服、企业智能文档、专家顾问助理等多种企业级商业场景,具有较大的商业使用价值。 如需购买请联系客服微信:lonconst
  • 智狐AI系统售前交流
    智狐AI系统售前交流
    创新型AI对话与绘画系统(非官方) 如需购买请联系微信客服:lonconst
  • 分享

    这个一个神秘的话题,还没有介绍,您可以点击【关注】获取关于此话题的最新信息,也可以点击【发表】共同参与此话题的维护。
    # 准确率分析 # 发表 10浏览 1内容 0关注
  • 全部
  • 推荐
  • 动态
  • 音乐
  • 视频
  • 文章
  • 帖子
  • 付费
  • 查看全文
  • 查看作者
  • 研究:GPT-4 Turbo回答高级历史题准确率仅46%

    人工智能在各领域的迅速发展引发了广泛关注,然而最新研究揭示了AI在处理高级历史问题时的显著局限性。奥地利复杂科学研究所(CSH)的研究团队发现,即使是最先进的大型语言模型(LLMs)在回答高级历史题时也表现不佳,准确率仅为46%。CSH团队开发了名为"Hist-LLM"的基准测试工具,用于评估三大顶尖LLMs——OpenAI的GPT-4、Meta的Llama和谷歌的Gemini——在历史问题上的表现。该工具基于Seshat全球历史数据库,这是一个以古埃及智慧女神命名的庞大历史知识库。研究结果于上...
  • 智创小秘书 智创小秘书
  • 0
  • 0
  • 0
  • 21
  • 01-21 09:20 电脑端
  • 任务
  • 单栏布局 列表样式:矩状 侧栏位置: