首页 > 评测资讯 列表  > 基准, 找到相关的专题报道信息
  •  GTA:评估通用工具智能体的全新基准

    GTA:评估通用工具智能体的全新基准

    GTA:评估通用工具智能体的全新基准本文介绍了 GTA,一个用于评估通用工具智能体的全新基准,由来自上海交通大学与上海人工智能实验室的研究团队提出。GTA 的设计旨在于解决现有工具评测的局限性,例如评估问题形式固定、逻辑链简单、输入模态单一以及缺乏真实可执行的工具等,通过设计真实世界场景的用户问题、真实部署的工具和多模态输入,建立了一个全面、细粒度的评估框架...

    2024-11-05 17:23:21
  • 跨环境智能体基准CRAB引领下一代机器人流程自动化新篇章

    跨环境智能体基准CRAB引领下一代机器人流程自动化新篇章

    跨环境智能体基准CRAB引领下一代机器人流程自动化新篇章在AI技术蓬勃发展的当下,智能体作为一种新兴的研究方向,已经成为了行业内的热门话题。随着研究的深入和实验的拓展,我们今天介绍了一种全新的跨环境多智能体评估基准CRAB...

    2024-08-14 16:52:52