位置: 首页 > 新闻 列表  >  评测资讯 >> 评测资讯

商汤日日新SenseNova多模态大模型荣登OpenCompass多模态评测榜首

商汤日日新SenseNova多模态大模型荣登OpenCompass多模态评测榜首刚刚,商汤科技的日日新SenseNova多模态大模型在权威的OpenCompass多模态大模型评测中取得了令人瞩目的成绩——排名第一。这次评测结果标志着商汤在多模态大模型领域取得了突破性进展,其技术实力获得了国际权威机构的认可

商汤日日新SenseNova模态大模型荣登OpenCompass多模态评测榜首

商汤日日新SenseNova多模态大模型荣登OpenCompass多模态评测榜首

刚刚,商汤科技的日日新SenseNova多模态大模型在权威的OpenCompass多模态大模型评测中取得了令人瞩目的成绩——排名第一。这次评测结果标志着商汤在多模态大模型领域取得了突破性进展,其技术实力获得了国际权威机构的认可。OpenCompass评测平台由上海人工智能实验室推出,拥有完整开源可复现的评测框架,其评测结果的公正性和权威性得到了业界的广泛认可。该平台定期发布对各类大模型的评测成绩和排名,涵盖了语言理解、逻辑推理、数学计算、代码能力、智能体、创作与对话等多个方面,能够全面评估大模型的真实能力。

商汤日日新SenseNova多模态大模型荣登OpenCompass多模态评测榜首

在OpenCompass的评测中,商汤日日新SenseNova多模态大模型的平均得分达到了77.4分,显著领先于GPT-4、Claude 3.5、Sonnet以及国内所有其他开源和闭源模型。这一成绩充分展现了商汤日日新在多模态大模型领域的领先地位。尤其值得关注的是,在MathVista数据集上的表现,该数据集涵盖了算术、统计、代数、几何、数值常识、科学和逻辑等多个方面,对模型的数理能力提出了极高的要求。商汤日日新SenseNova在MathVista数据集上获得了78.4分的最高分,其强大的数理能力由此可见一斑。

商汤日日新SenseNova多模态大模型荣登OpenCompass多模态评测榜首

OpenCompass多模态评测包含八个核心数据集,从不同角度客观地量化多模态大模型的能力。商汤日日新SenseNova在几乎所有维度上都达到了或超过了GPT-4的水平,并在MMStar、MathVista、OCRBench、MMVet四个维度上取得了全球第一的排名。这表明商汤日日新SenseNova不仅在数理能力方面表现出色,而且在其他多个方面也展现了强大的竞争力。 其卓越表现不仅体现在对各种类型问题的精准解答,更体现在对复杂问题的深入理解和逻辑推理能力。

商汤日日新SenseNova多模态大模型荣登OpenCompass多模态评测榜首

商汤科技作为计算机视觉领域的先行者和领军企业,早在几年前就已布局多模态大模型的研究。依托其在算法、数据和场景认知方面的积累,商汤科技在多模态大模型研发方面建立了核心竞争优势。2023年4月,商汤率先发布了行业领先的多模态大模型;2024年2月,基于商汤日日新4.0的多模态大模型在MMEBenchmark权威评测基准测试集上位列第一,综合得分达2199.5分,超过了GPT-4V的1926.57分,并已应用于智能驾驶、智能车舱、电力行业等多个场景;2024年7月,商汤发布了国内首个交互体验对标GPT-4的大模型——日日新5.0,实现了无延时的实时流式交互。

商汤日日新SenseNova多模态大模型荣登OpenCompass多模态评测榜首

今年三季度以来,商汤在多模态大模型研发方面进入了一个新的阶段——跨模态深度融合。这一阶段的核心目标是打破不同模态(自然语言、代码、语音、图像、医疗影像、视频等)之间的壁垒,充分利用不同模态的信息,通过跨模态逆渲染、多模态思维链等技术创新,实现数据之间的集成和交互。通过这种深度融合,模型的感知和理解能力将得到显著增强,并支持多模态融合推理的实现。

商汤日日新SenseNova多模态大模型荣登OpenCompass多模态评测榜首

商汤日日新SenseNova多模态大模型正是这一研发理念的结晶。通过融合预训练和后训练技术,该模型大幅增强了数理逻辑和推理能力。在实际测试中,该模型能够轻松解答“五年高考,三年模拟”中的高考数学题,并给出详细的解题步骤。 不仅如此,模型还能够准确解答物理题,并对统计图表和多模态文档展现了极强的理解能力。 例如,在测试中,当给定一个包含财务数据的表格,并要求计算特定年份的每股FCFE(自由现金流权益)时,商汤日日新SenseNova能够准确地进行计算并给出详细的推理步骤。 这表明该模型不仅能够进行简单的计算,更能够理解数据背后的逻辑关系,并进行复杂的推理。

商汤日日新SenseNova多模态大模型荣登OpenCompass多模态评测榜首

多模态融合技术的提升显著增强了AI大模型的性能,其应用前景也十分广阔。未来,多模态融合技术将在在线教育、语音客服、自动驾驶等领域得到广泛应用。例如,在线上教育领域,可以结合语音和自然语言,提升教学互动体验;在自动驾驶领域,可以融合视觉和其他多种模态数据,提升感知精度和决策能力。

商汤日日新SenseNova多模态大模型荣登OpenCompass多模态评测榜首

数理能力只是商汤日日新SenseNova多模态大模型能力的冰山一角。目前,日日新SenseNova多模态大模型已可以通过API调用,并将很快开放给普通用户体验。 这意味着,未来更多用户将能够体验到商汤科技在多模态大模型领域取得的最新成果,并将其应用于各种实际场景中,推动人工智能技术的进一步发展和应用。 商汤日日新SenseNova多模态大模型的成功,不仅彰显了商汤科技的强大技术实力,也为多模态大模型的未来发展指明了方向。 其在OpenCompass评测中的优异表现,无疑将进一步巩固商汤科技在人工智能领域的领先地位,并为推动中国人工智能技术发展贡献重要力量。 我们有理由相信,随着技术的不断进步,多模态大模型将在更多领域发挥重要作用,为人们的生活带来更多的便利和改变。