首页 > 评测资讯 列表  > 大模型, 找到相关的专题报道信息
  • 智源研究院发布100余个大模型评测结果:中文语言模型趋于饱和,但与国际一流水平仍存差距

    智源研究院发布100余个大模型评测结果:中文语言模型趋于饱和,但与国际一流水平仍存差距

    智源研究院发布100余个大模型评测结果:中文语言模型趋于饱和,但与国际一流水平仍存差距12月19日,智源研究院发布了对国内外100余个开源和商业闭源大模型的评测结果,涵盖语言、视觉语言、文生图、文生视频及语音语言等多个模态。评测结果显示,在针对一般中文场景的开放式问答或生成任务中,语言模型的能力已趋于饱和稳定...

    2024-12-20 15:02:09
  • 2024下半年智源研究院大模型综合评测结果深度解读:百余模型横评,揭示AI发展新趋势

    2024下半年智源研究院大模型综合评测结果深度解读:百余模型横评,揭示AI发展新趋势

    2024下半年智源研究院大模型综合评测结果深度解读:百余模型横评,揭示AI发展新趋势2024年即将结束,大模型领域的竞争依然激烈。智源研究院于2024年12月19日发布了最新的下半年大模型综合评测结果,对100余个国内外开源和闭源的语言、视觉语言、文生图、文生视频、语音语言大模型进行了全面评估...

    2024-12-20 14:54:39
  • 商汤日日新SenseNova多模态大模型荣登OpenCompass多模态评测榜首

    商汤日日新SenseNova多模态大模型荣登OpenCompass多模态评测榜首

    商汤日日新SenseNova多模态大模型荣登OpenCompass多模态评测榜首刚刚,商汤科技的日日新SenseNova多模态大模型在权威的OpenCompass多模态大模型评测中取得了令人瞩目的成绩——排名第一。这次评测结果标志着商汤在多模态大模型领域取得了突破性进展,其技术实力获得了国际权威机构的认可...

    2024-12-19 20:11:15
  • 智源研究院发布2024年下半年大模型综合评测结果:多模态模型领跑,国产文生视频技术领先全球

    智源研究院发布2024年下半年大模型综合评测结果:多模态模型领跑,国产文生视频技术领先全球

    智源研究院发布2024年下半年大模型综合评测结果:多模态模型领跑,国产文生视频技术领先全球2024年12月19日,智源研究院正式发布了对100余个国内外开源和闭源大模型的综合及专项评测结果。本次评测涵盖语言、视觉语言、文生图、文生视频、语音语言等多种模态,并首次引入金融量化交易场景评估和基于模型辩论的对比评估方式,对大模型的综合能力和应用潜力进行了深入细致的分析...

    2024-12-19 18:37:48
  • 中国电信TeleAI-VAST视频大模型“屠榜”VBench,9项子指标夺冠,5项得分超99%

    中国电信TeleAI-VAST视频大模型“屠榜”VBench,9项子指标夺冠,5项得分超99%

    中国电信TeleAI-VAST视频大模型“屠榜”VBench,9项子指标夺冠,5项得分超99%近日,VBench视频生成模型评测权威榜单被一款名为TeleAI-VAST的视频大模型“屠榜”。该模型由中国电信人工智能研究院(TeleAI)自主研发,在16项子指标中取得9项第一的优异成绩,其中5项得分更是超过99%,物体分类和人体动作两项更是斩获满分100%...

    2024-12-09 22:00:26
  •  国内首个大模型可信能力评测排行榜发布,阿里巴巴Qwen2-72b、百度Ernie-4.0等上榜

    国内首个大模型可信能力评测排行榜发布,阿里巴巴Qwen2-72b、百度Ernie-4.0等上榜

    国内首个大模型可信能力评测排行榜发布,阿里巴巴Qwen2-72b、百度Ernie-4.0等上榜近日,“大湾区生成式人工智能安全发展联合实验室”全国首发“大模型可信能力评测排行榜”,阿里巴巴“Qwen2-72b”、百度“Ernie-4.0”等一批知名企业的大模型上榜。此次评测是国内首个对标《人工智能安全治理框架》1.0版的评测体系,旨在为中国及全球AI技术的安全、可靠和可持续发展提供指引...

    2024-09-29 22:55:09
  •  腾讯混元Turbo:万亿参数大模型新突破,国内首个采用分层异构MoE架构

    腾讯混元Turbo:万亿参数大模型新突破,国内首个采用分层异构MoE架构

    腾讯混元Turbo:万亿参数大模型新突破,国内首个采用分层异构MoE架构腾讯混元大模型家族再添新成员,新一代旗舰大模型混元Turbo技术报告首次曝光。该模型采用全新分层异构的MoE架构,总参数达万亿级别,性能仅次于GPT-4o,位列国内第一梯队...

    2024-09-13 01:11:05
  •  多模态大模型的“测评革命”:LMMs-Eval框架横空出世

    多模态大模型的“测评革命”:LMMs-Eval框架横空出世

    多模态大模型的“测评革命”:LMMs-Eval框架横空出世随着大模型研究的深入,如何将其推广到更多的模态上已经成为了学术界和产业界的热点。最近发布的闭源大模型如GPT-4o、Claude3.5等都已经具备了超强的图像理解能力,LLaVA-NeXT、MiniCPM、InternVL等开源领域模型也展现出了越来越接近闭源的性能...

    2024-08-23 13:11:25
  •  豆包大模型语音识别技术突破:Seed-ASR赋能多场景应用

    豆包大模型语音识别技术突破:Seed-ASR赋能多场景应用

    豆包大模型语音识别技术突破:Seed-ASR赋能多场景应用2024年8月21日,火山引擎AI创新巡展﹒上海站成功举办,活动重点展示了豆包大模型在语音识别领域的最新突破,并发布了对话式AI实时交互解决方案。其中,豆包大模型团队的最新成果Seed-ASR,一款基于大语言模型的自动语音识别(ASR)系统,凭借高精度识别、大容量模型、支持多种语言、上下文感知和分阶段训练方法等技术亮点,在多个场景中展现出显著优势...

    2024-08-23 00:40:39