模型, 找到相关的专题报道信息

2025年AI大模型年终盘点：国产模型崛起，多模态应用成焦点

2025年AI大模型年终盘点：国产模型崛起，多模态应用成焦点还有不到一周就2025年了，各大科技公司纷纷发布年度报告，回顾过去一年的发展成果。作为人工智能领域的年度盛事，对AI大模型的评测结果自然也备受关注...

2024-12-25 19:06:33

评测资讯

智源研究院发布100余个大模型评测结果：中文语言模型趋于饱和，但与国际一流水平仍存差距

智源研究院发布100余个大模型评测结果：中文语言模型趋于饱和，但与国际一流水平仍存差距12月19日，智源研究院发布了对国内外100余个开源和商业闭源大模型的评测结果，涵盖语言、视觉语言、文生图、文生视频及语音语言等多个模态。评测结果显示，在针对一般中文场景的开放式问答或生成任务中，语言模型的能力已趋于饱和稳定...

2024-12-20 15:02:09

评测资讯

2024下半年智源研究院大模型综合评测结果深度解读：百余模型横评，揭示AI发展新趋势

2024下半年智源研究院大模型综合评测结果深度解读：百余模型横评，揭示AI发展新趋势2024年即将结束，大模型领域的竞争依然激烈。智源研究院于2024年12月19日发布了最新的下半年大模型综合评测结果，对100余个国内外开源和闭源的语言、视觉语言、文生图、文生视频、语音语言大模型进行了全面评估...

2024-12-20 14:54:39

评测资讯

商汤日日新SenseNova多模态大模型荣登OpenCompass多模态评测榜首

商汤日日新SenseNova多模态大模型荣登OpenCompass多模态评测榜首刚刚，商汤科技的日日新SenseNova多模态大模型在权威的OpenCompass多模态大模型评测中取得了令人瞩目的成绩——排名第一。这次评测结果标志着商汤在多模态大模型领域取得了突破性进展，其技术实力获得了国际权威机构的认可...

2024-12-19 20:11:15

评测资讯

智源研究院发布2024年下半年大模型综合评测结果：多模态模型领跑，国产文生视频技术领先全球

智源研究院发布2024年下半年大模型综合评测结果：多模态模型领跑，国产文生视频技术领先全球2024年12月19日，智源研究院正式发布了对100余个国内外开源和闭源大模型的综合及专项评测结果。本次评测涵盖语言、视觉语言、文生图、文生视频、语音语言等多种模态，并首次引入金融量化交易场景评估和基于模型辩论的对比评估方式，对大模型的综合能力和应用潜力进行了深入细致的分析...

2024-12-19 18:37:48

评测资讯

中国电信TeleAI-VAST视频大模型“屠榜”VBench，9项子指标夺冠，5项得分超99%

中国电信TeleAI-VAST视频大模型“屠榜”VBench，9项子指标夺冠，5项得分超99%近日，VBench视频生成模型评测权威榜单被一款名为TeleAI-VAST的视频大模型“屠榜”。该模型由中国电信人工智能研究院（TeleAI）自主研发，在16项子指标中取得9项第一的优异成绩，其中5项得分更是超过99%，物体分类和人体动作两项更是斩获满分100%...

2024-12-09 22:00:26

评测资讯

国内首个大模型可信能力评测排行榜发布，阿里巴巴Qwen2-72b、百度Ernie-4.0等上榜

国内首个大模型可信能力评测排行榜发布，阿里巴巴Qwen2-72b、百度Ernie-4.0等上榜近日，“大湾区生成式人工智能安全发展联合实验室”全国首发“大模型可信能力评测排行榜”，阿里巴巴“Qwen2-72b”、百度“Ernie-4.0”等一批知名企业的大模型上榜。此次评测是国内首个对标《人工智能安全治理框架》1.0版的评测体系，旨在为中国及全球AI技术的安全、可靠和可持续发展提供指引...

2024-09-29 22:55:09

评测资讯

OpenAI推出“草莓”模型o1：推理能力强大，但事实性知识仍需改进

OpenAI推出“草莓”模型o1：推理能力强大，但事实性知识仍需改进OpenAI 在没有任何预告的情况下发布了名为 o1 的全新模型，这是其计划中一系列“推理”模型中的第一个版本，也是此前业界盛传已久的“草莓”模型。o1 代表着 OpenAI 朝着类人 AI 的目标迈出了一步，该模型被认为具有如此重要的能力，以至于 OpenAI 决定从当前的 GPT-4 模型重新开始，完全放弃了“GPT”品牌，从 1 开始命名...

2024-09-14 06:54:40

评测资讯

腾讯混元Turbo：万亿参数大模型新突破，国内首个采用分层异构MoE架构

腾讯混元Turbo：万亿参数大模型新突破，国内首个采用分层异构MoE架构腾讯混元大模型家族再添新成员，新一代旗舰大模型混元Turbo技术报告首次曝光。该模型采用全新分层异构的MoE架构，总参数达万亿级别，性能仅次于GPT-4o，位列国内第一梯队...

2024-09-13 01:11:05

评测资讯

多模态大模型的“测评革命”：LMMs-Eval框架横空出世

多模态大模型的“测评革命”：LMMs-Eval框架横空出世随着大模型研究的深入，如何将其推广到更多的模态上已经成为了学术界和产业界的热点。最近发布的闭源大模型如GPT-4o、Claude3.5等都已经具备了超强的图像理解能力，LLaVA-NeXT、MiniCPM、InternVL等开源领域模型也展现出了越来越接近闭源的性能...

2024-08-23 13:11:25

评测资讯

豆包大模型语音识别技术突破：Seed-ASR赋能多场景应用

豆包大模型语音识别技术突破：Seed-ASR赋能多场景应用2024年8月21日，火山引擎AI创新巡展﹒上海站成功举办，活动重点展示了豆包大模型在语音识别领域的最新突破，并发布了对话式AI实时交互解决方案。其中，豆包大模型团队的最新成果Seed-ASR，一款基于大语言模型的自动语音识别（ASR）系统，凭借高精度识别、大容量模型、支持多种语言、上下文感知和分阶段训练方法等技术亮点，在多个场景中展现出显著优势...

2024-08-23 00:40:39

评测资讯