国内首个大模型可信能力评测排行榜发布,阿里巴巴Qwen2-72b、百度Ernie-4.0等上榜近日,“大湾区生成式人工智能安全发展联合实验室”全国首发“大模型可信能力评测排行榜”,阿里巴巴“Qwen2-72b”、百度“Ernie-4.0”等一批知名企业的大模型上榜。此次评测是国内首个对标《人工智能安全治理框架》1.0版的评测体系,旨在为中国及全球AI技术的安全、可靠和可持续发展提供指引...
OpenAI推出“草莓”模型o1:推理能力强大,但事实性知识仍需改进OpenAI 在没有任何预告的情况下发布了名为 o1 的全新模型,这是其计划中一系列“推理”模型中的第一个版本,也是此前业界盛传已久的“草莓”模型。o1 代表着 OpenAI 朝着类人 AI 的目标迈出了一步,该模型被认为具有如此重要的能力,以至于 OpenAI 决定从当前的 GPT-4 模型重新开始,完全放弃了“GPT”品牌,从 1 开始命名...
腾讯混元Turbo:万亿参数大模型新突破,国内首个采用分层异构MoE架构腾讯混元大模型家族再添新成员,新一代旗舰大模型混元Turbo技术报告首次曝光。该模型采用全新分层异构的MoE架构,总参数达万亿级别,性能仅次于GPT-4o,位列国内第一梯队...
多模态大模型的“测评革命”:LMMs-Eval框架横空出世随着大模型研究的深入,如何将其推广到更多的模态上已经成为了学术界和产业界的热点。最近发布的闭源大模型如GPT-4o、Claude3.5等都已经具备了超强的图像理解能力,LLaVA-NeXT、MiniCPM、InternVL等开源领域模型也展现出了越来越接近闭源的性能...
豆包大模型语音识别技术突破:Seed-ASR赋能多场景应用2024年8月21日,火山引擎AI创新巡展﹒上海站成功举办,活动重点展示了豆包大模型在语音识别领域的最新突破,并发布了对话式AI实时交互解决方案。其中,豆包大模型团队的最新成果Seed-ASR,一款基于大语言模型的自动语音识别(ASR)系统,凭借高精度识别、大容量模型、支持多种语言、上下文感知和分阶段训练方法等技术亮点,在多个场景中展现出显著优势...