智源研究院发布2024年下半年大模型综合评测结果:多模态模型领跑,国产文生视频技术领先全球2024年12月19日,智源研究院正式发布了对100余个国内外开源和闭源大模型的综合及专项评测结果。本次评测涵盖语言、视觉语言、文生图、文生视频、语音语言等多种模态,并首次引入金融量化交易场景评估和基于模型辩论的对比评估方式,对大模型的综合能力和应用潜力进行了深入细致的分析...
广西消委会发布超声雾化器比较试验结果:四款样品雾粒直径分布不达标天气转凉,呼吸道疾病高发,雾化治疗成为许多家庭的常用方法。为帮助消费者选择合适的超声雾化器,广西消费者权益保护委员会于12月4日发布了超声雾化器商品比较试验结果...
国内首个大模型可信能力评测排行榜发布,阿里巴巴Qwen2-72b、百度Ernie-4.0等上榜近日,“大湾区生成式人工智能安全发展联合实验室”全国首发“大模型可信能力评测排行榜”,阿里巴巴“Qwen2-72b”、百度“Ernie-4.0”等一批知名企业的大模型上榜。此次评测是国内首个对标《人工智能安全治理框架》1.0版的评测体系,旨在为中国及全球AI技术的安全、可靠和可持续发展提供指引...