小米开源首个原生端到端语音大模型
2025-12-18 16:55:56
Source:
XM外汇官网讯——
【小米开源首个原生端到端语音模型】
9月19日,小米小米推出了其首个原生端到端语音模型——Xiaomi-MiMo-Audio。开源该模型基于创新的原生音预训练架构和超过亿小时的训练数据,实现了在语音领域的端到端语少样本泛化,并展现出显著的模型“涌现”行为。根据介绍,小米MiMo-Audio在通用语音理解和对话等多个标准评测基准上表现出色,开源性能远超同等参数的原生音开源模型,达到了7B的端到端语最佳表现;在音频理解基准MMAU的标准测试集上,其表现超过了Google的模型闭源模型Gemini-2.5-Flash;在面向复杂音频推理的基准Big Bench Audio S2T任务中,MiMo-Audio同样优于OpenAI的小米闭源语音模型GPT-4o-Audio-Preview。
开源相关阅读
-
指引保守致DocuSign(DOCU.US)遭华尔街下调目标价
-
亚马逊(AMZN.US)关闭“Prime受邀用户”免运费计划,推动付费会员转化
-
海关总署统计分析司司长吕大良:在今年前八个月,我国的进出口增速较上半年提升了0.6个百分点。8月份的出口和进口均实现增长,连续三个月双双上升。在复杂的外部环境中,我国的外贸展现出强大的韧性和活力。(央视新闻)
-
在2025年的大部分时期,市场普遍预计澳洲联储(RBA)的官方现金利率将逐步下降。随着通胀回落至RBA设定的2%-3%目标区间,借贷成本预计将降低。然而,最新公布的强劲经济数据打破了这一预期。
-
美国消费者正在“节省开支”!达乐(DG.US)上调财年利润指引,业绩超预期
-
美元/日元走强,日本政坛变动与政策延迟预期压制日元