首页 新闻 教育 校园 育儿 产业 商业 互联网 财经 科技 旅游 汽车 女性 生活

讯飞星火X1.5技术全面升级:人工智能国家队以全国产算力攻克核心技术高地

2025-12-14 10:44   来源: 互联网

11月6日,第八届世界声博会暨2025科大讯飞全球1024开发者节在合肥举行。科大讯飞发布深度推理大模型讯飞星火X1.5,宣布在全国产算力训练、原创模型架构、多模态交互等核心技术领域实现重大突破,彰显了人工智能国家队攻坚克难的创新实力。

攻克两座技术大山,全国产算力训练效率大幅跃升

自主可控是大模型竞争的“压舱石”。作为依托认知智能全国重点实验室、语音及语言信息处理国家工程研究中心等国家级平台的科技企业,科大讯飞在全国产算力平台上持续攻坚。

本次发布会宣布两大技术突破:一是攻克长思维链强化学习训练效率瓶颈,深度推理训练效率从30%提升至84%以上;二是攻克MoE模型全链路训练效率难题,实现大幅跃升。这意味着中国大模型在全国产化道路上不仅“能跑”,更“跑得快、跑得稳”。

讯飞星火X1.5采用MoE架构,推理效率相比上一代提升100%。在模型参数小一倍的情况下,其语言理解、文本生成、知识问答、逻辑推理、数学能力、代码能力等六大核心能力已对标国际主流水平,数学能力持续保持领先。

科大讯飞董事长刘庆峰强调:“在硬科技输不起的人工智能时代,我们要给中国的国家战略托底。”在国内主流大模型中,讯飞星火始终是唯一基于全国产算力训练的通用大模型。

全球首发非自回归语音大模型,推理成本下降

原创技术突破是大模型国家队的核心使命。发布会上,科大讯飞全球首发非自回归语音大模型架构,实现推理效率的历史性阶跃。

与传统“自回归”模型逐字顺序生成文本不同,非自回归架构能够并行、一次性输出整个文本序列,效果相对提升16%,推理成本下降。该技术已率先应用于讯飞输入法15.0版本,为用户带来更流畅的语音输入体验。

作为国家新一代人工智能开放创新平台承建单位,科大讯飞在多语言能力上同样取得突破。讯飞星火X1.5可支持130余种语言,整体性能达到国际领先水平的95%以上,拉美、东盟等14个重点语言效果领先。刘庆峰表示:“中国的AI开发者们只要用讯飞星火,出海再也不用担心‘卡脖子’!”

定义多模态交互八项能力,首发个性化记忆与百变声音复刻

多模态交互是AI融入真实世界的关键。发布会上,科大讯飞系统定义了多模态交互的八项核心能力:麦克风远场识别、3D视觉感知、多人主动交互、类人举止反馈、视听觉融合理解、超拟人数字人、个性化记忆、情感语义。

讯飞星火X1.5首发个性化记忆能力,构建包含长期画像、近期反馈、短期对话和个人资料的用户记忆库,实现多源信息检索与个性化更新。同时首发百变声音复刻技术,基于星火语音大模型底座,一条指令创造任意风格,一句录音复刻任意音色,二者可解耦组合。

现场演示环节,科大讯飞研究院院长刘聪用公开采访素材复刻出不同风格的角色声音,并流利演绎阿拉伯语、英语等多语种内容,3分钟演示赢得3次掌声。刘庆峰表示:“超拟人多模态交互,将是未来AI进入每个家庭的标配。”

百分百全国产化硬件突破,软硬一体构建技术闭环

技术创新不止于算法。科大讯飞在软硬一体化方面同样实现百分百全国产化突破,发布AI+麦克风阵列、AI+扬声器阵列等解决方案。iFLYSOUND智能座舱声场系统已在19家车企量产,出货超100万台。刘庆峰介绍:“我们打破了过去30年车内音响组件依赖进口的情况,实现百分百全国产化。”

从全国产算力训练到原创模型架构,从多模态交互到软硬一体,科大讯飞正以人工智能国家队的担当,构建全栈自主可控的技术体系,为中国AI产业高质量发展提供坚实底座。



责任编辑:qbqsn110
分享到:
0
【慎重声明】凡本站未注明来源为"中国教育资讯网"的所有作品,均转载、编译或摘编自其它媒体,转载、编译或摘编的目的在于传递更多信息,并不代表本站赞同其观点和对其真实性负责。如因作品内容、版权和其他问题需要同本网联系的,请在30日内进行!