中国电信发布语音识别大模型支持30种方言混说

　　5月25日，《每日经济新闻》记者从中国电信获悉，中国电信人工智能研究院（TeleAI）于近日发布了业内首个支持30种方言自由混说的语音识别大模型——星辰超多方言语音识别大模型，可同时识别理解粤语、上海话、四川话、温州话等30多种方言，是目前国内支持最多方言的语音识别大模型。

　　据悉，中国电信人工智能研究院已构建超30种、超30万小时的高质量方言数据库，研发团队采用的“蒸馏+膨胀”联合训练算法可解决超大规模多场景数据集和大规模参数条件下预训练坍缩的问题，实现1B参数80层模型稳定训练。中国电信方面表示，星辰语音大模型是业内首个开源的、基于离散语音表征的语音识别大模型，通过“从语音到token再到文本”的建模新范式，将推理时语音传输比特率大幅降低。

　　据中国电信方面透露，星辰语音大模型现已对外开源及应用落地，在福建、江西、广西、北京、内蒙古等地的中国电信万号智能客服试点应用。《每日经济新闻》记者还了解到，5月24日，第七届数字中国建设峰会在福州开幕，中国电信在峰会上发布了智算云能力体系，由算力基础设施、智算平台能力、星辰大模型能力、数据要素能力四部分组成。