全新升级！TeleAI星辰语音大模型支持中英文和40种方言混说_产品中心

2024-12-29 产品中心

　　11月3日，中国电信人工智能研究院（TeleAI）宣布其星辰语音大模型的重大升级。该模型的方言解决能力从原来的30种提升到了40种，同时新增了对英语的支持。这一技术的进步，不仅将AI的应用场景范围进一步扩展，也将大幅度的提高用户的语音识别体验。

　　回顾今年5月，TeleAI首次推出了支持30种方言的超多方言语音识别模型，成为业内的先行者。在短短半年内，技术团队攻克了湛江话、宜宾话、洛阳话和烟台话等多个地方方言，使得这一模型能处理更为丰富的语言环境。这一变化，帮助那些讲不同方言的用户在日常交流中更方便、更流畅。

　　TeleAI所采用的技术方法也需要我们来关注。与传统的有标注训练方法不同，该公司通过预训练语音识别模型，利用海量无标注数据来进行初步训练，随后用少量有标注数据来进行精细调优。这种“预训练+微调”的创新方案，尤其适合方言语音数据的特征，因为方言的无标注数据相对丰富，而标注数据却极为稀缺。这一策略不仅解决了数据短缺的问题，还明显降低了对人工标注的需求，节省了大约50倍的成本。

　　据该项目团队介绍，虽然采集标注数据的成本大幅度降低，但模型效果并未受一定的影响。基于这种创新的训练机制，新升级的星辰语音大模型在识别精度上达到了与有监督训练相媲美的水平，这无疑是语音识别领域的一次飞跃。这表明，随技术的慢慢的提升，理解和使用不相同方言的屏障正在逐渐被打破。

　　随着多种方言和中英文的支持，TeleAI的这一模型将在多个应用场景中大显身手。不论是在教育、客服、甚至医疗服务等领域，可处理多种方言的语音识别系统，无疑将大幅度的提高用户的体验与满意度。例如，在教育领域，老师和学生之间的沟通会更加顺畅，而在客服行业，跨地域的用户也能更轻松地获得所需的服务。

　　值得一提的是，TeleAI也在积极推动这项技术的开源，给予开发者更多的尝试空间与可能性。他们在GitHub上发布了相关的开源资源，这不仅仅可以促进技术的进一步发展，也为研究者和开发者提供了一个探索智能语音技术的平台。

　　总的来说，TeleAI星辰语音大模型的升级，不仅是对技术自身的一次提升，也是对整个社会人机交互方式的重要推动。随着语音识别技术的不断成熟，我们有理由相信，未来的沟通将不再受语言和方言的局限，而是更自由和便捷。返回搜狐，查看更加多

[上一篇] 语音识别英文技术打造无界限的客户服务体验

[下一篇] 全球科学技术巨头发布新一代AI芯片引领人工智能新浪潮