科大讯飞请求语音辨认相关专利提高语音辨认作用_智能接待机器人

2024-01-04 智能接待机器人

专利摘要显现，本请求公开了一种语音辨认方法、设备、设备及存储介质，在对输入语音进行辨认时，经过编码器对输入语音进行编码，得到音频编码向量，使用交融有大言语模型的解码器处理输入数据并解码得到辨认文本。本请求在语音辨认模型的解码器中交融大言语模型的网络结构，以此来实现将大言语模型与语音辨认模型的深度结合，凭借大言语模型的建模才能提高语音辨认模型中解码器的解码才能，从而提高语音辨认作用。输入数据能够包含音频编码向量，或许能够包含音频编码向量和提示指令信息，该提示指令信息包含用于辅佐对输入语音进行辨认的辅佐信息，从而为解码器供给更丰厚的参阅信息，辅佐逐渐提高语音辨认作用。

[上一篇] 突破语音技术难题网易云商论文入选国际语音会议ASRU

[下一篇] 微软语音转文本开通指南全云在线助力企业极速申请