专利摘要显现,本请求公开了一种语音辨认方法、设备、设备及存储介质,在对输入语音进行辨认时,经过编码器对输入语音进行编码,得到音频编码向量,使用交融有大言语模型的解码器处理输入数据并解码得到辨认文本。本请求在语音辨认模型的解码器中交融大言语模型的网络结构,以此来实现将大言语模型与语音辨认模型的深度结合,凭借大言语模型的建模才能提高语音辨认模型中解码器的解码才能,从而提高语音辨认作用。输入数据能够包含音频编码向量,或许能够包含音频编码向量和提示指令信息,该提示指令信息包含用于辅佐对输入语音进行辨认的辅佐信息,从而为解码器供给更丰厚的参阅信息,辅佐逐渐提高语音辨认作用。