现在,这个功能在文心一言即可体会,简略易操作,还免费!翻开文心一言App,挑选创立智能体,点击创立自己的声响,体系会给出一句话,用你平常说话的口气念一遍,在极短时间内,约2s左右,就可以取得比美真人、流通天然的组成作用,而且组成音频的质量完美坚持了你朗诵这句话时的情感、风格和天然度,一键生成专属你自己的赛博声优。你还可以构建自己的个性化音库,再匹配上虚拟形象,就能快速打造出一个数字兼顾。
为什么这项技能能在2秒钟就能复刻人们的声响呢?传统的技能主要是经过许多的样原本制造模型,然后生成一段程序化表达的声响。百度的这项语音组成新技能,是在离线个性化的作业根底之上,依托文心大模型和语音组成大模型经过许多的语音练习,让AI真实了解了文本和声响的对应联系,结合大模型Prompt技能,无需微调,可以以zeroshot的方法,快速生成天然、流通的个性化组成声响。许多时分甚至能了解文本中的心情,最大限度上坚持原声的情感、风格和天然度。所以,它只需要极短的样本,几秒钟就能完结。
此外,对不同性别、不同年纪的人均适用,尤其是小孩和重口音的兼容作用很超卓,能很好的保存相应的风格和口音,合适中国社会地域散布广泛,口音很多的特色。在这一点上,具有十分显着优势。
不仅如此,比较于传统学术范畴的语音组成技能,百度新技能有较强的抗噪才能,即便原始录制音频布景喧闹,仍然能轻松的取得流通的、音质洁净的组成作用。
此前,百度语音组成技能已有很多使用,比如在百度地图上,用户只需9句话就可组成专属导航语音包、技能修正雷锋原声读《雷锋日记》、赋能智能轿车等。语音技能正加快生产发展和落地,改动人们的日子。