AI发音如何更像真人?平安科技攻克技术难题
随着新基建浪潮的推动,行业数字化转型如火如荼。在这个过程中,AI语音作为近几年发展最为成熟的人工智能技术方向,逐渐成为行业数字化不可或缺的“增长基石”。科技领域的代表性企业——平安科技,也致力于AI语音的探索与研究,并且已经有所突破。
如今,AI语音更加广泛地出现在我们的生活和工作中,大家似乎习以为常了。但AI语音,其实是个困难重重的长久课题,它的不断优化还需付出巨大的努力。关于这一点,平安科技的研发团队深有体会。
如何让机器的声音口语化,是AI语音合成遇到的第一个问题。对此,平安科技的研发团队将“情绪”视为研发的重点和难点,希望能赋予机器拟人化的声音表达。人声与机器声最大的不同在于,人的声音有喜怒哀乐、有抑扬顿挫,能根据情景的变化而变化。而一般机器的声音由算法程序设定,基本保持一个腔调,没有“温度”。所以,当机器的声音注入了情绪,沟通起来也就更加真实立体,接近人声。
通过结合金融行业的属性与平安日常的业务场景,研发团队的科学家为语音机器人确立了6种需要培养的情绪,分别是中性、高兴、悲伤、愤怒、温和和严厉,来满足不同的情景需求。例如,客服人员交流,需要温和的语气;而电商促销,则需要高兴的语气。六种情绪风格确认后,再导入录音员录制的语音库,每个风格都要录上五六百句话。
工作量的庞大,显而易见。在收集了数千句素材之后,基于素材建造训练模型,再通过模型构架、网络构架的优化,不断地进行机器训练。借助一系列复杂的训练与合成操作,平安科技自然语言技术团队终于实现了机器声音的情绪化。
据了解,平安科技AI语音平台已实现客服工作的AI覆盖率达83%,解决率接近90%。通过平安智能语音中台的运用,成功赋能超8万位远程坐席。有人情味、有灵魂地服务,既提升了客户满意度,也提高了客服工作效率,进一步释放人力,降低不必要的成本消耗。
未来,由于市场环境的变化、科学技术的进步,平安科技的AI语音平台还将迎来高标准的升级更新。我们有理由相信,在平安科技等各大科技型公司的助推下,AI语音还将有更多的惊喜呈现。