AI智能外呼拟人度提升:一种情感TTS的实现方案

2024-06-21 132 0

AI智能外呼拟人程度的提升对于提升外呼系统的业务指标会带来积极作用,主要表现在随着拟人程度的提升,用户更加难以识别出当前机器人非真人,从而在沟通轮次、时长、有效性等方面进行了改善。

1.AI智能外呼拟人度如何提升?

提升AI智能外呼的拟人度是一个系统性的工程,在真实应用场景中包括如:

  • 提升ASR识别效果:可提升意图识别准确率
  • 提升意图识别准确率:使AI智能外呼系统能更好地懂用户
  • 提升流程节点的有效性,提供多套话术,提供更加拟人的语音等等。

在本文中,我们将介绍使用情感TTS,一种可以让AI智能外呼机器人的语音可随着用户情感的变化而变化,从而实现机器人语音拟人度的提升。

2.情感TTS

情感TTS也叫Emotion TTS,与传统的TTS不同,它能够实现一种TTS模型合成出不同的情感语音。例如需要温柔语音时合成出温柔语音,需要严肃语音时合成出严肃语音,且能够实现不同情感倾向的混合合成。例如:合成出100%温柔情感,100%的严肃情感,50%+50%的平静情感等等。

相反,传统TTS通常不能实现不同情感的合成,它只能合成出一种情感,因此采用这种TTS的机器人在任何情况下情感都不会变化。

3.如何在AI智能外呼系统中应用情感TTS

当前构建好情感TTS模型后,可基于如下架构实现情感TTS在AI智能外呼中的落地。

AI智能外呼拟人度提升:一种情感TTS的实现方案

其中最重要的是情绪识别、情感映射与情感TTS。

情绪识别:即识别用户当前的情绪,实际中因为系统部署资源、响应时间的限制,往往会直接基于ASR转义的用户文本进行识别,并不使用用户语音。虽然使用用户语音可以提升用户情感识别准确率,但在实时场景中往往难以满足应用条件。

情感映射:该模型要解决的问题是在用户在某种情感下时,机器人应该以什么样的情感语音回应用户。该模型可做成静态,即构建一个映射表,也可以做成一个预测进行实现。

情感TTS:即情感TTS模型,它接受一个情感倾向和话术文本,从而实现特定情感和内容的语音合成。

基于以上架构,可在当前的智能外呼系统上实现基于不同客户的不同情况,外呼机器人使用对于的情感回应用户,实现外呼机器人拟人度的提升。

相关文章

LLM时序对话处理:使用小结更新方法实现对话信息的有效处理
TTS效果提升:一种优于VITS的端到端Matcha-TTS实施与训练
LLM准确率提升:LLM Self-Consistency多推理路径结果实现方式
LLM结果可靠性验证:直接输出结果自信分数是否可行?
LLM标签信息提取(Key-Value)效果衡量:评价指标构建
AI智能外呼TTS:带变量合成语音如何达到真人录音效果?

发布评论