工行发明专利授权:基于人工智能,提升用户语音情绪识别的准确性
7月22日,工商银行一项名为“语音情绪的识别方法及装置、处理器和电子设备”的发明专利授权公告。其申请于2022年4月22日,公布于2022年7月29日,涉及人工智能领域。
其方法包括:获取目标对象的目标语音信息,其中,目标对象为待进行情绪识别的对象;将目标语音信息输入目标混合模型进行情绪识别处理,得到目标对象的情绪识别结果,其中,目标混合模型为基于GNN模型和SVM模型构建的模型。
更具体的,目标混合模型的构建过程包括:根据目标数据集中的训练集,分别训练GNN模型和SVM模型;按照比例逐步调整GNN模型与SVM模型的权重,形成混合模型;使用训练集进行回归验证,确定准确率最高的混合模型作为目标混合模型。目标数据集则包括相同文本但不同情感表达的录音样本,以及情感归属明显的文本录音。
该发明的背景为,随着人工智能领域的飞速发展和广泛应用,人类生活的许多方面都在被AI所影响,例如,在图像识别与分类、语音识别、目标检索等领域中都会用到AI技术。其中,语音识别是语音交互中最基础的一个AI技术,常见的有siri、智能音箱、自助语音客服等。可见,语音识别已经潜移默化地影响着人们的生活及工作的方方面面。
另外,反应人类情绪的一个重要的行为信号就是语音中的情绪信号,即不同的情绪说同样的文字所携带的语音信息可能完全不同。而且,识别语音中的用户的情绪是实现人机交互的一个重要环节,例如,在银行人工客服场景中,客户情绪的识别可以使客服人员及时发现客户当前的情绪状态,并针对客户不同的情绪状态,更好地为客户服务和推介。
但是,目前相关技术中识别语音中的用户情绪的准确性较低。该发明则可提升用户语音情绪识别的准确性。说明书中对其中一些步骤及细节还有更详细的介绍,此处不再展开。
本文为作者授权发布,不代表移动支付网立场,转载请注明作者及来源,未按照规范转载者,移动支付网保留追究相应责任的权利。
评论加载中
相关文章
月点击排行