使用多模态模型来进行情感识别。输入有文本(包括emojis)、语音、图片和视频,根据这些内容,我们设计了一个分层方法,从一模态向量到双模态向量,再从双模态向量到三模态向量。最后我们用softmax layer把这些特征向量分成4种情感:喜、怒、哀和其他。
使用多模态模型来进行情感识别。输入有文本(包括emojis)、语音、图片和视频,根据这些内容,我们设计了一个分层方法,从一模态向量到双模态向量,再从双模态向量到三模态向量。最后我们用softmax layer把这些特征向量分成4种情感:喜、怒、哀和其他。
一些您可能无法访问的结果已被隐去。
显示无法访问的结果