阿里云旗下的通义大模型近日正式推出新一代语音交互模型Fun-Audio-Chat,这是通义百聆语音模型系列中首个专注于“语音对语音”交互能力的创新成果。该模型支持用户直接通过语音进行多轮对话,无需依赖文本输入或转换,为语音交互领域带来了新的技术突破。
IT之家 12 月 23 日消息,阿里通义大模型今日发布了新一代端到端语音交互模型 Fun-Audio-Chat。 阿里通义本次开源了 Fun-Audio-Chat 8B,该模型在 OpenAudioBench、MMAU、Speech-ACEBench、VStyle 等多个榜单上“同尺寸模型排名第一”,综合性能超 GLM4-Voice、Kimi-Audio、Baichuan-Omni 等。
据通义大模型消息,阿里巴巴发布新一代端到端语音交互模型Fun-Audio-Chat,并已开源8B模型权重、推理代码、Function Call接入示例。
FunMobility, the makers of FunMail, a picture-messaging app that organically pairs your texts with appropriate (and fun) images, FunTones, a large collection of funny ringtones, and FunMe, a suite of ...