阿里音频生成大模型开源!种语言快速理解种语言语音生成
-
阿里音频生成大模型开源!种语言快速理解种语言语音生成
FunAudioLLM团队投稿量子位|公众号QbitAIOpenAI迟迟不上线GPT-4o语音助手,其它音频生成大模型成果倒是一波接着一波发布,关键还是开源的。刚刚,阿里通义实验室也出手了——最新发布开源语音大模型项目FunAudioLLM,而且一次包含两个模型:SenseVoice和CosyVoice。SenseVoice专注高精度多语言语音识别、情感辨识和音频事件检测,阿里音频生成大模型开源!种语言快速理解种语言语音生成支持超过50种语言识别,效果优于Whisper模型,中文与粤语提升50%以上。且情感识别能力...