通义千问团队开源音频语言模型 Qwen2-Audio。这是 Qwen-Audio 的下一代版本，它能够接受音频和文本输入，并生成文本输出。具有以下特点：语音聊天：用户可以使用语音向音频语言模型发出指令，无需通过自动语音识别（ASR）模块。音频分析：该模型能够根据文本指令分析音频信息，包括语音、声音、音乐等。多语言支持：该...

新闻来源：阿里通义开源音频语言模型 Qwen2-Audio