8月13日,阿里通义千问开源了Qwen2-Audio系列的两个模型Qwen2-Audio-7B和Qwen2-Audio-7B-Instruct。这款大规模音频语言模型能够接受各种音频信号输入,并根据语音指令执行音频分析或直接响应文本,提供两种不同的音频交互模式:语音聊天和音频分析。
在一系列基准数据集上进行了测试后,Qwen2-Audio超越了先前的最佳模型。官方提供了试用链接、论文地址和评估标准等相关信息。此外,该模型的开源代码也在github上可用。
8月13日,阿里通义千问开源了Qwen2-Audio系列的两个模型Qwen2-Audio-7B和Qwen2-Audio-7B-Instruct。这款大规模音频语言模型能够接受各种音频信号输入,并根据语音指令执行音频分析或直接响应文本,提供两种不同的音频交互模式:语音聊天和音频分析。
在一系列基准数据集上进行了测试后,Qwen2-Audio超越了先前的最佳模型。官方提供了试用链接、论文地址和评估标准等相关信息。此外,该模型的开源代码也在github上可用。
评论