阿里通义开源音频语言模型Qwen2-Audio,相关论文入选顶会ACL 2024

金十数据8月13日讯,阿里通义大模型继续开源,Qwen2系列开源家族新增音频语言模型Qwen2-Audio。Qwen2-Audio可以不需文本输入,直接进行语音问答,理解并分析用户输入的音频信号,包括人声、自然音、音乐等。该模型在多个权威测评中都显著超越先前的最佳模型。通义团队还同步推出了一套全新的音频理解模型测评基准,相关论文已入选本周正在举办的国际顶会ACL2024。

查看原文
  • 赞赏
  • 3
  • 分享
评论
0/400
暂无评论