阿里通義開源音頻語言模型Qwen2-Audio,相關論文入選頂會ACL 2024

金十數據8月13日訊,阿里通義大模型繼續開源,Qwen2系列開源家族新增音頻語言模型Qwen2-Audio。Qwen2-Audio可以不需文本輸入,直接進行語音問答,理解並分析用戶輸入的音頻信號,包括人聲、自然音、音樂等。該模型在多個權威測評中都顯著超越先前的最佳模型。通義團隊還同步推出了一套全新的音頻理解模型測評基準,相關論文已入選本週正在舉辦的國際頂會ACL2024。

查看原文
  • 讚賞
  • 3
  • 分享
留言
暫無留言