阿里通义Código aberto音频语言模型Qwen2-Audio,相关论文入选顶会ACL 2024

Dados de Jinshi, 13 de agosto, a equipe da Alibaba continua a abrir código. A família Qwen2 adicionou o modelo de linguagem de áudio Qwen2-Audio. O Qwen2-Audio pode responder a perguntas por voz sem a necessidade de entrada de texto, compreendendo e analisando os sinais de áudio fornecidos pelos usuários, incluindo voz humana, sons naturais e música. Esse modelo superou significativamente os melhores modelos anteriores em várias avaliações autorizadas. A equipe da Alibaba também lançou simultaneamente uma nova avaliação de modelo de compreensão de áudio Referência, cujo artigo relacionado foi selecionado para a conferência internacional de ponta ACL2024 que está ocorrendo esta semana.

Ver original
  • Recompensa
  • 3
  • Compartilhar
Comentário
0/400
Sem comentários
Faça trade de criptomoedas em qualquer lugar e a qualquer hora
Escaneie o código para baixar o app da Gate.io
Comunidade
Português (Brasil)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • ไทย
  • Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)