阿里通义Código aberto音频语言模型Qwen2-Audio，相关论文入选顶会ACL 2024

Dados de Jinshi, 13 de agosto, a equipe da Alibaba continua a abrir código. A família Qwen2 adicionou o modelo de linguagem de áudio Qwen2-Audio. O Qwen2-Audio pode responder a perguntas por voz sem a necessidade de entrada de texto, compreendendo e analisando os sinais de áudio fornecidos pelos usuários, incluindo voz humana, sons naturais e música. Esse modelo superou significativamente os melhores modelos anteriores em várias avaliações autorizadas. A equipe da Alibaba também lançou simultaneamente uma nova avaliação de modelo de compreensão de áudio Referência, cujo artigo relacionado foi selecionado para a conferência internacional de ponta ACL2024 que está ocorrendo esta semana.

AUDIO8.01%

Ver original

Recompensa
gostar
3
Partilhar

Comentar

Nenhum comentário

Tópico
#BTC#
106k publicações
#GateioInto11#
65k publicações
#ETH#
62k publicações
4#ContentStar#
57k publicações
5#BOME#
54k publicações
6#SLERF#
47k publicações
7#PIGCOIN#
44k publicações
8#比特币#
44k publicações
9#MAGA#
42k publicações
10#NADA#
40k publicações