AliTongyi's Qwen2-Audio open-source audio language model, with related papers selected for the ACL 2024 conference.

El 13 de agosto, Gold10 Data informó que Ali Tongyi ha lanzado el modelo Código abierto Qwen2-Audio en la familia de modelos Código abierto Qwen2. Qwen2-Audio permite la pregunta y respuesta de voz sin necesidad de entrada de texto, comprendiendo y analizando señales de audio enviadas por los usuarios, incluyendo voz humana, sonidos naturales y música. Este modelo supera significativamente a los modelos anteriores en múltiples evaluaciones autorizadas. El equipo de Tongyi también ha lanzado una nueva evaluación de modelos de comprensión de audio llamada Indicador de referencia, cuyo artículo relacionado ha sido seleccionado para la conferencia de alto nivel internacional ACL2024 que se está celebrando esta semana.

AUDIO8.01%

Ver originales

Recompensa
Me gusta
3
Compartir

Comentar

Sin comentarios

Tema
#BTC#
106k publicaciones
#GateioInto11#
65k publicaciones
#ETH#
62k publicaciones
4#ContentStar#
57k publicaciones
5#BOME#
54k publicaciones
6#SLERF#
47k publicaciones
7#PIGCOIN#
44k publicaciones
8#比特币#
44k publicaciones
9#MAGA#
42k publicaciones
10#NADA#
40k publicaciones