El 13 de agosto, Gold10 Data informó que Ali Tongyi ha lanzado el modelo Código abierto Qwen2-Audio en la familia de modelos Código abierto Qwen2. Qwen2-Audio permite la pregunta y respuesta de voz sin necesidad de entrada de texto, comprendiendo y analizando señales de audio enviadas por los usuarios, incluyendo voz humana, sonidos naturales y música. Este modelo supera significativamente a los modelos anteriores en múltiples evaluaciones autorizadas. El equipo de Tongyi también ha lanzado una nueva evaluación de modelos de comprensión de audio llamada Indicador de referencia, cuyo artículo relacionado ha sido seleccionado para la conferencia de alto nivel internacional ACL2024 que se está celebrando esta semana.
AliTongyi's Qwen2-Audio open-source audio language model, with related papers selected for the ACL 2024 conference.
El 13 de agosto, Gold10 Data informó que Ali Tongyi ha lanzado el modelo Código abierto Qwen2-Audio en la familia de modelos Código abierto Qwen2. Qwen2-Audio permite la pregunta y respuesta de voz sin necesidad de entrada de texto, comprendiendo y analizando señales de audio enviadas por los usuarios, incluyendo voz humana, sonidos naturales y música. Este modelo supera significativamente a los modelos anteriores en múltiples evaluaciones autorizadas. El equipo de Tongyi también ha lanzado una nueva evaluación de modelos de comprensión de audio llamada Indicador de referencia, cuyo artículo relacionado ha sido seleccionado para la conferencia de alto nivel internacional ACL2024 que se está celebrando esta semana.