تم اختيار ورقة البحث المتعلقة بنموذج لغة الصوت Qwen2-Audio المفتوح المصدر لتوليف الصوت والنص الخاص بها ضمن مؤتمر ACL الرفيع المستوى لعام 2024.

أخبار بوابة جيتيو: في 13 أغسطس، قام فريق تونجي تشونغ الخاص بـ Alibaba بإطلاق نموذج Qwen2-Audio المفتوح المصدر، وهو جزء من عائلة Qwen2 المفتوح المصدر. يتيح Qwen2-Audio القدرة على الإجابة على الأسئلة من خلال الصوت دون الحاجة إلى إدخال النص، حيث يمكنه فهم وتحليل الإشارات الصوتية المدخلة من المستخدم، بما في ذلك الأصوات البشرية والصوت الطبيعي والموسيقى وما إلى ذلك. هذا النموذج تفوق بشكل ملحوظ على أفضل النماذج السابقة في العديد من التقييمات الرسمية. كما قام فريق التونجي تشونغ بإطلاق تقييم جديد لفهم الصوت بالكامل، وهو يتضمن بحثًا مختارًا في مؤتمر ACL2024 الدولي الذي يعقد هذا الأسبوع.

شاهد النسخة الأصلية
  • أعجبني
  • 2
  • مشاركة
تعليق
لا توجد تعليقات