مترجم ميتا الجديد يستخدم نموذجًا واحدًا للتحدث بـ100 لغة

ميتا - أرشيفية
ميتا - أرشيفية
كتبت سماح لبيب
أثبتت أساليب الترجمة الحديثة للذكاء الاصطناعى أنها كافية في التحويل الدقيق لأنظمة الاتصال المنطوقة والمكتوبة البشرية التي يبلغ عددها حوالي 6500 نظام بين بعضها البعض، إلا أن المشكلة تكمن فى أن كل نموذج من هذه النماذج يميل إلى القيام بمهمة واحدة أو مهمتين بشكل جيد حقًا ومنها ترجمة وتحويل النص إلى كلام، أو الكلام إلى نص أو بين أي من المجموعتين، لذلك طورت شركة ميتا نموذجًا واحدًا يمكنه القيام بكل شيء مثل SeamlessM4T هو "نموذج أساسي متعدد اللغات ومتعدد المهام يترجم وينسخ بسلاسة عبر الكلام والنص".
 
وحسبما جاء في مدونة ميتا اليوم، فإن النموذج يمكنه الترجمة بين أي من ما يقرب من 100 لغة لوظائف تحويل الكلام إلى نص وتحويل النص إلى نص، ويدعم تحويل الكلام إلى كلام وتحويل النص إلى كلام تلك اللغات نفسها كمدخلات ومخرجات فى أى من 36 لغة أخرى، بما في ذلك اللغة الإنجليزية. 
 
وفى منشور مدونتهم، لاحظ فريق بحث Meta أن SeamlessM4T يحسن بشكل كبير أداء اللغات المنخفضة والمتوسطة الموارد التي ندعمها، مع الحفاظ على الأداء القوي في اللغات عالية الموارد، مثل الإنجليزية والإسبانية والألمانية. وقامت Meta ببناء SeamlessM4T من بنية نموذج UnitY متعددة المهام المستندة إلى PyTorch، والتي تقوم بالفعل بتنفيذ ترجمات مشروطة متنوعة بالإضافة إلى التعرف التلقائي على الكلام. 
 
ويستخدم نظام BERT 2.0 لتشفير الصوت، وتقسيم المدخلات إلى الرموز المكونة الخاصة بها للتحليل، ووحدة التشفير الصوتي HiFi-GAN لإنشاء استجابات منطوقة. 
 
وقامت ميتا أيضًا برعاية مجموعة ضخمة مفتوحة المصدر من الكلام إلى كلام ومن الكلام إلى النص، يطلق عليها اسم SeamlessAlign. استخرجت الشركة "عشرات المليارات من الجمل" و"أربعة ملايين ساعة" من الكلام من المستودعات المتاحة للجمهور من أجل "مواءمة أكثر من 443000 ساعة من الكلام مع النصوص تلقائيًا، وإنشاء حوالي 29000 ساعة من محاذاة الكلام إلى الكلام". فى المدونة. 
 
وعند اختبار المتانة، أفادت التقارير أن SeamlessM4T تفوقت على سابقتها (حاليًا على أحدث طراز) مقابل ضوضاء الخلفية وتغيرات نمط السماعات بنسبة 37% و48% على التوالى.
 
كما هو الحال مع معظم جهود الترجمة الآلية السابقة - سواء كان ذلك Llama 2 أو Massively Multilingual Speech ( MMS ) أو Universal Speech Translator ( UST ) أو مشروع No Language Left Behind (NLLB) الطموح - أصبح SeamlessM4T مفتوح المصدر. 
 
وكتب الفريق: "نعتقد أن SeamlessM4T يعد إنجازًا مهمًا فى سعى مجتمع الذكاء الاصطناعي نحو إنشاء أنظمة عالمية متعددة المهام.. تماشيًا مع نهجنا في العلوم المفتوحة، نحن متحمسون لمشاركة نموذجنا علنًا للسماح للباحثين والمطورين بالبناء على هذه التكنولوجيا." وإذا كنت مهتمًا بالعمل مع SeamlessM4T بنفسك، فتوجه إلى GitHub لتنزيل النموذج وبيانات التدريب والوثائق.
Google News تابع آخر أخبار اليوم السابع على Google News

Trending Plus

اليوم السابع Trending

الأكثر قراءة

إحالة المتهم بقتل زوجته فى المنوفية بسبب خلافات بينهما إلى الجنايات

نتيجة كلية الشرطة 2026 كاملة لجميع التخصصات.. بالأرقام

تقارير: غياب مرموش ضربة قوية للسيتي ومصر ثاني المرشحين لحصد أمم أفريقيا

بدء إبلاغ المقبولين بكلية الشرطة بنتائج القبول للعام الدراسى الجديد

مستشار الرئيس للصحة يوصى بالبقاء بالمنزل عند الشعور بأعراض الأنفلونزا "A"H1N1


قبول 50 طالبة من كليات التربية الرياضية بأكاديمية الشرطة

قبول 1550 طالبًا من خريجي الحقوق بأكاديمية الشرطة

قبول 800 طالب من الحاصلين على الثانوية بأكاديمية الشرطة

رئيس أكاديمية الشرطة يعلن قبول 2757 طالبا بعد اجتياز الاختبارات

وفاة الفنان نبيل الغول.. أبرز مشاركاته ذئاب الجبل والشهد والدموع


ألمانيا تحبط هجوما إرهابيا على سوق عيد الميلاد واعتقال 5 أشخاص

تفاصيل عرض المليون دولار من برشلونة لضم حمزة عبد الكريم وموقف الأهلي

اعرف الرابط الرسمى للاستعلام عن نتائج اختبارات كلية الشرطة

صحيفة إنجليزية تحذر رونالدو من انتقال محمد صلاح إلى الدوري السعودي

تفاصيل صادمة فى جريمة العمرانية.. أم تقتل طفليها بسلاح أبيض

اعرف كيفية الحصول على نتيجة كلية الشرطة لعام 2025/2026

الصفقة المجانية سر غضب الأهلى من برشلونة فى صفقة حمزة عبد الكريم

100 مليون جنيه إسترليني تهدد بقاء محمد صلاح في ليفربول

إخطار المقبولين بكلية الشرطة للعام الدراسي الجديد هاتفيًا وبرسائل نصية

أكاديمية الشرطة تعلن نتيجة الطلاب المتقدمين لها اليوم

لا يفوتك


المزيد من Trending Plus
Youm7 Applcation Icons
اليوم السابع اليوم السابع اليوم السابع اليوم السابع اليوم السابع اليوم السابع هواوى