مترجم ميتا الجديد يستخدم نموذجًا واحدًا للتحدث بـ100 لغة

ميتا - أرشيفية
ميتا - أرشيفية
كتبت سماح لبيب
أثبتت أساليب الترجمة الحديثة للذكاء الاصطناعى أنها كافية في التحويل الدقيق لأنظمة الاتصال المنطوقة والمكتوبة البشرية التي يبلغ عددها حوالي 6500 نظام بين بعضها البعض، إلا أن المشكلة تكمن فى أن كل نموذج من هذه النماذج يميل إلى القيام بمهمة واحدة أو مهمتين بشكل جيد حقًا ومنها ترجمة وتحويل النص إلى كلام، أو الكلام إلى نص أو بين أي من المجموعتين، لذلك طورت شركة ميتا نموذجًا واحدًا يمكنه القيام بكل شيء مثل SeamlessM4T هو "نموذج أساسي متعدد اللغات ومتعدد المهام يترجم وينسخ بسلاسة عبر الكلام والنص".
 
وحسبما جاء في مدونة ميتا اليوم، فإن النموذج يمكنه الترجمة بين أي من ما يقرب من 100 لغة لوظائف تحويل الكلام إلى نص وتحويل النص إلى نص، ويدعم تحويل الكلام إلى كلام وتحويل النص إلى كلام تلك اللغات نفسها كمدخلات ومخرجات فى أى من 36 لغة أخرى، بما في ذلك اللغة الإنجليزية. 
 
وفى منشور مدونتهم، لاحظ فريق بحث Meta أن SeamlessM4T يحسن بشكل كبير أداء اللغات المنخفضة والمتوسطة الموارد التي ندعمها، مع الحفاظ على الأداء القوي في اللغات عالية الموارد، مثل الإنجليزية والإسبانية والألمانية. وقامت Meta ببناء SeamlessM4T من بنية نموذج UnitY متعددة المهام المستندة إلى PyTorch، والتي تقوم بالفعل بتنفيذ ترجمات مشروطة متنوعة بالإضافة إلى التعرف التلقائي على الكلام. 
 
ويستخدم نظام BERT 2.0 لتشفير الصوت، وتقسيم المدخلات إلى الرموز المكونة الخاصة بها للتحليل، ووحدة التشفير الصوتي HiFi-GAN لإنشاء استجابات منطوقة. 
 
وقامت ميتا أيضًا برعاية مجموعة ضخمة مفتوحة المصدر من الكلام إلى كلام ومن الكلام إلى النص، يطلق عليها اسم SeamlessAlign. استخرجت الشركة "عشرات المليارات من الجمل" و"أربعة ملايين ساعة" من الكلام من المستودعات المتاحة للجمهور من أجل "مواءمة أكثر من 443000 ساعة من الكلام مع النصوص تلقائيًا، وإنشاء حوالي 29000 ساعة من محاذاة الكلام إلى الكلام". فى المدونة. 
 
وعند اختبار المتانة، أفادت التقارير أن SeamlessM4T تفوقت على سابقتها (حاليًا على أحدث طراز) مقابل ضوضاء الخلفية وتغيرات نمط السماعات بنسبة 37% و48% على التوالى.
 
كما هو الحال مع معظم جهود الترجمة الآلية السابقة - سواء كان ذلك Llama 2 أو Massively Multilingual Speech ( MMS ) أو Universal Speech Translator ( UST ) أو مشروع No Language Left Behind (NLLB) الطموح - أصبح SeamlessM4T مفتوح المصدر. 
 
وكتب الفريق: "نعتقد أن SeamlessM4T يعد إنجازًا مهمًا فى سعى مجتمع الذكاء الاصطناعي نحو إنشاء أنظمة عالمية متعددة المهام.. تماشيًا مع نهجنا في العلوم المفتوحة، نحن متحمسون لمشاركة نموذجنا علنًا للسماح للباحثين والمطورين بالبناء على هذه التكنولوجيا." وإذا كنت مهتمًا بالعمل مع SeamlessM4T بنفسك، فتوجه إلى GitHub لتنزيل النموذج وبيانات التدريب والوثائق.

Trending Plus

اليوم السابع Trending

الأكثر قراءة

جيش الاحتلال يعلن مقتل رقيب في الكتيبة الهندسية 601 بمعارك شمال غزة

إخلاء سبيل أحمد السقا فى اتهامه بالتعدى على طليقته مها الصغير بكفالة 5 آلاف جنيه

كامل الوزير: إعداد خطة زمنية مضغوطة لإنهاء الطريق الإقليمي بالكامل

الخميس 3 يوليو موعد إجازة 30 يونيو.. رئيس الوزراء يصدر القرار رسميا

مصر تتقدم على ألمانيا 15-11 فى مباراة تحديد مراكز بطولة العالم لشباب اليد


كامل الوزير يتفقد موقع حادث المنوفية على الإقليمي: هذه المأساة لن تتكرر

كل ما تريد معرفته عن العروض الخارجية لضم لاعبي الأهلي فى ميركاتو الصيف

الأهلي يُخطر وسام أبو علي بموقفه النهائي من عروض الرحيل

الطقس غدا شديد الحرارة ورطوبة عالية وشبورة صباحا والعظمى بالقاهرة 37 درجة

حقن مضادة للشيخوخة ولعب اليوجا.. تعرف على سبب وفاة شيفالي جاريوالا


موعد ظهور نتيجة الدبلومات الفنية 2025.. تعرف على التفاصيل

الابتسامات ترسم الوجوه.. طلاب الثانوية العامة: امتحان الإنجليزي سهل ومباشر

البندقية تنتفض ضد بيزوس.. مظاهرات ضد حفل زفافه بسبب التكاليف الباهظة.. فيديو

موعد مباراة بي إس جي ضد إنتر ميامي فى ثمن نهائى كأس العالم للأندية

ترقبوا.. محافظ الجيزة يعتمد اليوم تنسيق الثانوى العام 2025

اعرف قصة انفصال جينيفر أنيستون عن حبها الأول بسبب مسلسل Friends

3 ملايين دولار سبب تمسك وسام أبو علي بالرحيل عن الأهلي

مواعيد مباريات اليوم.. سان جيرمان أمام إنتر ميامي وفلامينجو ضد البايرن بمونديال الأندية

تداول أسئلة امتحان اللغة الإنجليزية للثانوية العامة.. والتعليم تحقق

ملخص وأهداف مباراة بنفيكا ضد تشيلسي في ثمن نهائي كأس العالم للأندية

لا يفوتك


المزيد من Trending Plus
Youm7 Applcation Icons
اليوم السابع اليوم السابع اليوم السابع اليوم السابع اليوم السابع اليوم السابع هواوى