كشفت شركة فيسبوك عن نموذج ذكاء اصطناعي جديد مفتوح المصدر، يمكنه الترجمة بين 100 لغة مختلفة. ولا يحتاج ذلك النموذج تحويل النص إلى الإنجليزية، ما يسمح بترجمةٍ أكثر كفاءة ودقة.
في منشور على مدونة “عن فيسبوك”، وضَّحت المنصة تفاصيل نموذج الترجمة الآلية الجديد متعدد اللغات، باسم M2M-100. والمبهر أن نموذج تعلُّم الآلة مفتوح المصدر هذا “يمكنه الترجمة بين أي زوجٍ من بين 100 لغة دون الاعتماد على بيانات باللغة الإنجليزية.
في حين أن هذا ما زال مشروعاً بحثياً، فإنه واعدٌ للغاية. وأشارت أنجيلا فان، معاونة بحثية بشركة فيسبوك، إلى أن نماذج الترجمة الآلية “العادية” تستعمل نماذج مختلفة لكل لغة، ما يجعلها عديمة الكفاءة في المنصات الكبرى مثل فيسبوك.
وحتى النماذج المتقدمة لا تفي بالغرض، لأنها تستعمل الإنجليزية لغةً وسيطة بين اللغات المختلفة. يعني هذا أن النظام عليه أولاً أن يترجم النص في المصدر إلى الإنجليزية، ثم يترجم الترجمة الإنجليزية بعدها إلى اللغة المستهدفة.
لا تنتج النماذج القائمة على الإنجليزية أفضل النتائج، وتشير فان إلى أن إخراج الإنجليزية من الصورة يتيح لنظام الترجمة الآلية متعدد اللغات من فيسبوك تقديم ترجمات دقيقة. وتقول فان: “عند ترجمة الصينية إلى الفرنسية على سبيل المثال، تتدرب أغلب النماذج متعددة اللغات المتمحورة حول الإنجليزية على الترجمة من الصينية إلى الإنجليزية ثم من الإنجليزية إلى الفرنسية، لأن بيانات التدريب على اللغة الإنجليزية هي المتاحة أكثر. أما النموذج الخاص بنا فيتدرب مباشرة على بياناتٍ من الصينية إلى الفرنسية، من أجل الحفاظ على المعنى في الترجمة”.
لذا بدلاً من استعمال الإنجليزية جسراً بين اللغات، بإمكان نموذج الترجمة الآلية متعدد اللغات من فيسبوك الترجمة بين 100 لغة مختلفة. وفقاً لفان، بنت شركة فيسبوك، فإن “أكثر مجموعة متنوعة من بيانات الترجمة الآلية متعددة اللغات حتى يومنا هذا”، تتكون من 7.5 مليار زوجٍ من الجمل للغات المئة.
من أجل تحقيق هذا الإنجاز، استخرج الفريق البحثي بيانات الترجمة اللغوية على الويب، وركزوا أولاً على اللغات “الأكثر طلباً”. ثم صنف الباحثون اللغات إلى 14 مجموعة بناءً على السمات المشتركة.
انطلاقاً من هذه النقطة، حدد الباحثون لغاتٍ وسيطة لكل مجموعة، واستخرجوا بيانات تدريب لكل الأزواج اللغوية الممكنة. نتج عن ذلك 7.5 مليار جملة في 2200 اتجاه.
وبالنسبة للغات غير المنتشرة، يستعمل فيسبوك ما يُسمى الترجمة الخلفية، لصنع ترجمات صناعية.
هذه العملية تقرّب فريق الذكاء الاصطناعي في فيسبوك أكثر وأكثر، من هدف صنع “نموذج مفرد يدعم كل اللغات واللهجات والصيغ”.
فيسبوك يقترب من توفير ترجمات أفضل
يُجري موقع فيسبوك بالفعل 20 مليار ترجمةٍ كل يوم على صفحة آخر الأخبار، وسيجعل ذكاء فيسبوك الاصطناعي العملية أكثر كفاءة. ومع أن نموذج الترجمة الجديد لم يتم تطبيقه بعد، فإنه سيكون مفيداً لمستخدمي فيسبوك الدوليين المحتاجين إلى ترجمات دقيقة.
– هذا الموضوع مترجم عن موقع MakeUseOf.