«ميتا» تطلق أول نظام ترجمة للخطاب الشفهى مدعوم من الذكاء الاصطناعى

أعلنت شركة “ميتا” إطلاق أول نظام ترجمة الخطاب الشفهى مدعوم من الذكاء الاصطناعى للغة غير مكتوبة.
وأوضحت “ميتا” اليوم الأربعاء أنه حتى الآن، ركزت ترجمة الذكاء الاصطناعى على اللغات المكتوبة، ومع ذلك، من بين أكثر من 7,000 لغة حية، فإن أكثر من 40٪ من اللغات تعد لغات شفهية ومنطوقة فى المقام الأول، وليس لديها نظام قياسى أو معروف على نطاق واسع للكتابة.
وأشارت إلى أن مشروع مترجم الخطاب الشفهى العالمى (UST) من ميتا يركز على تطوير أنظمة ذكاء اصطناعى توفر ترجمة من الخطاب إلى الخطاب (speech-to-speech) الفورية عبر جميع اللغات، حتى اللغات المنطوقة بشكل أساسى.
ونوهت الشركة إلى أن القدرة على التحدث إلى البشر بلغات مختلفة دون الحاجة لقضاء سنوات من الدراسة هو حلم طال انتظاره، يمكن أن تساعد الاتصالات المنطوقة فى كسر الحواجز وجمع البشر معاً أينما كانوا – حتى فى الميتافيرس، لقد اتخذنا خطوة أخرى نحو هذا الهدف مع UST، وهو أول نظام ترجمة من الخطاب-إلى-الخطاب مدعوم بالذكاء الاصطناعى تم تطويره للغة غير مكتوبة.
وقام باحثو ميتا فى مجال الذكاء الاصطناعى ببناء أنظمة ترجمة مفتوحة المصدر للغة الهوكين، وهى واحدة من اللغات الرسمية فى تايوان ويتم التحدث بها على نطاق واسع داخل منطقة الشتات الصينى، ولكنها تفتقر إلى شكل قياسى مكتوب.
وأوضحت “ميتا” أن هذه التقنية تسمح للمتحدثين بلغة الهوكين بإجراء محادثات مع الأشخاص الذين يتحدثون الإنجليزية.. ولتطوير نظام الترجمة الجديد هذا والمخصص للخطاب الشفهى فقط، كان على باحثى الذكاء الاصطناعى فى ميتا التغلب على العديد من التحديات فى أنظمة الترجمة الآلية التقليدية، بما فى ذلك جمع البيانات، تصميم النماذج، والتقييم.
وتابعت “ميتا”: “كان جمع البيانات الكافية عقبة كبيرة واجهناها عند الشروع فى بناء نظام ترجمة الهوكين. الهوكين هى ما يعرف باسم لغة ناقصة الموارد، مما يعنى أنه لا توجد إمدادات كافية من بيانات التدريب المتاحة بسهولة، مقارنة بالإسبانية أو الإنجليزية على سبيل المثال.
وأضافت أنه بجانب ذلك، هناك عدد قليل نسبيًا من المترجمين البشريين من اللغة الإنجليزية إلى الهوكين، مما يجعل من الصعب جمع البيانات وتفسيرها لتدريب النموذج، قمنا بالاستفادة من لغة الماندرين كلغة وسيطة لبناء تسميات مستعارة، حيث قمنا أولاً بترجمة الخطاب بالإنجليزية (أو الهوكين) إلى نص بلغة الماندرين، ثم ترجمنا إلى الهوكين (أو الإنجليزية) وأضفناه إلى بيانات التدريب. حسنت هذه الطريقة بشكل كبير من أداء النموذج عبر الاستفادة من البيانات من لغة مماثلة عالية الموارد”.
ولفتت إلى أن استخراج الخطاب هو نهج آخر للتدريب على زيادة البيانات، باستخدام برنامج تشفير الخطاب المدرب مسبقًا، ويمكن تشفير تضمينات خطاب الهوكين فى نفس المساحة الدلالية مثل تضمين النص الإنجليزى، وموائمة خطاب الهوكين مع النصوص الإنجليزية التى تتشابه تضميناتها الدلالية.. وتوليف الخطاب الإنجليزى من النصوص، ما يؤدى إلى خطاب متوازى ما بين الهوكين والإنجليزية.
كما تعتمد العديد من أنظمة ترجمة الخطاب على النص المكتوب، أو هى بالأساس أنظمة تحويل الخطاب إلى نص، ولكن اللغات غير المكتوبة ليس لها أشكال قياسية مكتوبة، وهذا يعنى أن إنتاج نص منسوخ كناتج ترجمة ليس منطقيًا، وبالتالى، نركز على الترجمة من الخطاب إلى الخطاب.