نظام Translatotron 2 الذكاء الاصطناعي للترجمة الفورية للكلام الشفوي دون إمكانية إساءة الاستخدام

 قدمت Google نظام Translatotron 2 ، والذي حل مشكلة إساءة الاستخدام من خلال الحفاظ على الصوت الأصلي.



تعمل Google على تقنيات الذكاء الاصطناعي (AI) لبعض الوقت وقد حققت بالفعل بعض النجاح في هذا المجال. أحد هذه المشاريع هو Translatotron ، الذي تم تقديمه في عام 2019 ، وهو نظام ذكاء اصطناعي للترجمة الفورية للكلام الشفوي من لغة إلى أخرى.

لم يترجم Translatotron الكلام في الوقت الفعلي فحسب ، بل غيّر صوت المتحدث بحيث تبدو الكلمات المنطوقة في إحدى اللغات في لغة أخرى. ومع ذلك ، على الرغم من المزايا الواضحة لهذه التكنولوجيا ، إلا أن لها عيبًا كبيرًا. نظرًا لأن النظام قادر على توليد الكلام المنطوق بأصوات مختلفة ، فيمكن استخدامه من قبل المحتالين ، بما في ذلك لإنشاء التزييف العميق.

أدخلت Google الآن نظام Translatotron 2 ، حيث قامت بحل مشكلة إساءة الاستخدام المحتملة من خلال الحفاظ على الصوت الأصلي للمتحدث (صوت الترجمة يختلف عن صوت المتحدث). تم أيضًا تحسين جودة الترجمة والكلام الذي يبدو طبيعيًا عن طريق تقليل الضوضاء غير المرغوب فيها مثل الكلام المشوش وفترات التوقف الطويلة جدًا بين العبارات. بالإضافة إلى ذلك ، فإن أداء Translatotron 2 أعلى بكثير مقارنة بالنظام الأصلي.

وفقًا للخبراء ، على مدار السنوات القليلة الماضية ، أصبحت تقنيات تحويل الصوت شائعة جدًا. تعمل هذه التقنيات بكفاءة عالية لدرجة أنه حتى الأنظمة الآلية لا يمكنها دائمًا التمييز بين "الحي" والكلام المعدل. في هذا الصدد ، من الضروري التأكد من أنه لا يمكن استخدامها لإلحاق الأذى. يأمل مبتكرو Translation 2 أن يكون مشروعهم ، في حالة نجاحه ، إنجازًا محتملاً في هذا المجال.

0 تعليقات