القائمة الرئيسية

الصفحات

OpenAI تكشف النقاب عن Voice Engine لإعادة إنتاج الأصوات بالذكاء الاصطناعي

كشفت شركة OpenAI عن أحدث نماذجها المعتمدة على الذكاء الاصطناعي، وهو نموذج المحرك الصوتي لإعادة إنتاج الأصوات.

يمكن للنموذج الجديد إعادة إنتاج الأصوات البشرية بعد الاستماع إلى تسجيل صوتي مدته 15 ثانية فقط للصوت المراد استنساخه. هذه الفترة القصيرة كافية ليتمكن النموذج من قراءة أي نص بالصوت المستنسخ، ويمكنه أيضًا التحدث بلغات أخرى بطلاقة، مما يجعل من الصعب التمييز بين الصوت الأصلي والصوت الناتج.

لماذا قامت OpenAI بتطوير نموذج لإعادة إنتاج الصوت؟

وتدعي شركة OpenAI أن النموذج الجديد سيساعد العديد من الأشخاص في حياتهم اليومية، مثل المرضى الذين فقدوا القدرة على التحدث أو منشئي المحتوى الذين يرغبون في ترجمة محتواهم مع الحفاظ على هويتهم وصوتهم الحقيقيين. بيان OpenAI وللإعلان عن هذه الميزة، أشار تحديداً إلى أن عملية الترجمة لن تتجاهل البعد الثقافي للمتحدث: إذا كان المتحدث فرنسياً ويرغب في ترجمة شيء ما إلى اللغة الإنجليزية، فإن الصوت المستنسخ سيتحدث الإنجليزية بلكنة فرنسية وليس بريطانية أو إنجليزية. . لهجة الأمريكية.

ونفس الشيء قالب تحويل Sora لإنشاء مقاطع فيديو ولن يكون هذا النموذج متاحًا لعامة الناس، وستقتصر شركة OpenAI على توفره خلال الفترة المقبلة على عدد محدود من المستخدمين، ولم تكشف الشركة عن طريقة اختياره.

إطلاق نموذج Sora باستخدام OpenAI – المصدر: Medium

تقنين الأصوات المكررة

ودعت شركة OpenAI العديد من أصحاب المصلحة إلى اتخاذ الخطوات اللازمة لإضفاء الشرعية على الأصوات المستنسخة، نظرًا لانتشارها مؤخرًا واحتيالها على نطاق واسع، وكان آخرها استنساخ صوت الرئيس الأمريكي جو بايدن لإجراء مكالمات وهمية.

وترى الشركة أنه من الضروري التخلي عن المصادقة الصوتية كوسيلة أمنية بيومترية في العديد من المجالات، وتسلط الضوء أيضًا على الحاجة إلى زيادة الوعي بتقنيات الذكاء الاصطناعي المتاحة حاليًا وإمكانية استخدامها في العمليات الاحتيالية. وشددت شركة OpenAI على ضرورة اعتماد قوانين جديدة لإدارة عملية الاستخدام الصوتي بواسطة نماذج الذكاء الاصطناعي.

تجدر الإشارة إلى أن Voice Engine ليس النموذج الأول لإعادة إنتاج الصوت باستخدام الذكاء الاصطناعي، ولكن هناك عددًا لا بأس به من هذه النماذج التي لا تزال قيد التطوير. بعضها متاح للجمهور بالفعل ويمكنك الوصول إليه واستخدامه بسهولة. وهناك بالفعل ملايين المقاطع المزيفة التي تستخدم هذه التقنية على مواقع التواصل الاجتماعي، وبعضها حتى الصوت المزيف يكون متزامناً مع حركة الفم والوجه.

هل سيتفوق نموذج OpenAI، عند تقديمه للجمهور، على نماذج المنافسين الآخرين؟

?xml>

Source link

#OpenAI #تكشف #النقاب #عن #Voice #Engine #لإعادة #إنتاج #الأصوات #بالذكاء #الاصطناعي

reaction:

تعليقات