القائمة الرئيسية

الصفحات

كيف تعمل علامة ChatGPT المائية ولماذا يمكن التغلب عليها

لقد أدخلت ChatGPT من OpenAI طريقة لإنشاء المحتوى تلقائيًا ، لكن الخطط لإدخال ميزة العلامة المائية لتسهيل الاكتشاف تجعل بعض الأشخاص متوترين. هذه هي الطريقة التي تعمل بها العلامة المائية ChatGPT ولماذا قد تكون هناك طريقة للتغلب عليها.

تعد ChatGPT أداة رائعة يحبها ويحبها الناشرون عبر الإنترنت ، والشركات التابعة ، وكبار المسئولين الاقتصاديين.

يحبها بعض المسوقين لأنهم يكتشفون طرقًا جديدة لاستخدامها لإنشاء ملخصات المحتوى ، ونظرات عامة ، ومقالات معقدة.

يخشى الناشرون عبر الإنترنت من احتمال إغراق محتوى الذكاء الاصطناعي بنتائج البحث ، ليحل محل مقالات الخبراء التي كتبها البشر.

لذلك ، فإن الأخبار الخاصة بميزة العلامة المائية التي تفتح قفل الكشف عن المحتوى الذي تم إنشاؤه بواسطة ChatGPT تنتظر أيضًا بقلق وأمل.

علامة مائية مشفرة

العلامة المائية هي علامة شبه شفافة (شعار أو نص) مضمنة في صورة. تشير العلامة المائية إلى المؤلف الأصلي للعمل.

يظهر على نطاق واسع في الصور وبشكل متزايد في مقاطع الفيديو.

تتضمن العلامة المائية للنص في ChatGPT التشفير في شكل تضمين نمط من الكلمات والحروف وعلامات الترقيم في شكل رمز سري.

سكوت آرونسون وعلامة ChatGPT المائية

تم تعيين عالم كمبيوتر مؤثر يدعى سكوت آرونسون من قبل شركة OpenAI في يونيو 2022 للعمل على أمن ومواءمة الذكاء الاصطناعي.

أمن الذكاء الاصطناعي هو مجال بحث يهتم بدراسة الطرق التي يمكن أن يضر بها الذكاء الاصطناعي بالبشر وخلق طرق لمنع هذا النوع من الاضطراب السلبي.

المجلة العلمية Disstill ، مع المؤلفين المنتسبين إلى OpenAI ، يحدد أمن الذكاء الاصطناعي هكذا:

“الهدف طويل المدى لأمن الذكاء الاصطناعي (AI) هو ضمان أن أنظمة الذكاء الاصطناعي المتقدمة تتوافق بشكل موثوق مع القيم الإنسانية – أنها تقوم بالأشياء التي يريدها الناس بشكل موثوق.”

محاذاة الذكاء الاصطناعي هي مجال الذكاء الاصطناعي الذي يهدف إلى ضمان توافق الذكاء الاصطناعي مع الأهداف المقصودة.

يمكن استخدام نموذج لغة كبير (LLM) مثل ChatGPT بطرق قد تتعارض مع الغرض من محاذاة AI على النحو المحدد بواسطة OpenAIوهو إنشاء ذكاء اصطناعي يعود بالفائدة على البشرية.

وفقًا لذلك ، فإن سبب العلامة المائية هو منع إساءة استخدام الذكاء الاصطناعي بطريقة تضر بالبشرية.

أوضح آرونسون سبب العلامة المائية لإخراج ChatGPT:

“قد يكون من المفيد منع الانتحال الأكاديمي ، ولكن أيضًا ، على سبيل المثال ، جيل الدعاية الجماهيري …”

كيف تعمل العلامة المائية ChatGPT؟

العلامة المائية ChatGPT عبارة عن نظام يتضمن نموذجًا إحصائيًا ورمزًا في اختيار الكلمات وحتى علامات الترقيم.

يتم إنشاء المحتوى الذي تم إنشاؤه بواسطة AI بنمط يمكن التنبؤ به إلى حد ما من اختيار الكلمات.

تتبع الكلمات التي كتبها البشر والذكاء الاصطناعي نمطًا إحصائيًا.

يعد تغيير نمط الكلمات المستخدمة في المحتوى الذي تم إنشاؤه طريقة لوضع “علامة مائية” على نص للسماح للنظام بالكشف بسهولة عما إذا كان نتاجًا لمولد نص AI.

الحيلة التي تجعل العلامة المائية لمحتوى AI غير قابلة للكشف هي أن توزيع الكلمات لا يزال له مظهر عشوائي مشابه للنص العادي الذي تم إنشاؤه بواسطة AI.

يسمى هذا التوزيع العشوائي الزائف للكلمات.

العشوائية الزائفة هي سلسلة عشوائية من الكلمات أو الأرقام ليست عشوائية في الواقع.

العلامة المائية ChatGPT غير مستخدمة حاليًا. ومع ذلك ، صرح سكوت آرونسون من OpenAI علانية أن هذا كان مخططًا له.

حاليًا ، ChatGPT قيد المعاينة ، مما يسمح لـ OpenAI باكتشاف “المحاذاة الخاطئة” من خلال استخدام العالم الحقيقي.

يمكن افتراض أن العلامة المائية قد يتم تقديمها في إصدار نهائي من ChatGPT أو قبل ذلك.

سكوت آرونسون كتب حول كيفية عمل العلامة المائية:

“كان مشروعي الرئيسي حتى الآن أداة لوضع العلامات المائية الإحصائية على مخرجات نموذج نصي مثل GPT.

في الأساس ، عندما تُنشئ GPT نصًا طويلاً ، نريد أن تكون هناك إشارة سرية غير محسوسة في اختيارات الكلمات الخاصة بها ، والتي يمكنك استخدامها لإثبات ذلك لاحقًا ، نعم ، من GPT.

أوضح آرونسون بمزيد من التفصيل كيفية عمل العلامة المائية ChatGPT. لكن أولاً ، من المهم فهم مفهوم الترميز.

الترميز هو خطوة تحدث في معالجة اللغة الطبيعية حيث تأخذ الآلة الكلمات من مستند وتقسيمها إلى وحدات دلالية مثل الكلمات والجمل.

يعمل الترميز على تحويل النص إلى نموذج منظم يمكن استخدامه في التعلم الآلي.

عملية إنشاء النص هي الآلة التي تخمن الرمز المميز الذي يأتي بعد ذلك بناءً على الرمز المميز السابق.

يتم ذلك باستخدام دالة رياضية تحدد احتمالية ما سيكون الرمز المميز التالي ، وهو ما يسمى توزيع الاحتمالات.

الكلمة التالية متوقعة لكنها عشوائية.

العلامة المائية نفسها هي ما يصفه آرون بأنه شبه عشوائي ، حيث يوجد سبب رياضي لكلمة معينة أو علامة ترقيم ، لكنها لا تزال عشوائية إحصائيًا.

هذا هو الشرح الفني للعلامة المائية GPT:

“بالنسبة إلى GPT ، يكون كل إدخال وإخراج عبارة عن سلسلة من الرموز المميزة ، والتي يمكن أن تكون كلمات ولكن أيضًا علامات ترقيم أو أجزاء من الكلمات أو أكثر – هناك حوالي 100000 رمز في المجموع.

في جوهرها ، تنشئ GPT باستمرار توزيعًا احتماليًا على الرمز المميز التالي الذي سيتم إنشاؤه ، بناءً على سلسلة الرموز المميزة السابقة.

بمجرد إنشاء الشبكة العصبية للتوزيع ، يقوم خادم OpenAI بعد ذلك بأخذ عينات من رمز بناءً على هذا التوزيع أو نسخة معدلة من التوزيع ، بناءً على معلمة تسمى “درجة الحرارة”.

طالما أن درجة الحرارة غير صفرية ، فعادة ما يكون هناك بعض العشوائية في اختيار الرمز المميز التالي: يمكنك تشغيله مرارًا وتكرارًا بنفس الموجه والحصول على إكمال مختلف (أي سلسلة من الرموز المميزة للإخراج) في كل مرة . .

لذلك بالنسبة للعلامة المائية ، بدلاً من اختيار الرمز التالي عشوائيًا ، ستكون الفكرة هي تحديده بشكل شبه عشوائي ، باستخدام وظيفة تشفير عشوائية زائفة ، ومفتاحها معروف فقط لـ OpenAI.

تبدو العلامة المائية طبيعية تمامًا لمن يقرؤون النص لأن اختيار الكلمات يحاكي عشوائية كل الكلمات الأخرى.

لكن هذه العشوائية تحتوي على تحيز لا يمكن اكتشافه إلا من قبل شخص لديه مفتاح فك تشفيرها.

هذا هو الشرح الفني:

“للتوضيح ، في الحالة الخاصة حيث كان لدى GPT مجموعة من الرموز الممكنة التي تعتبرها محتملة بنفس القدر ، يمكنك ببساطة اختيار الرمز المميز لتعظيم g. قد يبدو الاختيار عشوائيًا بشكل موحد لشخص لا يعرف المفتاح ، ولكن شخص واحد من عرف المفتاح يمكنه لاحقًا إضافة g على جميع n-grams ويرى أنه كان كبيرًا بشكل غير طبيعي.

العلامة المائية هي حل يركز على الخصوصية

لقد رأيت موضوعات على وسائل التواصل الاجتماعي حيث اقترح بعض الأشخاص أن OpenAI يمكن أن تحتفظ بسجل لكل ناتج تولده وتستخدمه للكشف.

يؤكد سكوت آرونسون أن شركة OpenAI يمكنها القيام بذلك ، ولكن هناك مشكلة تتعلق بالخصوصية. الاستثناء المحتمل هو حالة إنفاذ القانون ، التي لم يوضحها بالتفصيل.

كيفية اكتشاف علامة ChatGPT أو GPT المائية

هناك شيء مثير للاهتمام لا يبدو معروفًا جيدًا حتى الآن وهو أن سكوت آرونسون أشار إلى أن هناك طريقة للتغلب على العلامة المائية.

لم يقل أنه كان المستطاع للتغلب على العلامة المائية ، قال يمكن أن هزم.

“الآن يمكن التغلب على كل هذا بجهد كافٍ.

على سبيل المثال ، إذا استخدمت ذكاءً اصطناعيًا آخر لإعادة صياغة ناتج GPT ، حسنًا ، فلن نتمكن من اكتشاف ذلك. »

يبدو أن العلامة المائية يمكن هزيمتها ، على الأقل اعتبارًا من نوفمبر ، عندما تم الإدلاء بالبيانات أعلاه.

لا يوجد ما يشير إلى أن العلامة المائية قيد الاستخدام حاليًا. ولكن عندما تدخل الخدمة ، قد لا يكون معروفًا ما إذا كانت هذه الثغرة قد تم إغلاقها.

يقتبس

اقرأ سكوت آرونسون مشاركة مدونة هنا.

صورة مميزة بواسطة Shutterstock / RealPeopleStudio


#كيف #تعمل #علامة #ChatGPT #المائية #ولماذا #يمكن #التغلب #عليها

المصدر

reaction:

تعليقات