القائمة الرئيسية

الصفحات

تجميع الكلمات الدلالية لأكثر من 10000 كلمة رئيسية [With Script]

يمكن أن تساعد مجموعات الكلمات الرئيسية الدلالية في نقل البحث عن الكلمات الرئيسية إلى المستوى التالي.

في هذه المقالة ، ستتعلم كيفية استخدام ورقة Google Colaboratory التي يتم مشاركتها حصريًا مع قراء مجلة محرك البحث.

ستوجهك هذه المقالة خلال استخدام ورقة Google Colab ، ولمحة عامة عن كيفية عملها تحت الغطاء ، وكيفية إجراء تعديلات بناءً على احتياجاتك.

لكن أولا، لماذا الكلمات الرئيسية المجموعة على الإطلاق؟

حالات الاستخدام الشائعة لتجميع الكلمات الأساسية

فيما يلي بعض حالات الاستخدام لتجميع الكلمات الرئيسية.

بحث أسرع عن الكلمات الرئيسية:

  • منقي الكلمات الرئيسية للعلامة التجارية أو كلمات مفتاحية ليس لها قيمة تجارية.
  • قم بتجميع الكلمات الأساسية ذات الصلة معًا لإنشاء المزيد من المقالات المتعمقة.
  • قم بتجميع الأسئلة والأجوبة ذات الصلة معًا لإنشاء الأسئلة الشائعة.

حملات البحث المدفوعة:

  • لنصنع او لنبتكر كلمة رئيسية سلبية قوائم للإعلانات التي تستخدم مجموعات بيانات كبيرة بشكل أسرع – توقف عن إهدار الأموال على الكلمات الرئيسية غير المرغوب فيها!
  • جمِّع الكلمات الرئيسية المتشابهة في أفكار حملة للإعلانات.

فيما يلي مثال على نص برمجي يجمع أسئلة متشابهة ، وهو مثالي لمقال متعمق!

مجموعات من الكلمات الرئيسية مجمعة في جداول اكسللقطة شاشة لبرنامج Microsoft Excel ، فبراير 2022

مشاكل الإصدارات السابقة من هذه الأداة

إذا تابعت عملي على Twitter ، فستعرف أنني أقوم بتجربة تجميع الكلمات الرئيسية لبعض الوقت الآن.

الإصدارات السابقة من هذا البرنامج النصي كانت مبنية على الامتياز مكتبة PolyFuzzComment استخدام مراسلات TF-IDF.

أثناء تنفيذ العمل ، كانت هناك دائمًا مجموعات من الخدوش التي اعتقدت أنه يمكن تحسين النتيجة الأصلية عليها.

سيتم تجميع الكلمات التي تشترك في نمط حرف مماثل معًا حتى لو لم تكن مرتبطة بشكل دلالي.

على سبيل المثال ، لم يكن قادرًا على تجميع كلمات مثل “دراجة” مع “دراجة”.

كانت الإصدارات السابقة من البرنامج النصي بها مشكلات أخرى أيضًا:

  • لم تنجح بشكل جيد في لغات أخرى غير الإنجليزية.
  • أدى هذا إلى إنشاء عدد كبير من المجموعات التي لا يمكن تجميعها معًا.
  • لم يكن هناك الكثير من التحكم في كيفية إنشاء المجموعات.
  • اقتصر النص على حوالي 10000 سطر قبل أن تنتهي مهلته بسبب نقص الموارد.

التجميع الدلالي للكلمات الرئيسية باستخدام معالجة اللغة الطبيعية للتعلم العميق (NLP)

تقدم سريعًا لمدة أربعة أشهر إلى الإصدار الأحدث الذي تمت إعادة كتابته بالكامل لاستخدام أحدث تكامل عبارات التعلم العميق.

اكتشف بعض هذه المجموعات الدلالية الرائعة!

لاحظ كيف يتم تضمين السخونة والحرارة والدفء في نفس مجموعة الكلمات الرئيسية؟

ورقة إكسل تظهر مثالاً على تجميع الكلمات الرئيسية الدلاليةلقطة شاشة لبرنامج Microsoft Excel ، فبراير 2022

أو ماذا عن البيع بالجملة والبيع بالجملة؟

ورقة إكسل تعرض مثالًا آخر لتجميع الكلمات الرئيسية الدلاليةلقطة شاشة لبرنامج Microsoft Excel ، فبراير 2022

الكلب والكلب الألماني ، عيد الميلاد وعيد الميلاد؟

ورقة إكسل تعرض مثالاً آخر لتجميع الكلمات المفتاحية الدلالية.  تبين أن الكلب الألماني والكلاب قد تم تجميعهما معًا.لقطة شاشة لبرنامج Microsoft Excel ، فبراير 2022

يمكنه حتى تجميع الكلمات الرئيسية بأكثر من مائة لغة مختلفة!

ورقة إكسل تعرض مثالًا آخر على التجميع الدلالي للكلمات الرئيسية باللغة الفرنسيةلقطة شاشة لبرنامج Microsoft Excel ، فبراير 2022

ميزات البرنامج النصي الجديد مقارنة بالتكرارات السابقة

بالإضافة إلى الكلمات الدلالية الدلالية التجميع ، تمت إضافة التحسينات التالية إلى أحدث إصدار من هذا البرنامج النصي.

  • دعم لتجميع أكثر من 10000 كلمة رئيسية في وقت واحد.
  • تقليل مجموعات المجموعات المفقودة.
  • القدرة على اختيار نماذج مختلفة مدربة مسبقًا (على الرغم من أن النموذج الافتراضي يعمل بشكل جيد!).
  • القدرة على اختيار مدى ارتباط المجموعات بشكل وثيق.
  • اختيار الحد الأدنى من عدد الكلمات الرئيسية لاستخدامها في كل مجموعة.
  • الكشف التلقائي عن ترميز الأحرف ومحددات CSV.
  • التجمع متعدد اللغات.
  • يعمل مع العديد من عمليات تصدير الكلمات الرئيسية الشائعة خارج الصندوق. (بيانات Search Console أو AdWords أو أدوات الكلمات الرئيسية لجهات خارجية مثل Ahrefs و Semrush).
  • يعمل مع أي ملف CSV بعمود يسمى “Keyword”.
  • سهل الاستخدام (يعمل البرنامج النصي عن طريق إدراج عمود جديد يسمى Cluster Name في أي قائمة كلمات رئيسية تم تحميلها).

كيفية استخدام البرنامج النصي المكون من خمس خطوات (البدء السريع)

للبدء ، سوف تحتاج اضغط على هذا الرابطثم اختر خيار فتح في كولاب كما هو موضح أدناه.

كيفية فتح Google Colab من Githubلقطة شاشة من Google Colaboratory ، فبراير 2022

قم بتغيير نوع التنفيذ إلى GPU عن طريق التحديد مدة > تغيير نوع التنفيذ.

Google Collab ، كيفية تغيير الإعدادات لاستخدام GPUلقطة شاشة من Google Colaboratory ، فبراير 2022

لتحديد مدة > يهرب كل ذلك من شريط التنقل العلوي في Google Colaboratory (أو اضغط فقط على Ctrl + F9).

كيفية تشغيل جميع الخلايا في Google Colabلقطة شاشة من Google Colaboratory ، فبراير 2022

قم بتحميل ملف .csv يحتوي على عمود يسمى “Keyword” عندما يُطلب منك ذلك.

كيفية تحميل ملف باستخدام Google Colabلقطة شاشة من Google Colaboratory ، فبراير 2022

يجب أن يكون التجميع سريعًا جدًا ، ولكنه يعتمد في النهاية على عدد الكلمات الرئيسية والنموذج المستخدم.

بشكل عام ، يجب أن تكون جيدًا عند استخدام 50000 كلمة رئيسية.

إذا رأيت خطأ نفاد الذاكرة في Cuda ، فأنت تحاول تجميع عدد كبير جدًا من الكلمات الرئيسية في وقت واحد!

(تجدر الإشارة إلى أنه يمكن بسهولة تكييف هذا البرنامج النصي ليتم تشغيله على جهاز محلي دون قيود Google Colaboratory.)

إخراج البرنامج النصي

سيتم تشغيل البرنامج النصي وإضافة مجموعات إلى ملفك الأصلي في عمود جديد يسمى Cluster Name.

يتم تعيين أسماء المجموعات باستخدام أقصر كلمة أساسية في المجموعة.

على سبيل المثال ، تم تعيين اسم المجموعة لمجموعة الكلمات الرئيسية التالية على “alpaca socks” لأن هذه هي أقصر كلمة رئيسية في المجموعة.

عرض توضيحي لنموذج نصي يُظهر أن جوارب الألبكة قد تم تجميعها معًا لقطة شاشة لبرنامج Microsoft Excel ، فبراير 2022

عند اكتمال التجميع ، يتم حفظ ملف جديد تلقائيًا ، مع إلحاق مجموعة في عمود جديد بالملف الأصلي.

كيف تعمل أداة Key Clustering Tool

يعتمد هذا البرنامج النصي على ملف خوارزمية التجميع السريع ويستخدم النماذج التي تم تدريبها مسبقًا على نطاق واسع على كميات كبيرة من البيانات.

هذا يسهل حساب العلاقات الدلالية بين الكلمات الرئيسية باستخدام نماذج جاهزة للاستخدام.

(ليس عليك أن تكون عالم بيانات لتستخدمه!)

في الواقع ، بينما جعلته قابلاً للتخصيص لأولئك الذين يحبون العبث والتجربة ، اخترت الإعدادات الافتراضية المتوازنة التي يجب أن تكون معقولة لمعظم حالات الاستخدام.

يمكن تبديل الأنماط المختلفة داخل البرنامج النصي وخارجه حسب الحاجة (تجميع أسرع ، دعم متعدد اللغات أفضل ، أداء دلالي أفضل ، إلخ).

بعد إجراء اختبارات مكثفة ، وجدت التوازن المثالي بين السرعة والدقة باستخدام محول All-MiniLM-L6-v2 الذي يوفر توازنًا ممتازًا بين السرعة والدقة.

إذا كنت تفضل استخدام النموذج الخاص بك ، فيمكنك فقط التجربة ، يمكنك استبدال النموذج الحالي المدرب مسبقًا بأحد النماذج المدرجة هنا أو على تعانق وجه نموذج المحور.

استبدال النماذج المدربة مسبقًا

تعد تبديل الأنماط أمرًا بسيطًا مثل استبدال المتغير باسم المحول المفضل لديك.

على سبيل المثال ، يمكنك تغيير القالب الافتراضي all-miniLM-L6-v2 إلى all-mpnet-base-v2 عن طريق تعديل:

محول = ‘all-miniLM-L6-v2’

الى

محول = ‘جميع mpnet- قاعدة- v2.0.0-mod.apk

هنا حيث يمكنك تحريره في ورقة Google Colaboratory.

كيفية اختيار محول عبارة لتجميع الكلمات الرئيسيةلقطة شاشة من Google Colaboratory ، فبراير 2022

المفاضلة بين دقة الكتلة وعدم وجود مجموعات عنقودية

الشكوى الشائعة مع التكرارات السابقة لهذا النص هي أنه أدى إلى عدد كبير من النتائج غير المجمعة.

لسوء الحظ ، سيكون هذا دائمًا بمثابة توازن بين دقة الكتلة وعدد الكتلة.

سيؤدي إعداد دقة المجموعة الأعلى إلى عدد أكبر من النتائج غير المجمعة.

يمكن أن يؤثر متغيرين بشكل مباشر على حجم ودقة جميع المجموعات:

min_cluster_size

و

دقة الكتلة

لقد قمت بتعيين قيمة افتراضية 85 (/ 100) لدقة الكتلة والحد الأدنى لحجم الكتلة من 2.

أثناء الاختبار ، وجدت أن هذا هو المكان المناسب ، لكن لا تتردد في التجربة!

هنا مكان تعيين هذه المتغيرات في البرنامج النصي.

كيفية تعيين الحد الأدنى لحجم العبارة ودقة مجموعة الكلمات الرئيسيةلقطة شاشة من Google Colaboratory ، فبراير 2022

هذا هو! آمل أن يكون هذا البرنامج النصي لتجميع الكلمات الرئيسية مفيدًا لعملك.

المزيد من الموارد:


صورة مميزة: Grid Graph / Shutterstock


#تجميع #الكلمات #الدلالية #لأكثر #من #كلمة #رئيسية #Script

المصدر

reaction:

تعليقات