الـ Emojis تعيق عمالقة التكنولوجيا من تعقب الإساءة عبر الإنترنت

الـ Emojis تعيق عمالقة التكنولوجيا من تعقب الإساءة عبر الإنترنت

تشير دراسة جديدة لمعهد أكسفورد للإنترنت إلى أنه يصعب تحديد المنشورات المسيئة عبر الإنترنت إذا كانت تحتوي على Emojis (رموز تعبيرية).

متابعة: ماريا نصور

بعض الخوارزميات المصممة لتعقب المحتوى الذي يحض على الكراهية ليست فعالة عند استخدام هذه الرموز.

بعد خسارة إنكلترا في نهائي بطولة أوروبا 2020، تلقى Marcus Rashford و Bukayo Saka و Jadon Sancho سيلاً من الإساءات العنصرية على وسائل التواصل الاجتماعي، والعديد من الرموز التعبيرية للقرود.

بداية الدوري الإنكليزي يجلب مخاوف من أن المزيد من هذا النوع من الإساءات سيستمر  ما لم تتمكن شركات وسائل التواصل الاجتماعي من تصفية هذا المحتوى بشكل أفضل.

يتم تدريب العديد من الأنظمة المستخدمة حالياً على قواعد بيانات كبيرة من النصوص. و التي نادراً ما تحتوي على الEmojis.

أظهر تحليل Sky News أن حسابات Instagram التي نشرت إساءات عنصرية وكانت تحتوي على رموز تعبيرية كانت أقل عرضة للإغلاق بثلاث مرات، مقارنةً بتلك التي تنشر رسائل كراهية تحتوي فقط على نص.
للمساعدة في معالجة هذه المشكلة، أنشأ الباحثون قاعدة بيانات تضم ما يقرب من 4000 جملة. و معظمها اشتملت على استخدام الرموز التعبيرية بشكل عدواني.

تم استخدام قاعدة البيانات هذه لتدريب نموذج ذكاء اصطناعي لفهم الرسائل التي كانت مسيئة وغير مسيئة.

اختبر الباحثون النموذج على المنشورات السيئة المتعلقة بالعرق والجنس والهوية الجنسية والدين والإعاقة.

كما قاموا بفحص الطرق المختلفة التي يمكن من خلالها استخدام الرموز التعبيرية بشكل عدواني. وشمل ذلك وصف المجموعات بواسطة Emoji علم قوس قزح لتمثيل المثليين، على سبيل المثال، وإضافة نص بغيض.

كان Perspective API، وهو مشروع تدعمه Google يقدم برنامجاً مصمماً للتعرف على خطاب الكراهية. لكنه فعال بنسبة 14٪ فقط في التعرف على التعليقات البغيضة من هذا النوع في قاعدة البيانات.

تُستخدم هذه الأداة على نطاق واسع، وتعالج حالياً أكثر من 500 مليون طلب يومياً.

حقق نموذج الباحثين تحسناً يقارب 30٪ في تحديد المحتوى البغيض وغير البغيض بشكل صحيح. وتحسناً يصل إلى 80٪ فيما يتعلق ببعض أنواع الإساءة القائمة على الEmojis.

لكن حتى هذه التكنولوجيا لن تثبت فعاليتها الكاملة. قد تكون العديد من التعليقات بغيضة فقط في سياقات معينة.

الاستخدام المتطور للغة والـ Emojis يجعل هذه المهمة أكثر صعوبة.

و التصنيف غير الصحيح للمحتوى غير الباعث على الكراهية له جوانب سلبية كبيرة. قالت هانا روز كيرك المؤلفة الرئيسية لبحوث أكسفورد:

“الإيجابيات الكاذبة تخاطر بإسكات أصوات الأقليات”.

أصبح حل المشكلة أكثر صعوبة بسبب حقيقة أن شركات وسائل التواصل الاجتماعي تميل إلى حماية برامجها وبياناتها بإحكام ، مما يعني أن النماذج التي تستخدمها غير متاحة للتدقيق.

وأضافت كيرك: “يمكن عمل المزيد للحفاظ على أمان الأشخاص على الإنترنت، ولا سيما الأشخاص من المجتمعات المهمشة بالفعل”.

يشارك باحثو أكسفورد قاعدة بياناتهم عبر الإنترنت، مما يمكّن الأكاديميين والشركات الأخرى من استخدامها لتحسين نماذجهم الخاصة.

نأمل أن بصيح الانترنت أقل بغضاً…

اقرأ أكثر: قراصنة الانترنت يسرقون 600 مليون دولار في عملية سرقة للعملات المشفرة