ليس كل "محايد" موضوعي: عن بحثنا االمشترك مع "إنفوتايمز" حول تحليلالنماذج اللغوية الكبيرة للمشاعر في عناوين الإعلام العربي

‍ ‍

في الثامن والعشرين من فبراير 2026، نشرنا ورقة بحثية أكاديمية بعنوان "تصنيف مشاعر عناوين حرب غزة: دراسة مقارنة بين النماذج اللغوية الكبيرة ونماذج BERT العربية المضبوطة دقيقًا".

‍ ‍

هذه الورقة هي أول المخرجات الأكاديمية للشراكة البحثية بين "أنماط" وإنفوتايمز.

‍ ‍

الورقة متاحة على منصة SSRN، وقاعدة البيانات التي بُنيت عليها منشورة مفتوحة المصدر على Harvard Dataverse.

‍ ‍

لم يكن هذا مجرد نشر بحثي. كان قرارًا عن الهوية: من نحن في "أنماط"، وماذا نريد أن نقول للمجتمع العلمي والصحفي معًا.

‍ ‍

لماذا النشر الأكاديمي؟

‍ ‍

الجواب البسيط: لأن ما نفعله يقع بالضبط عند هذا التقاطع. نحن نستخدم علوم البيانات والتعلم الآلي لتحليل الخطاب الإعلامي. هذا التقاطع تحديدًا هو ما جمع "أنماط" وإنفوتايمزفي هذه الشراكة.

‍ ‍

ما يجمعنا أعمق من التكامل التقني. هناك اهتمام مشترك بسؤال نادرًا ما يُطرح بالعربي بأدلة رياضية: كيف تبني المؤسسات الإعلامية فهمنا للواقع؟ وكيف تتشكّل السرديات حول الأحداث الكبرى؟ هذا السؤال يكتسب أهمية خاصة في لحظة تمر فيها منطقتنا وأجزاء واسعة من الجنوب العالمي بحروب وأحداث محورية ودقيقة. وندرك أن الأثر الحقيقي لهذا العمل يتضاعف حين نعمل شركاء لا منافسين.

‍ ‍

هذا عمل يستحق أن يُختبر بمعايير البحث العلمي، لا أن يُقدَّم فقط كمنتج أو تقرير. كثير من الأبحاث التي تدرس الإعلام العربي تصدر من مؤسسات غربية، وبمنهجيات لم تُصمَّم للغة العربية ولا لسياقاتها. نحن هنا، نعيش هذه السياقات، ونبني أدوات خُصِّصت لها. النشر الأكاديمي هو أحد أوجه تثبيت هذا العمل في المحادثة العلمية العالمية بصوت عربي.

‍ ‍

ما الذي وجدناه؟

‍ ‍

في إطار هذا التعاون، حلّلنا معًا كيف تختلف نماذج الذكاء الاصطناعي في تصنيف مشاعر 10,990 عنوانًا إخباريًا عربيًا عن حرب غزة 2023. حلّلنا ستة نماذج BERT عربية مضبوطة ومتخصصة، وثلاثة نماذج لغوية كبيرة عامة.

‍ ‍

النتائج كانت صريحة:

‍ ‍

نماذج BERT العربية، وخاصة MARBERT، تميل بقوة نحو تصنيف "محايد". هذا الحياد ليس موضوعية، بل حذر تقييمي مبني في بنية النموذج نفسه.

‍ ‍

في المقابل، تميل النماذج اللغوية الكبيرة بشكل منهجي نحو تصعيد السلبية. ووصل هذا إلى أقصاه في نموذج LLaMA-3.1-8B الذي صنّف شبه كل شيء ضمن الفئة السلبية.

‍ ‍

GPT-4.1 كان استثناءً جزئيًا: أظهر قدرة أعلى على مواءمة حكمه مع إطار العنوان السردي، سواء كان إنسانيًا أو قانونيًا أو أمنيًا أو سياسيًا.

‍ ‍

الاستنتاج الأساسي للورقة: اختيار نموذج تحليل المشاعر ليس قرارًا تقنيًا محايدًا. هو اختيار لعدسة تفسيرية تعيد تشكيل كيف نقرأ الخطاب الإعلامي للحروب والنزاعات.

‍ ‍

لماذا يهم هذا في المنطقة العربية تحديدًا؟

‍ ‍

لأن مؤسسات إعلامية وأبحاثية كثيرة في المنطقة بدأت تعتمد على هذه الأدوات دون أن تسأل: ما الذي تفترضه هذه الأدوات أصلًا؟

‍ ‍

حين يُستخدَم نموذج مدرَّب على بيانات إنجليزية في الغالب لتحليل عناوين عربية عن النزاعات، فالنتائج ليست "موضوعية". هي انعكاس لما تعلّمه النموذج عن العالم، وهو عالم يختلف كثيرًا عن عالمنا.

‍ ‍

هذا ليس رفضًا للأدوات، بل دعوة لاستخدامها بوعي نقدي. وهذا تحديدًا ما تريد كل من "أنماط" و"إنفوتايمز" المساهمة فيه: بناء منهجية للتعامل مع الذكاء الاصطناعي في السياق الإعلامي العربي، لا استيراد منهجيات جاهزة.

‍ ‍

قاعدة البيانات مفتوحة للجميع

‍ ‍

قرار نشر الـ dataset على Harvard Dataverse مفتوحًا ومجانيًا لم يكن تفصيلة هامشية. هو موقف من كيف يجب أن يُبنى العلم في مجالنا. هذا القرار كان مشتركًا بين الفريقين منذ البداية.

‍ ‍

أي باحث أو صحفي أو فريق يريد العمل على 10,990 عنوانًا إخباريًا عربيًا مصنّفًا عن غزة يستطيع ذلك الآن. يمكن اختبار المنهجية، تطويرها، أو مقارنتها بسياقات أخرى. هذا ما نعنيه بالبحث الذي يخدم المجتمع لا فقط يُنشَر فيه.

‍ ‍

يضيف فريق إنفوتايمز: البيانات التي بُني عليها البحث جُمعت باستخدام NewsScope، أداة ذكاء صحفي طورتها إنفوتايمز، تتيح البحث في أي موضوع إخباري والحصول على تحليلات فورية وتصنيف مشاعر. استخدامها في جمع 10,990 عنوانًا إخباريًا عربيًا لم يكن مجرد خطوة تقنية، بل كان الأساس الذي أتاح إجراء هذه المقارنة على نطاق واسع.

‍ ‍

‍ ‍

يصيغ فريق إنفوتايمز أهمية هذا البحث وهذا المسار المشترك مع أنماط،  هو  الإشارة بوضوح إلى رؤية هذه الأدوات التي نستخدمها يومياً لواقعنا، وكيف تتعامل مع أحداث بحساسية وتعقيد حرب كحرب غزة وما ينتجه الإعلام العربي من سرديات تخصها.

‍ ‍

ما التالي؟

‍ ‍

هذه الورقة جزء من الشراكة البحثية بين "أنماط" وإنفوتايمز، وتمثل خطوة أولى في مسار أطول لتوثيق عمل التحليل الحوسبي للإعلام العربي بمعايير أكاديمية. نعمل على تطوير هذا الإطار ليشمل أسئلة أعمق عن الإطار السردي، وليمتد إلى سياقات نزاعات عربية أخرى.

‍ ‍

إنفوتايمز شركة متخصصة في الربط بين الإعلام والتكنولوجيا، تعمل على إنتاج حلول وتطبيقات تهدف إلى تفسير الأخبار وتكييفها وتوطينها، و"أنماط" هي مبادرة تجمع بين  علوم البيانات والصحافة البحث العلمي لابتكار منهجيات وأدوات تعمل على تحليل التأطير في السرديات المختلفة، وأهمها الإعلامية، لفهم واقعنا وإمداد الأفراد والصحفيون والباحثون في الجنوب العالمي الأدوات اللازمة لفهمه.

‍ ‍

إن كنت باحثًا أو صحفيًا يعمل على أسئلة مماثلة، نريد أن نسمع منك.

‍ ‍

الورقة متاحة على SSRN. قاعدة البيانات متاحة على Harvard Dataverse.

Previous
Previous

Not All "Neutral" Is Objective: Our Joint Research with InfoTimes on How Large Language Models Analyze Sentiment in Arabic Media Headlines

Next
Next

في التقاطع بين التكنولوجيا والذكاء الاصطناعي والصحافة الاستقصائية: دروس من GIJC 2025