ما هو نموذج R1 OMNI الجديد من علي بابا؟

أطلقت شركة “علي بابا” (Alibaba) نموذج ذكاء اصطناعي يمكنه قراءة مشاعر البشر، يدعى نموذج R1OMNI، وذلك في خطوة تهدف إلى التفوق على أحدث نماذج شركة “أوبن إيه آي” OpenAI الأمريكية.

ونستعرض خلال السطور التالية كل ما يخص نموذج R1 OMNI الجديد من على بابا.

نموذج R1 OMNI الجديد

استعرض باحثون في مختبر “تونجي” التابع للشركة الصينية نموذجهم مفتوح المصدر نموذج R1OMNI الجديد، الذي يمكنه استنتاج مشاعر الشخص من ملامح وجهه خلال مقطع فيديو، بالإضافة إلى وصف ملابسه وبيئته المحيطة، بحسب “بلومبرج”.

ويضيف هذا النموذج بُعداً جديداً لفهم الرؤية الحاسوبية، وهو نسخة محسّنة من نموذج مفتوح المصدر آخر يُدعى HumanOmni، الذي طوّره الباحث الرئيسي نفسه، جياشينج تشاو.

كيف يعمل نموذج R1 OMNI؟

في سياق متصل، يعتمد نموذج R1 OMNI من شركة Alibaba على تقنية التعلم المعزز مع المكافأة القابلة للتحقق (RLVR)، وهو نموذج ذكاء اصطناعي متعدد الوسائط قادر على فهم المشاعر البشرية من خلال تحليل الصور، والفيديو، والصوت.

ويعمل هذا النموذج على تحسين 3 جوانب رئيسية في التعرف على المشاعر، وهي التفسير، إذ يساعد في فهم المشاعر بناء على إشارات مرئية وصوتية بدقة من خلال تقديم نتائج أكثر موثوقية مقارنة بالنماذج السابقة.

درَّب الفريق البحثي النموذج الجديد على مقاطع فيديو واقعية، حيث خضع في مراحله الأولى لتدريب مكثف على 580 مقطع فيديو من مجموعتَي بيانات رئيسيتين؛ الأولى هي Explainable Multimodal Emotion Reasoning (EMER) التي تركز على شرح كيفية اشتقاق المشاعر، أما الثانية فهي HumanOmni والتي تحتوي على بيانات مصنفة يدوياً للمشاعر.

شركة علي بابا

وجاء جزء من تجربة لمقطع فيديو حيث يتم تحليل مشاعر البشر داخله بواسطة نموذج علي بابا الذكي R1 Omni – Alibaba. بعد ذلك، دخل النموذج مرحلة تدريب متقدمة باستخدام RLVR، حيث استفاد من نظام مكافآت ذكي يعزز دقته، مثل مكافآت الدقة (R_acc) لضمان التنبؤ الصحيح بالمشاعر، ومكافآت التنسيق (R_format) للحفاظ على إجابات منظمة وسهلة الفهم.

كما تم اختبار نموذج R1 OMNI على مقطع فيديو يظهر فيه مشهد لشارع هادئ حيث تقف امرأة شابة ترتدي سترة دافئة، وتنظر للأسفل بتفكير واضح، وأظهر التحليل الذي أجراه النموذج أن تعابير وجهها تتغير تدريجياً من الارتباك والدهشة إلى الغضب البسيط، مما يعكس تحولاً عاطفياً تدريجياً.

وقدَّم النموذج وصفاً تفصيلياً للمشهد، موضحاً أن تعابير الوجه والتغيرات الصوتية تدل على حالة داخلية من التوتر والتفكير المعمق، وفي النهاية، صنَّف النموذج المشاعر الأساسية في المشهد على أنها “الدهشة”، بينما كان التصنيف الحقيقي وفقاً لمراجعي البيانات “محايداً”، وجزء من تجربة لمقطع فيديو حيث يتم تحليل مشاعر البشر داخله بواسطة نموذج علي بابا الذكي R1-Omni – Alibaba

ويعكس هذا التباين بين تصنيف النموذج والتصنيف البشري بعض التحديات التي تواجه نماذج الذكاء الاصطناعي في فهم المشاعر الدقيقة، خاصة عندما تكون الإشارات العاطفية غير واضحة أو متناقضة.

ومع ذلك، فإن قدرة النموذج على تحليل المشاعر بناء على إشارات مرئية وصوتية متعددة تجعله خطوة مهمة نحو تطوير أنظمة ذكاء اصطناعي أكثر ذكاء ووعياً بالسياق العاطفي البشري.

خطوات منظمة في نموذج R1 OMNI

وتسعى Alibaba لتعزيز مكانتها في مجال الذكاء الاصطناعي، خاصة بعد الظهور البارز لشركة “ديب سيك” (DeepSeek) في يناير الماضي.

وتعمل الشركة الرائدة في التجارة الإلكترونية حالياً على إصدار أدوات وتطبيقات ذكاء اصطناعي جديدة في عدة مجالات، حيث قامت بمقارنة نموذجها Qwen مع نموذج DeepSeek، وأبرمت شراكة كبيرة مع شركة أبل لتوفير الذكاء الاصطناعي على أجهزة “آيفون” داخل الصين، والآن تسعى لمنافسة OpenAI أيضاً.

كيفية تنزيل نموذج R1-Omni

ويتوفر نموذج R1-Omni للمستخدمين للتنزيل مجانا عبر منصة Hugging Face. وتُعتبر محاولات تحقيق الذكاء العاطفي، الذي يمكّن الحواسيب من التعرف على المشاعر الإنسانية والاستجابة لها، منتشرة بالفعل.

وتُستخدم تلك التقنية لمساعدة روبوتات الدردشة في خدمة العملاء على اكتشاف الإحباط، وللسيارات في اكتشاف السائقين الذين يغلبهم النعاس خلف عجلات القيادة.

والجدير بالذكر أن،  OpenAI كانت قد أطلقت نموذجها GPT-4.5 في وقت سابق من هذا العام، مشيرة إلى أنه أفضل في تحديد والاستجابة للإشارات الدقيقة في مطالبات المستخدمين الكتابية، ولكنه يأتي بتكلفة عالية؛ حيث يتوفر مبدئياً فقط للمستخدمين الذين يدفعون 200 دولار شهرياً ضمن باقة الاشتراك ChatGPT Pro.

في المقابل، وفي ظل حرب الأسعار لجذب العملاء في الصين، تطرح “علي بابا” نموذجها الجديد مجاناً للجميع.

 

اقرأ أيضا: 

إلغاء الرقابة.. هل سيؤدي قرار “ميتا” إلى عصر جديد من المعلومات؟

ارتفاع سهم ميتا وتراجع مايكروسوفت مع ارتفاع أغلب الأسهم الأمريكية