نجح نموذج o3 الخاص بشركة OpenAI في اختبار استدلال الذكاء الاصطناعي، ولكنه لا يزال ليس الذكاء الاصطناعي العام

أعلنت شركة OpenAI عن إنجاز كبير لنموذجها الجديد o3 AI
روكاس تينيس / العلمي
حقق نموذج الذكاء الاصطناعي الجديد o3 من OpenAI درجة عالية في اختبار استدلال الذكاء الاصطناعي المرموق الذي يسمى تحدي ARC، مما ألهم بعض محبي الذكاء الاصطناعي للتكهن بأن o3 قد حقق ذكاءً اصطناعيًا عامًا (AGI). ولكن حتى عندما وصف منظمو تحدي ARC إنجاز o3 بأنه معلم رئيسي، فقد حذروا أيضًا من أنه لم يفز بالجائزة الكبرى للمسابقة – وأنه مجرد خطوة واحدة على الطريق نحو الذكاء الاصطناعي العام (AGI)، وهو مصطلح يشير إلى الذكاء الاصطناعي المستقبلي الافتراضي الذي يتمتع بذكاء يشبه الإنسان. .
يعد نموذج o3 هو الأحدث في سلسلة من إصدارات الذكاء الاصطناعي التي تتبع نماذج اللغات الكبيرة التي تعمل على تشغيل ChatGPT. قال فرانسوا شوليه، المهندس في Google والمبتكر الرئيسي لتحدي ARC، في مقالة: “هذه زيادة مفاجئة ومهمة في قدرات الذكاء الاصطناعي، مما يُظهر قدرة جديدة على التكيف مع المهام لم يسبق لها مثيل من قبل في نماذج عائلة GPT”. مشاركة مدونة.
ما الذي فعله نموذج O3 الخاص بـ OpenAI بالفعل؟
صمم شوليه تحدي مجموعة التجريد والاستدلال (ARC) في عام 2019 لاختبار مدى قدرة الذكاء الاصطناعي على العثور على الأنماط الصحيحة التي تربط بين أزواج من الشبكات الملونة. تهدف مثل هذه الألغاز المرئية إلى جعل الذكاء الاصطناعي يُظهر شكلاً من أشكال الذكاء العام مع قدرات التفكير الأساسية. لكن استخدام قوة حاسوبية كافية لحل الألغاز يمكن أن يسمح حتى لبرنامج غير منطقي بحلها ببساطة من خلال القوة الغاشمة. ولمنع حدوث ذلك، تتطلب المنافسة أيضًا تقديم النتائج الرسمية للوفاء بقيود معينة على قوة الحوسبة.
حقق نموذج o3 المعلن عنه حديثًا من OpenAI – والذي من المقرر إطلاقه في أوائل عام 2025 – درجة اختراقه الرسمية البالغة 75.7 في المائة في الاختبار “شبه الخاص” لتحدي ARC، والذي يُستخدم لتصنيف المنافسين على لوحة المتصدرين العامة. بلغت تكلفة الحوسبة لإنجازها حوالي 20 دولارًا أمريكيًا لكل مهمة ألغاز بصرية، وهو ما يلبي حد المنافسة الذي يقل عن 10000 دولار أمريكي. ومع ذلك، فإن الاختبار “الخاص” الأصعب الذي يتم استخدامه لتحديد الفائزين بالجوائز الكبرى له حد أكثر صرامة لقوة الحوسبة، أي ما يعادل إنفاق 10 سنتات فقط على كل مهمة، وهو ما لم تستوفه شركة OpenAI.
وحقق نموذج o3 أيضًا نتيجة غير رسمية قدرها 87.5 في المائة من خلال تطبيق قوة حاسوبية تزيد بنحو 172 مرة عما كانت عليه في النتيجة الرسمية. وعلى سبيل المقارنة، تبلغ النتيجة البشرية النموذجية 84%، ونسبة 85% كافية للفوز بالجائزة الكبرى لتحدي ARC البالغة 600 ألف دولار – إذا تمكن النموذج أيضًا من الحفاظ على تكاليف الحوسبة الخاصة به ضمن الحدود المطلوبة.
ولكن للوصول إلى النتيجة غير الرسمية، ارتفعت تكلفة o3 إلى آلاف الدولارات التي تم إنفاقها على حل كل مهمة. طلبت OpenAI من منظمي التحدي عدم نشر تكاليف الحوسبة الدقيقة.
هل يُظهر إنجاز o3 هذا أنه تم الوصول إلى الذكاء الاصطناعي العام (AGI)؟
لا، فقد قال منظمو تحدي ARC على وجه التحديد إنهم لا يعتبرون تجاوز معيار المنافسة هذا مؤشرًا على تحقيق الذكاء الاصطناعي العام.
وقال مايك نوب، منظم تحدي ARC في شركة البرمجيات Zapier، في منشور على وسائل التواصل الاجتماعي على X، إن نموذج o3 فشل أيضًا في حل أكثر من 100 مهمة ألغاز بصرية، حتى عندما طبق OpenAI قدرًا كبيرًا جدًا من قوة الحوسبة على النتيجة غير الرسمية. .
في منشور على وسائل التواصل الاجتماعي على Bluesky، قالت ميلاني ميتشل من معهد سانتا في في نيو مكسيكو ما يلي حول تقدم o3 في معيار ARC: “أعتقد أن حل هذه المهام عن طريق حساب القوة الغاشمة يهزم الغرض الأصلي”.
“على الرغم من أن النموذج الجديد مثير للإعجاب للغاية ويمثل علامة فارقة كبيرة على الطريق نحو الذكاء الاصطناعي العام، إلا أنني لا أعتقد أن هذا هو الذكاء الاصطناعي العام – فلا يزال هناك عدد لا بأس به من الحلول السهلة للغاية. [ARC Challenge] “المهام التي لا يستطيع o3 حلها،” قال Chollet في منشور X آخر.
ومع ذلك، وصف شوليت كيف يمكننا أن نعرف متى تم إثبات الذكاء على المستوى البشري من خلال شكل ما من أشكال الذكاء الاصطناعي العام. وقال في تدوينة: “ستعرف أن الذكاء الاصطناعي العام موجود عندما تصبح ممارسة إنشاء المهام التي تكون سهلة بالنسبة للبشر العاديين ولكنها صعبة بالنسبة للذكاء الاصطناعي مستحيلة بكل بساطة”.
يقترح توماس ديتريش من جامعة ولاية أوريغون طريقة أخرى للتعرف على الذكاء الاصطناعي العام. ويقول: “تدعي هذه البنى أنها تشمل جميع المكونات الوظيفية المطلوبة للإدراك البشري”. “وبهذا المقياس، فإن أنظمة الذكاء الاصطناعي التجارية تفتقد الذاكرة العرضية، والتخطيط، والتفكير المنطقي، والأهم من ذلك، الإدراك الفوقي.”
فماذا تعني النتيجة العالية لـ o3 حقًا؟
تأتي النتيجة العالية لنموذج o3 في الوقت الذي يحسب فيه قطاع التكنولوجيا وباحثو الذكاء الاصطناعي وتيرة تقدم أبطأ في أحدث نماذج الذكاء الاصطناعي لعام 2024، مقارنة بالتطورات المتفجرة الأولية لعام 2023.
على الرغم من أنها لم تفز في تحدي ARC، إلا أن النتيجة العالية التي حققتها o3 تشير إلى أن نماذج الذكاء الاصطناعي يمكنها التغلب على معيار المنافسة في المستقبل القريب. بالإضافة إلى درجتها العالية غير الرسمية، يقول شوليه إن العديد من الطلبات الرسمية ذات الحوسبة المنخفضة سجلت بالفعل أكثر من 81 في المائة في مجموعة اختبارات التقييم الخاصة.
ويعتقد ديتريش أيضًا أن “هذه قفزة مذهلة للغاية في الأداء”. ومع ذلك، فهو يحذر من أنه من دون معرفة المزيد حول كيفية عمل نموذجي o1 وo3 الخاصين بـ OpenAI، فمن المستحيل تقييم مدى الإعجاب الذي حققته النتيجة العالية. على سبيل المثال، إذا كان o3 قادرًا على التدرب على مسائل ARC مسبقًا، فإن ذلك من شأنه أن يجعل تحقيقها أسهل. يقول ديتريش: “سنحتاج إلى انتظار نسخة متماثلة مفتوحة المصدر لفهم الأهمية الكاملة لهذا الأمر”.
يتطلع منظمو تحدي ARC بالفعل إلى إطلاق مجموعة ثانية وأكثر صعوبة من الاختبارات المعيارية في وقت ما في عام 2025. كما سيستمرون في تحدي جائزة ARC 2025 حتى يحصل شخص ما على الجائزة الكبرى ويفتح مصادر الحل الخاصة به.
المواضيع:
- الذكاء الاصطناعي/
- منظمة العفو الدولية