تشير المكاسب المتواضعة لـ GPT-5 إلى أن تقدم الذكاء الاصطناعي يتباطأ

GPT-5 هو أحدث إصدار من نموذج اللغة Openai الكبير
تشنغ شين/غيتي الصور
آخر خطوة من الذكاء الاصطناعى إلى الأمام ليست قفزة عملاقة مثل خلط ورق مبدئي. أصدرت Openai أحدث طراز من الذكاء الاصطناعي ، GPT-5 ، بعد عامين من طرح GPT-4 ، الذي دفع نجاحها إلى الدردشة نحو الهيمنة العالمية. ولكن على الرغم من وعود قفزة مماثلة في القدرة ، يبدو أن GPT-5 تظهر تحسناً ضئيلًا على نماذج الذكاء الاصطناعى الأخرى ، مما يلمح إلى أن الصناعة قد تحتاج إلى مقاربة جديدة لبناء أنظمة الذكاء الاصطناعى الأكثر ذكاءً.
إن تصريحات Openai الخاصة تنحدر GPT-5 باعتبارها “قفزة كبيرة في الذكاء” من النماذج السابقة للشركة ، مما يدل على تحسينات واضحة في البرمجة والرياضيات والكتابة والمعلومات الصحية والفهم البصري. كما يعد بالهلوسة الأقل تكرارًا ، وهو عندما يعرض الذكاء الاصطناعى معلومات خاطئة على أنها صحيحة. على معيار داخلي يقيس “الأداء على أعمال المعرفة المعقدة والقيمة اقتصاديًا” ، يقول Openai إن GPT -5 “مماثل أو أفضل من الخبراء في نصف الحالات تقريبًا … عبر المهام التي تمتد إلى أكثر من 40 مهنة بما في ذلك القانون والخدمات اللوجستية والمبيعات والهندسة”.
ومع ذلك ، فإن أداء GPT-5 في المعايير العامة ليس أفضل بشكل كبير من النماذج الرائدة من شركات الذكاء الاصطناعى الأخرى ، مثل كلودز أنثروبور أو جيميني من Google. لقد تحسنت على GPT-4 ، ولكن الفرق في العديد من المعايير أصغر من القفزة من GPT-3 إلى GPT-4. كما كان العديد من عملاء ChatGPT غير متأثرين ، مع فشل أمثلة على GPT-5 في الإجابة على الاستفسارات البسيطة التي تبدو على نطاق واسع على وسائل التواصل الاجتماعي.
تقول ميريلا لاباتا من جامعة إدنبرة ، المملكة المتحدة: “أعرب الكثير من الناس عن أمله في أن يكون هناك اختراق ، وليس هذا اختراقًا”. “إنها ترقية ، وهي شعور تدريجي.”
تأتي التدابير الأكثر شمولاً لأداء GPT-5 من Openai نفسها ، حيث يتمتع فقط بوصول كامل إلى النموذج. تقول آنا روجرز في جامعة كوبنهاغن في جامعة كوبنهاغن في الدنمارك ، إن هناك تفاصيل قليلة حول المعيار الداخلي قد تم الإعلان عنها. “وبالتالي ، فإنه ليس شيئًا يمكن مناقشته بجدية كطالب علمي.”
في مؤتمر صحفي قبل إطلاق النموذج ، ادعى Altman أن “GPT-5 هي المرة الأولى التي تشعر فيها حقًا بالتحدث إلى خبير في أي موضوع ، مثل خبير على مستوى الدكتوراه.” يقول روجرز ، لكن هذا لا يدعمه المعايير المعايير ، ومن غير الواضح كيف يرتبط الدكتوراه بالذكاء بشكل عام. يقول روجرز: “لا يحصل الأشخاص الأذكياء للغاية بالضرورة على درجة الدكتوراه ، ولا يضمن وجود مثل هذه الدرجة بالضرورة ذكاءً عالٍ”.
قد تكون تحسينات GPT-5 المتواضعة على ما يبدو علامة على صعوبات أوسع لمطوري الذكاء الاصطناعي. حتى وقت قريب ، كان يعتقد أن نماذج اللغة الكبيرة (LLMS) تحصل على المزيد من القدرة على المزيد من البيانات التدريبية وطاقة الكمبيوتر. يبدو أن هذا لم يعد يؤثر عليه نتائج أحدث النماذج ، وفشلت الشركات في العثور على تصميمات أفضل لنظام الذكاء الاصطناعي من تلك التي عملت على chatgpt. يقول Lapata ، في إشارة إلى عملية النماذج قبل التدريب مع كمية كبيرة من البيانات ثم إجراء تعديلات مع عمليات ما بعد التدريب بعد ذلك. “
ومع ذلك ، من الصعب تحديد مدى قرب LLMs من الركود لأننا لا نعرف بالضبط كيف يتم تصميم نماذج مثل GPT-5 ، كما يقول نيكوس أليتراس من جامعة شيفيلد ، المملكة المتحدة. “محاولة إجراء تعميمات حول [whether] قد تكون نماذج اللغات الكبيرة التي وصلت إلى الجدار سابق لأوانها. لا يمكننا حقًا تقديم هذه المطالبات دون أي معلومات حول التفاصيل الفنية. “
تعمل Openai على طرق أخرى لجعل منتجه أكثر كفاءة ، مثل نظام التوجيه الجديد لـ GPT-5. على عكس الحالات السابقة لـ ChatGPT ، حيث يمكن للأشخاص اختيار نموذج الذكاء الاصطناعي الذي يجب استخدامه ، يقوم GPT-5 الآن بمسح الطلبات ويوجهها إلى نموذج معين يستخدم كمية مناسبة من الطاقة الحسابية.
يقول لاباتا إن هذا النهج قد يتم تبنيه على نطاق أوسع. “تستخدم نماذج التفكير الكثير من [computation]يقول: “إذا استطعت الإجابة عليه بنموذج أصغر ، فسنرى المزيد من ذلك في المستقبل” وهذا يستغرق بعض الوقت والمال “. لكن هذه الخطوة أغضبت بعض عملاء ChatGPT ، مما دفع Altman إلى القول إن الشركة تبحث في تحسين عملية التوجيه.
هناك علامات أكثر إيجابية لمستقبل الذكاء الاصطناعى في نموذج منفصل Openai الذي حقق درجات الميدالية الذهبية في مسابقات النخبة الرياضية والترميز في الشهر الماضي ، وهو أمر لم تستطع نماذج الذكاء الاصطناعي القيام به قبل عام. على الرغم من أن تفاصيل كيفية عمل النماذج ضئيلة مرة أخرى ، إلا أن موظفي Openai قالوا إن نجاحها يشير إلى أن النظام لديه قدرات تفكير أكثر عمومية.
يقول أليترا إن هذه المسابقات مفيدة لاختبار النماذج على البيانات التي لم يروها أثناء تدريبهم ، لكنها لا تزال اختبارات ضيقة للذكاء. يقول لباتا ، إن زيادة أداء النموذج في مجال واحد قد يزيد الأمر سوءًا في الآخرين ، والتي قد يكون من الصعب تتبعها.
أحد المجالات التي تحسنت فيها GPT-5 بشكل كبير هو سعره ، وهو الآن أرخص بكثير من النماذج الأخرى-أفضل نموذج كلود في الإنسان ، على سبيل المثال ، يكلف حوالي 10 أضعاف لمعالجة نفس العدد من الطلبات في وقت كتابة هذا التقرير. ولكن هذا قد يمثل مشاكله الخاصة على المدى الطويل ، إذا كان دخل Openai لا يغطي التكاليف الهائلة التي التزموا بها في بناء وتشغيل مراكز بيانات جديدة. يقول لاباتا: “التسعير مجنون. إنه رخيص جدًا ولا أعرف كيف يمكنهم تحمل هذا”.
تعد المنافسة بين أفضل طرز الذكاء الاصطناعي شرسة ، خاصة مع توقع أن يأخذ النموذج الأول الذي يتقدم على الآخرين معظم حصة السوق. يقول لباتا: “كل هذه الشركات الكبرى ، تحاول أن تكون الفائز الواحد ، وهذا أمر صعب”. “أنت فائز لمدة ثلاثة أشهر.”
الموضوعات: