DeepMind AI يحصل على الميدالية الفضية في الأولمبياد الدولي للرياضيات
حقق الذكاء الاصطناعي من Google DeepMind درجة الميدالية الفضية في الأولمبياد الدولي للرياضيات هذا العام (IMO)، وهي المرة الأولى التي يصل فيها أي ذكاء اصطناعي إلى منصة التتويج.
تعتبر IMO المنافسة المرموقة في العالم لعلماء الرياضيات الشباب. تتطلب الإجابة بشكل صحيح على أسئلة الاختبار قدرة رياضية تفتقر إليها أنظمة الذكاء الاصطناعي عادةً.
في شهر يناير، عرض Google DeepMind نظام AlphaGeometry، وهو نظام ذكاء اصطناعي يمكنه الإجابة على بعض أسئلة هندسة المنظمة البحرية الدولية (IMO) وكذلك البشر. ومع ذلك، لم يكن هذا من مسابقة حية، ولم يتمكن من الإجابة على أسئلة من التخصصات الرياضية الأخرى، مثل نظرية الأعداد والجبر والتوافقيات، وهو أمر ضروري للفوز بميدالية المنظمة البحرية الدولية.
أصدرت Google DeepMind الآن ذكاءً اصطناعيًا جديدًا يسمى AlphaProof، والذي يمكنه حل مجموعة واسعة من المشكلات الرياضية، ونسخة محسنة من AlphaGeometry، والتي يمكنها حل المزيد من الأسئلة الهندسية.
عندما اختبر الفريق كلا النظامين معًا في أسئلة IMO لهذا العام، أجابوا على أربعة أسئلة من أصل ستة بشكل صحيح، مما منحهم درجة 28 من أصل 42 نقطة محتملة. كان هذا كافياً للفوز بميدالية فضية ونقطة واحدة فقط تحت عتبة الميدالية الذهبية لهذا العام.
وفي المسابقة التي أقيمت في مدينة باث بالمملكة المتحدة، الأسبوع الماضي، فاز 58 مشاركًا بميدالية ذهبية، وفاز 123 مشاركًا بميدالية فضية.
يقول جريجور دولينار، رئيس المنظمة البحرية الدولية: “نحن جميعًا ندرك تمامًا أن الذكاء الاصطناعي سيكون في النهاية أفضل من البشر في حل معظم المشكلات الرياضية، لكن معدل تحسن الذكاء الاصطناعي مذهل”. “إن فقدان الميدالية الذهبية في المنظمة البحرية الدولية 2024 بفارق نقطة واحدة فقط قبل بضعة أيام أمر مثير للإعجاب حقًا.”
وفي مؤتمر صحفي، قال تيموثي جاورز من جامعة كامبريدج، الذي ساعد في تحديد إجابات AlphaProof، إن أداء الذكاء الاصطناعي كان مفاجئًا ويبدو أنه وجد “مفاتيح سحرية” للإجابة على المشكلات بطريقة مماثلة للبشر. قال جاورز: “اعتقدت أن هذه المفاتيح السحرية ربما تكون أكبر قليلاً مما يمكنه فعله، لذلك كانت مفاجأة كبيرة في حالة أو حالتين عندما عثر البرنامج بالفعل على هذه المفاتيح”.
يعمل AlphaProof بشكل مشابه لأنظمة الذكاء الاصطناعي السابقة من Google DeepMind والتي يمكنها التغلب على أفضل البشر في لعبة الشطرنج وGo. تعتمد كل أنظمة الذكاء الاصطناعي هذه على نهج التجربة والخطأ الذي يسمى التعلم المعزز، حيث يجد النظام طريقته الخاصة لحل المشكلة من خلال العديد من المحاولات. ومع ذلك، تتطلب هذه الطريقة مجموعة كبيرة من المسائل المكتوبة بلغة يستطيع الذكاء الاصطناعي فهمها والتحقق منها، في حين أن معظم المسائل المشابهة للمنظمة البحرية الدولية (IMO) تكون مكتوبة باللغة الإنجليزية.
للتغلب على هذه المشكلة، استخدم توماس هيوبرت من شركة DeepMind وزملاؤه نموذج Gemini AI من Google، وهو نموذج لغة مثل النموذج الذي يدعم ChatGPT، لترجمة هذه المشكلات إلى لغة برمجة تسمى Lean حتى يتمكن الذكاء الاصطناعي من تعلم كيفية حلها.
وقال هيوبرت في المؤتمر الصحفي: “في البداية، ستكون قادرة على حل ربما أبسط المشكلات، والتعلم من حل تلك المشكلات الأبسط لمهاجمة المشكلات الأصعب فأصعب”. كما أنها تنتج إجاباتها بطريقة Lean، بحيث يمكن التحقق من صحتها على الفور.
على الرغم من أن أداء AlphaProof مثير للإعجاب، إلا أنه يعمل ببطء، ويستغرق ما يصل إلى ثلاثة أيام للعثور على بعض الحلول بدلاً من 4.5 ساعة لكل ثلاثة أسئلة المسموح بها للمنافسين. كما فشلت في الإجابة على السؤالين المتعلقين بالتوافقيات، وهي دراسة عد الأعداد وترتيبها. يقول أليكس ديفيز من Google DeepMind: “ما زلنا نعمل على فهم سبب ذلك، الأمر الذي نأمل أن يقودنا إلى تحسين النظام”.
وقال جاورز إنه ليس من الواضح أيضًا كيف يصل AlphaProof إلى إجاباته أو ما إذا كان يستخدم نفس النوع من الحدس الرياضي الذي يستخدمه البشر، لكن قدرته على ترجمة البراهين من Lean إلى الإنجليزية تجعل من السهل التحقق من صحتها.
وكانت النتيجة مثيرة للإعجاب ومعلمًا هامًا، كما يقول جوردي ويليامسون من جامعة سيدني بأستراليا. “لقد كانت هناك العديد من المحاولات السابقة للقيام بالتعلم المعزز على البراهين الرسمية ولم يحقق أي منها الكثير من النجاح.”
في حين أن نظامًا مثل AlphaProof يمكن أن يكون مفيدًا لعلماء الرياضيات العاملين في المساعدة في تطوير البراهين، فمن الواضح أنه لا يمكن أن يساعد في تحديد المشكلات التي يجب حلها والعمل عليها، الأمر الذي يستغرق جزءًا كبيرًا من وقت الباحثين، كما يقول يانغ هوي هي من جامعة لندن. معهد العلوم الرياضية.
وقال هيوبرت إن فريقه يأمل أن يتمكن AlphaProof من المساعدة في تحسين نماذج اللغات الكبيرة في Google، مثل Gemini، عن طريق تقليل الاستجابات غير الصحيحة.
عرضت شركة التداول XTX Markets جائزة بقيمة 5 ملايين دولار – تسمى أولمبياد الذكاء الاصطناعي للرياضيات – لذكاء اصطناعي قادر على تحقيق ميدالية ذهبية في المنظمة البحرية الدولية، لكن AlphaProof غير مؤهل لأنه غير متاح للعامة. يقول Alex Gerko من XTX Markets: “نأمل أن تلهم التطورات التي حققتها DeepMind المزيد من الفرق للدخول في جائزة AIMO، وبالطبع نرحب بالمشاركة العامة من DeepMind نفسها”.
المواضيع: