لا يمكن لنماذج الذكاء الاصطناعي أن تتعلم أثناء تقدمها كما يفعل البشر
لا تستطيع الخوارزميات التي تدعم أنظمة الذكاء الاصطناعي مثل ChatGPT أن تتعلم مع تقدمها، مما يجبر شركات التكنولوجيا على إنفاق مليارات الدولارات لتدريب نماذج جديدة من الصفر. على الرغم من أن هذا كان مصدر قلق في الصناعة لبعض الوقت، إلا أن دراسة جديدة تشير إلى وجود مشكلة متأصلة في الطريقة التي يتم بها تصميم النماذج – ولكن قد تكون هناك طريقة لحلها.
معظم أنظمة الذكاء الاصطناعي اليوم هي ما يسمى بالشبكات العصبية المستوحاة من كيفية عمل الدماغ، مع وحدات المعالجة المعروفة باسم الخلايا العصبية الاصطناعية. يمرون عادةً بمراحل مختلفة في تطورهم. أولاً، يتم تدريب الذكاء الاصطناعي، والذي يتم ضبط خلاياه العصبية الاصطناعية بدقة بواسطة خوارزمية لتعكس مجموعة بيانات معينة بشكل أفضل. بعد ذلك، يمكن استخدام الذكاء الاصطناعي للرد على البيانات الجديدة، مثل مدخلات النص مثل تلك التي يتم وضعها في ChatGPT. ومع ذلك، بمجرد تعيين الخلايا العصبية للنموذج في مرحلة التدريب، لا يمكنها التحديث والتعلم من البيانات الجديدة.
وهذا يعني أنه يجب إعادة تدريب معظم نماذج الذكاء الاصطناعي الكبيرة إذا أصبحت بيانات جديدة متاحة، وهو ما يمكن أن يكون باهظ التكلفة، خاصة عندما تتكون مجموعات البيانات الجديدة هذه من أجزاء كبيرة من الإنترنت بالكامل.
وقد تساءل الباحثون عما إذا كانت هذه النماذج قادرة على دمج معارف جديدة بعد التدريب الأولي، الأمر الذي من شأنه أن يقلل التكاليف، ولكن لم يكن من الواضح ما إذا كانت قادرة على ذلك.
الآن، قام شيبهانش دوهير – من جامعة ألبرتا في كندا – وزملاؤه باختبار ما إذا كان من الممكن تكييف نماذج الذكاء الاصطناعي الأكثر شيوعًا للتعلم المستمر. ووجد الفريق أنهم يفقدون بسرعة القدرة على تعلم أي شيء جديد، مع بقاء أعداد كبيرة من الخلايا العصبية الاصطناعية عالقة عند قيمة صفر بعد تعرضها لبيانات جديدة.
يقول دوهير: “إذا كنت تفكر في الأمر مثل عقلك، فسوف يكون الأمر كما لو أن 90% من الخلايا العصبية قد ماتت”. “لم يبق لك ما يكفي لتتعلمه.”
قام دوهير وفريقه في البداية بتدريب أنظمة الذكاء الاصطناعي من قاعدة بيانات ImageNet، والتي تتكون من 14 مليون صورة مصنفة لأشياء بسيطة مثل المنازل أو القطط. ولكن بدلاً من تدريب الذكاء الاصطناعي مرة واحدة ثم اختباره من خلال محاولة التمييز بين صورتين عدة مرات، كما هو معتاد، أعادوا تدريب النموذج بعد كل زوج من الصور.
لقد اختبروا مجموعة من خوارزميات التعلم المختلفة بهذه الطريقة، ووجدوا أنه بعد بضعة آلاف من دورات إعادة التدريب، بدت الشبكات غير قادرة على التعلم وكان أداؤها سيئًا، حيث ظهرت العديد من الخلايا العصبية “ميتة”، أو بقيمة صفر.
قام الفريق أيضًا بتدريب الذكاء الاصطناعي على محاكاة تعلم النملة المشي من خلال التعلم المعزز، وهي طريقة شائعة حيث يتم تعليم الذكاء الاصطناعي كيف يبدو النجاح ويكتشف القواعد باستخدام التجربة والخطأ. وعندما حاولوا تكييف هذه التقنية لتمكين التعلم المستمر من خلال إعادة تدريب الخوارزمية بعد المشي على أسطح مختلفة، وجدوا أنها تؤدي أيضًا إلى عدم القدرة على التعلم بشكل كبير.
تبدو هذه المشكلة متأصلة في الطريقة التي تتعلم بها هذه الأنظمة، كما يقول دوهير، ولكن هناك طريقة ممكنة للتغلب عليها. وطور الباحثون خوارزمية تقوم بتشغيل بعض الخلايا العصبية بشكل عشوائي بعد كل جولة تدريب، ويبدو أنها تقلل من الأداء الضعيف. “إذا أ [neuron] يقول دوهار: “لقد مات، ثم نقوم بإحيائه”. “الآن أصبح قادرًا على التعلم مرة أخرى.”
تبدو الخوارزمية واعدة، لكنها ستحتاج إلى اختبارها على أنظمة أكبر بكثير قبل أن نتأكد من أنها ستساعد، كما يقول مارك فان دير ويلك من جامعة أكسفورد.
ويقول: “إن حل التعلم المستمر هو حرفيًا سؤال بقيمة مليار دولار”. “إن الحل الحقيقي والشامل الذي يسمح لك بالتحديث المستمر للنموذج من شأنه أن يقلل من تكلفة تدريب هذه النماذج بشكل كبير.”
المواضيع: