جميعهم يبنون وكلاء ذكاء اصطناعي - ولكن في المحور يوجد النموذج اللغوي الكبير، واختيار النموذج الصحيح أمر بالغ الأهمية. ومع إطلاق نماذج جديدة كل أسبوع، كيف يمكننا اتخاذ قرارات مدروسة ومبنية على البيانات؟ في هذا الجلسة، سنغوص في موضوع اختيار النماذج اللغوية الكبيرة. وسنزود بنتائج دراسة جربت 15 نموذجًا رائداً في مهام تلخيص الشيفرات البرمجية الواقعية، باستخدام مقاييس عملية مثل حجم الإخراج، زمن الاستجابة، التكلفة، الدقة، وكمية المعلومات المستفادة. نتوقع أن تُظهر هذه الدراسة رؤى واضحة حول أداء النماذج الحالية فعليًا - بعيدًا عن المعايير المرجعية والإثارة الإعلامية - وما يعنيه ذلك بالنسبة لبناء وكلاء مساعدين للبرمجة، ومساعدين للمطورين، والوكلاء متعددي الوسائط.