الجميع يبني وكلاء ذكاء اصطناعي - ولكن في المحور يكمن نموذج اللغة الكبير، واختيار النموذج الصحيح أمر بالغ الأهمية. ومع إطلاق نماذج جديدة كل أسبوع، كيف يمكننا اتخاذ قرارات مدروسة ومبنية على البيانات؟ في هذا الجلسة، سنغوص في موضوع اختيار نماذج اللغة الكبيرة. سنشارك نتائج دراسة اختبرت 15 نموذجًا رائدة في مهام تلخيص الشيفرات البرمجية الواقعية، باستخدام مقاييس عملية مثل الطول الزائد، زمن الاستجابة، التكلفة، الدقة، وكمية المعلومات المستفادة. نتوقع أن نقدم رؤى واضحة حول أداء النماذج الحالية فعليًا - وراء المعايير المرجعية والإثارة الإعلامية - وما يعنيه ذلك بالنسبة لبناء أدوات مساعدة البرمجة، ومساعدي المطورين، والوكلاء متعددي الوسائط.