جميعهم يبنون وكلاء ذكاء اصطناعي - ولكن في الجوهر يوجد نموذج اللغة الكبير (LLM)، واختيار النموذج الصحيح أمر بالغ الأهمية. ومع إطلاق نماذج جديدة كل أسبوع، كيف يمكننا اتخاذ قرارات مدروسة ومبنية على البيانات؟ في هذا الجلسة، سنغوص في موضوع اختيار نماذج اللغة الكبيرة. وسنشارك نتائج دراسة اختبرت 15 نموذجًا رائدة في مهام تلخيص الشيفرات البرمجية الواقعية، باستخدام مقاييس عملية مثل التفاصيل الزائدة، زمن الاستجابة، التكلفة، الدقة، وكمية المعلومات المستفادة. نُتوقع أن تحصل على رؤى واضحة حول أداء النماذج الحالية فعليًا - بعيدًا عن المعايير القياسية والتضخيم الإعلامي - وما يعنيه ذلك بالنسبة لبناء أدوات مساعدة البرمجة، والمساعدات البرمجية للمطورين، والوكلاء متعددي الوسائط.