جميعهم يبنون وكلاء ذكاء اصطناعي - ولكن في المحور يوجد نموذج اللغة الكبير، واختيار النموذج المناسب أمر بالغ الأهمية. ومع إطلاق نماذج جديدة كل أسبوع، كيف يمكننا اتخاذ قرارات مدروسة وقائمة على البيانات؟ في هذه الجلسة، سنغوص في موضوع اختيار نماذج اللغة الكبيرة. وسنشارك نتائج دراسة اختبرت 15 نموذجًا رائدًا في مهام تلخيص الشيفرات البرمجية الواقعية، باستخدام مقاييس عملية مثل الطول الزائد، زمن الاستجابة، التكلفة، الدقة، وكم المعلومات المستفاد. نتوقع أن تقدم رؤى واضحة حول أداء النماذج الحالية فعليًا - بعيدًا عن المعايير المرجعية والضجة الإعلامية - وما يعنيه ذلك لبناء أدوات مساعدة للبرمجة، ومساعدات للمطورين، وأدوات متعددة الوسائط.