يعمل الجميع على بناء وكلاء ذكاء اصطناعي - ولكن في المحور الأساسي توجد النماذج اللغوية الكبيرة (LLM)، واختيار النموذج المناسب أمر بالغ الأهمية. ومع إطلاق نماذج جديدة كل أسبوع، كيف يمكننا اتخاذ قرارات مدروسة ومبنية على البيانات؟ في هذا الجلسة، سنغوص في موضوع اختيار النماذج اللغوية الكبيرة. وسنزود بنتائج دراسة اختبرت 15 نموذجًا رائدًا في مهام تلخيص الشيفرات البرمجية الواقعية، باستخدام مقاييس عملية مثل الطول الزائد، زمن الاستجابة، التكلفة، الدقة، وكمية المعلومات المستفادة. نتوقع تقديم رؤى واضحة حول أداء النماذج الحالية فعليًا - بعيدًا عن الاختبارات المعيارية والإثارة الإعلامية - وما يعنيه ذلك لبناء أدوات مساعدة للبرمجة، ومساعدات المطورين، والوكلاء متعددي الوسائط.