يعمل الجميع على بناء وكلاء ذكاء اصطناعي - ولكن في المقام الأول يأتي النموذج اللغوي الكبير (LLM)، واختيار النموذج المناسب أمر بالغ الأهمية. ومع ظهور نماذج جديدة كل أسبوع، كيف يمكننا اتخاذ قرارات مدروسة مبنية على البيانات؟ في هذه الجلسة، سنغوص في موضوع اختيار النماذج اللغوية الكبيرة. وسنزود بنتائج دراسة اختبرت 15 نموذجًا رائدًا في مهام تلخيص الشيفرات البرمجية في العالم الواقعي، باستخدام مقاييس عملية مثل التوسع في العبارات، زمن الاستجابة، التكلفة، الدقة، وكمية المعلومات المستفادة. نتوقع أن تقدم رؤى واضحة حول أداء النماذج الحالية فعليًا - وراء الاختبارات المعيارية والضجة الإعلامية - وماذا يعني ذلك عند بناء مساعدات البرمجة، ومساعدات المطورين، والوكلاء متعددي الوسائط.