جميعهم يبنون وكلاء الذكاء الاصطناعي - ولكن في المحور يوجد النموذج اللغوي الكبير (LLM)، واختيار النموذج المناسب أمر بالغ الأهمية. ومع إطلاق نماذج جديدة كل أسبوع، كيف يمكننا اتخاذ قرارات مدروسة وقائمة على البيانات؟ في هذا الجلسة، سنغوص في موضوع اختيار النماذج اللغوية الكبيرة. وسنشارك نتائج دراسة اختبرت 15 نموذجًا رائدًا في مهام تلخيص الشيفرات البرمجية الواقعية، باستخدام مقاييس عملية مثل التوسع في العبارات، زمن الاستجابة، التكلفة، الدقة، وكم المعلومات المستفادة. نتوقع تقديم رؤى واضحة حول أداء النماذج الحالية فعليًا - وراء الاختبارات المعيارية والضجة الإعلامية - وما يعنيه ذلك بالنسبة لبناء أدوات مساعدة في البرمجة، وزملاء المطورين الافتراضيين، والوكلاء متعددي الوسائط.