جميعهم يبنون وكلاء ذكاء اصطناعي - ولكن في المحور يكمن النموذج اللغوي الكبير (LLM)، واختيار النموذج المناسب أمر بالغ الأهمية. ومع إطلاق نماذج جديدة كل أسبوع، كيف يمكننا اتخاذ قرارات مدروسة ومبنية على البيانات؟ في هذه الجلسة، سنغوص في موضوع اختيار النماذج اللغوية الكبيرة. وسنشارك نتائج دراسة اختبرت 15 نموذجًا رائدًا في مهام تلخيص التعليمات البرمجية الواقعية، باستخدام مقاييس عملية مثل التوسع، زمن الاستجابة، التكلفة، الدقة، وكمية المعلومات المستفادة. ننتظر تقديم رؤى واضحة حول أداء النماذج الحالية فعليًا - وراء مقاييس الأداء والتضخيم الإعلامي - وما يعنيه ذلك لبناء مساعدين برمجيين، ومساعدين مطورين، ووكلاء متعددي الوسائط.