تقييم النماذج الكبيرة للغة في البيئة الطبيعية: أساليب عملية للاختبار والمراقبة63291275453442110

المفضلة

تقييم النماذج الكبيرة للغة في البيئة الطبيعية: أساليب عملية للاختبار والمراقبة

F5HW+FGX, Vaiaku, Tuvalu

تمت ترجمة بعض المحتوى تلقائيًا.عرض الأصل

وصف

من السهل إرسال مطالبة واحدة إلى نموذج لغوي كبير والتحقق مما إذا كانت النتيجة تلبي توقعاتك. ولكن بمجرد البدء في طرح منتجات حقيقية، من مساعدات استرجاع الإجابة والتوليد (RAG) إلى الوكلاء المستقلين، ستواجه بسرعة سؤالاً أكثر تعقيداً: كيف تتأكد من أن النظام يعمل فعليًا؟ للتوضيح حول هذا الأمر، انضم إلينا في 6 أغسطس لم webinar مجاني تستضيفه أكاديمية نيبوس (Nebius Academy)، وهي منصة سحابية متخصصة في الذكاء الاصطناعي وتقف وراء Y-DATA ومشاريع تعليمية أخرى موجهة للمتعلمين المهتمين بالتكنولوجيا. عند بناء أنظمة تعتمد على النماذج اللغوية الكبيرة، فإنك باستمرار تُعدّل المطالب، وتحسّن المنطق، وتحديث المكونات. وهذا يعني أنك بحاجة إلى إعادة تقييم المخرجات بشكل مستمر. لكن التحقق اليدوي من كل شيء ليس قابلاً للتوسع. توجد تقنيات تقييم تلقائي يمكننا اقتراضها من التعلم الآلي التقليدي. لكن معظم أنظمة النماذج اللغوية الكبيرة تتصرف بشكل مختلف عن النماذج التنبؤية القياسية — فهي تُولّد نصوصًا مفتوحة، وتنسق الاستنتاج خطوة بخطوة، وتتفاعل مع أدوات خارجية. وهذا يستدعي نهجًا جديدًا للتقييم والمراقبة. في هذا الندوة عبر الإنترنت، سيقوم المتحدثان **إيميلي درال وإيلينا سامويولوفا**، المؤسستان المشاركَتان لشركة [Evidently AI](https://www.evidentlyai.com/)، بتحليل استراتيجيات عملية لتقييم ومراقبة الأنظمة المعتمدة على النماذج اللغوية الكبيرة. مستفيدين من خبرتهما الواقعية ومن [مقالتهما الموسعة حول التقييم](https://nebius-academy.github.io/knowledge-base/evaluation-1-basics/)، سيوضحان لك كيفية: ✔️ تحديد أهداف تقييم ذات معنى للسياقات التوليدية والوكلائية ✔️ الجمع بين الطرق التلقائية وأساليب التفاعل البشري ✔️ تصميم اختبارات انحدار وتحديد إشارات مراقبة قابلة للتوسع ✔️ تجنب الأخطاء الشائعة عند تشغيل النماذج اللغوية الكبيرة في الإنتاج إذا كنت تبني أو تحافظ على أنظمة تعتمد على النماذج اللغوية الكبيرة، فستساعدك هذه الجلسة على تجاوز الاختبارات القياسية والتركيز على إنشاء منتجات جديرة بالثقة وموثوقة. احجز الموعد! 📆 6 أغسطس ⏰ 8 مساءً بالتوقيت الإسرائيلي 📹 عبر Zoom 👉 [انضم إلى الندوة](https://nebius.com/events/evaluating-llms-wild-practical-approaches-testing-observability?utm_source=mtp&utm_medium=evt&utm_campaign=inhouse_isr_web-0608) نراكم هناك!

المصدر: meetup عرض المنشور الأصلي

موقع

F5HW+FGX, Vaiaku, Tuvalu

عرض الخريطة

meetup

تقييم النماذج الكبيرة للغة في البيئة الطبيعية: أساليب عملية للاختبار والمراقبة

قد يعجبك أيضا