تصفح جميع التصنيفات
···
تسجيل الدخول / التسجيل
7 أغسطس - فهم الوكلاء البصريين63293333868545110
المفضلة
مشاركة

7 أغسطس - فهم الوكلاء البصريين

addressF5HW+FGX, Vaiaku, Tuvalu

تمت ترجمة بعض المحتوى تلقائيًا.عرض الأصل
وصف

انضم إلينا في حدث افتراضي للاستماع إلى متحدثين خبراء حول الوضع الحالي للوكلاء المرئيين. **متى** 7 أغسطس 2025، الساعة 9 صباحًا بالتوقيت الهادئ **أين** افتراضيًا. **[سجّل حضورك عبر Zoom.](https://voxel51.com/events/understanding-visual-agents-august-7-2025)** **القدرات والنماذج الأساسية للوكلاء العامين للحواسيب** مع التوجه نحو مستقبل يمكن فيه للوكلاء اللغوية تشغيل البرمجيات، وتصفح الويب، وأتمتة المهام عبر البيئات الرقمية، تبرز تحديات كبيرة: كيف نُنشئ نماذج أساسية يمكنها العمل كوكلاء عامين للحواسيب؟ في هذا الحديث، نستعرض تصميم هذه الوكلاء — الذين يجمعون بين الرؤية، واللغة، والعمل — لفهم الواجهات المعقدة وتنفيذ نوايا المستخدم بدقة. نقدّم OmniACT كدراسة حالة، وهي معيار يدعم هذا التصور من خلال ربط أوامر اللغة الطبيعية مع لقطات شاشة واجهة المستخدم ونصوص قابلة للتنفيذ لكل من البيئات المكتبية والويب. من خلال OmniACT، نُحلّل أداء أفضل النماذج اللغوية والمتعددة الوسائط حاليًا، ونسلط الضوء على محدوديات سلوك الوكلاء الحالي، ونناقش الاتجاهات البحثية الضرورية لسد الفجوة نحو وكلاء رقميين فعليًا قادرين ومتعددي الأغراض. *نبذة عن المتحدث* [راغاف كابور](https://www.linkedin.com/in/raghavkapoor16/) هو مهندس تعلم آلي في أدوبي، يعمل ضمن فريق خدمات العلامة التجارية، ويساهم في مشاريع رائدة في مجال ذكاء العلامات التجارية. يجمع عمله بين البحث والتعلم الآلي، مما يعكس خبرته العميقة في كلا المجالين. قبل انضمامه إلى أدوبي، حصل راغاف على درجة الماجستير من جامعة كارنيغي ميلون، حيث ركّز بحثه على التعلم الآلي متعدد الوسائط والوكلاء القائمة على الويب. كما يمتلك خبرة صناعية من عمله كاستراتيجي في جولدمان ساكس إنديا. **BEARCUBS: تقييم قدرات الوكلاء الافتراضيين في جمع المعلومات من العالم الحقيقي** يركز هذا الحديث على تحديات تقييم وكلاء الذكاء الاصطناعي في بيئات ويب ديناميكية، وتصميم وتنفيذ معيار BEARCUBS، والرؤى المستفادة من مقارنة أداء البشر مع الوكلاء. في هذا الحديث، سنناقش الفجوة الكبيرة في الأداء بين المستخدمين البشريين والوكلاء الرائدين حاليًا، مع تسليط الضوء على المجالات التي تحتاج إلى تحسين مستقبلي في قدرات التنقل في الويب واسترجاع المعلومات بواسطة الذكاء الاصطناعي. *نبذة عن المتحدثة* [يي شياو سونغ](https://www.linkedin.com/in/songyixiao/) هي طالبة دكتوراه في علوم الحاسوب بجامعة ماساتشوستس في أمهرست. يركّز بحثها على تحسين تقييم أنظمة معالجة اللغة الطبيعية، خاصةً في تقييم الواقعية والموثوقية في المحتوى الذي يولده الذكاء الاصطناعي. يشمل عملها تطوير أدوات ومعايير مثل VeriScore، وهي مقياس تلقائي لتقييم واقعية النصوص الطويلة، وBEARCUBS، وهو معيار لتقييم قدرة وكلاء الذكاء الاصطناعي على تحديد المعلومات الواقعية من محتوى الويب. **الوكلاء المرئيون: ما الذي يتطلبه بناء وكيل يمكنه التنقل في واجهات المستخدم الرسومية مثل البشر** سنستعرض الأطر المفاهيمية، والتطبيقات المحتملة، والاتجاهات المستقبلية للتكنولوجيا التي يمكنها "الرؤية" و"العمل" باستقلالية متزايدة. وسيتطرق النقاش إلى كل من القيود الحالية والأفاق الواعدة في هذا المجال المتطور. *نبذة عن المتحدث* [هاربريت ساهوتا](https://www.linkedin.com/in/harpreetsahota204/) هو مهندس قرصان مقيم ومُهندس تعلم آلي، يمتلك شغفًا بالتعلم العميق والذكاء الاصطناعي التوليدي. لديه اهتمام كبير بـ RAG، والوكلاء، والذكاء الاصطناعي متعدد الوسائط. **تنفيذ وكيل عملي للذكاء الاصطناعي يعمل بالرؤية على أندرويد** في هذا الحديث، سأشارككم التفاصيل العملية لتصميم وتنفيذ وكلاء ذكاء اصطناعي لأندرويد، باستخدام [deki.](http://github.com/RasulOs/deki) سنتوجه من النظرية إلى التطبيق، واستخدام هذه الوكلاء في الصناعة/الإنتاج. بالنسبة للمستخدمين النهائيين: الاستخدام عن بُعد لهواتف أندرويد أو لأتمتة المهام القياسية، مثل: * "اكتب لصديقي 'some_name' على واتساب أنني سأتأخر 15 دقيقة" * "افتح تويتر في المتصفح واكتب منشورًا عن 'شيء ما'" * "اقرأ إشعاراتي الأخيرة وقل لي إن كان هناك شيء مهم" * "اكتب منشورًا على لينكدإن عن 'شيء ما'" وأما للمحترفين: لتمكين الاختبار الوكيلي، وهو نوع جديد من الاختبارات أصبح ممكنًا فقط بسبب انتشار نماذج اللغة الكبيرة (LLMs) والوكلاء الاصطناعيين التي تستخدمها كنواة للتفكير. *نبذة عن المتحدث* [رسول عثمانبايلي](https://www.linkedin.com/in/rasulosmanbayli/) هو مطوّر أندرويد كبير في بنك كابيتال، باكو/أذربيجان، وهو أكبر بنك خاص في أذربيجان. وهو مبتكر deki، وهو نموذج لوصف الصور استُخدم كأساس لوكلاء ذكاء اصطناعي لأندرويد حقق نتائج عالية في معيارين مختلفين: Android World وAndroid Control. وقد سبق له العمل في إسطنبول/تركيا لدى شركات مختلفة كمطوّر أندرويد وخلفية. كما يمتلك درجة الماجستير من جامعة إسطنبول آيدن في إسطنبول/تركيا.

المصدر:  meetup عرض المنشور الأصلي

موقع
F5HW+FGX, Vaiaku, Tuvalu
عرض الخريطة

meetup

قد يعجبك أيضا

كوكيز
إعدادات الكوكيز
تطبيقاتنا
Download
حمِّل من
APP Store
Download
احصل عليه من
Google Play
© 2025 Servanan International Pte. Ltd.