انضم إلينا في حدث افتراضي للاستماع إلى متحدثين خبراء حول الوضع الحالي للوكلاء المرئيين. **متى** 7 أغسطس 2025، الساعة 9 صباحًا بالتوقيت الباسيفيكي **أين** حدث افتراضي. **[سجّل حضورك عبر Zoom.](https://voxel51.com/events/understanding-visual-agents-august-7-2025)** **القدرات والنماذج الأساسية للوكلاء العامين للحواسيب** مع التوجه نحو مستقبل يمكن فيه للوكلاء اللغوية تشغيل البرمجيات، وتصفح الويب، وأتمتة المهام عبر البيئات الرقمية، تظهر تحديات ملحة: كيف نبني نماذج أساسية يمكنها العمل كوكلاء عامين للحواسيب؟ في هذا الحديث، نستعرض تصميم مثل هذه الوكلاء — تلك التي تجمع بين الرؤية، واللغة، والفعل لفهم الواجهات المعقدة وتنفيذ نية المستخدم بدقة. نعرض OmniACT كدراسة حالة، وهي معيار يدعم هذا التصور من خلال ربط أوامر اللغة الطبيعية لقطات شاشة واجهة المستخدم مع نصوص قابلة للتنفيذ لكل من البيئات المكتبية والويب. من خلال OmniACT، نفحص أداء أفضل النماذج اللغوية ومتعددة الوسائط الحالية، ونسلط الضوء على محدوديات السلوك الحالي للوكلاء، ونناقش اتجاهات البحث المطلوبة لسد الفجوة نحو وكلاء رقميين قادرين حقًا ومتعددي الأغراض. *عن المتحدث* [راجاف كابور](https://www.linkedin.com/in/raghavkapoor16/) هو مهندس تعلم آلي في شركة أدوبي، يعمل ضمن فريق خدمات العلامة التجارية، ويساهم في مشاريع رائدة في مجال ذكاء العلامات التجارية. يجمع عمله بين البحث والتعلم الآلي، مما يعكس خبرته العميقة في كلا المجالين. قبل انضمامه إلى أدوبي، حصل راجاف على درجة الماجستير من جامعة كارنيغي ميلون، حيث ركّز بحثه على التعلم الآلي متعدد الوسائط والوكلاء القائمة على الويب. كما يمتلك خبرة صناعية من عمله كاستراتيجي في جولدمان ساكس إنديا. **BEARCUBS: تقييم قدرات الوكلاء الويبية على جمع المعلومات في العالم الواقعي** يركز هذا الحديث على تحديات تقييم وكلاء الذكاء الاصطناعي في بيئات الويب الديناميكية، وتصميم وتنفيذ معيار BEARCUBS، والرؤى المستمدة من مقارنة أداء البشر مع الوكلاء. في هذا الحديث، سنناقش الفجوة الكبيرة في الأداء بين المستخدمين البشريين والحال الحالي لأفضل الوكلاء المتوفرة، مع تسليط الضوء على المجالات التي تحتاج إلى تحسين في المستقبل من حيث قدرات تصفح الويب واسترجاع المعلومات باستخدام الذكاء الاصطناعي. *عن المتحدثة* [ييشياو سونغ](https://www.linkedin.com/in/songyixiao/) طالبة دكتوراه في علوم الحاسوب بجامعة ماساتشوستس أمهرست. يتركز بحثها على تحسين تقييم أنظمة معالجة اللغة الطبيعية، وخصوصًا تقييم الواقعية والموثوقية في المحتوى الذي يولده الذكاء الاصطناعي. يشمل عملها تطوير أدوات ومعايير مثل VeriScore، وهي مقياس تلقائي لتقييم واقعية النصوص الطويلة، وBEARCUBS، وهو معيار لتقييم قدرة وكلاء الذكاء الاصطناعي على تحديد المعلومات الواقعية من محتوى الويب. **الوكلاء المرئيون: ما الذي يتطلبه بناء وكيل يمكنه التنقل في واجهات المستخدم الرسومية مثل البشر** سنستعرض الأطر المفاهيمية، والتطبيقات المحتملة، واتجاهات المستقبل في التقنيات التي يمكنها "الرؤية" و"التصرف" باستقلالية متزايدة. وستتناول المناقشة كلًا من القيود الحالية والأفق الواعد في هذا المجال المتطور. *عن المتحدث* [هاربريت ساهوتا](https://www.linkedin.com/in/harpreetsahota204/) هو مهندس أمن ومهندس تعلم آلي، يتحمس للتعلم العميق والذكاء الاصطناعي التوليدي. لديه اهتمام كبير بمعرفة المستندات المرجعية (RAG)، والوكلاء، والذكاء الاصطناعي متعدد الوسائط. **تنفيذ وكيل عملي للذكاء الاصطناعي يعمل بالرؤية على أندرويد** في هذا الحديث، سأشارككم التفاصيل العملية لتصميم وتنفيذ وكلاء الذكاء الاصطناعي لأندرويد، باستخدام [deki.](http://github.com/RasulOs/deki) سنتنقل من النظرية إلى التطبيق، واستخدام هذه الوكلاء في الصناعة/الإنتاج. بالنسبة للمستخدمين النهائيين: الاستخدام عن بُعد لهواتف أندرويد أو لأتمتة المهام القياسية. مثل: * "اكتب لصديقي 'some_name' على واتساب أنني سأتأخر 15 دقيقة" * "افتح تويتر في المتصفح واكتب منشورًا عن 'شيء ما'" * "اقرأ آخر إشعاراتي وقل لي إن كانت هناك أي إشعارات مهمة" * "اكتب منشورًا على لينكدإن عن 'شيء ما'" وأما للمحترفين: لتمكين اختبار الوكلاء، وهو نوع جديد من الاختبارات أصبح ممكنًا فقط بسبب انتشار نماذج اللغة الكبيرة (LLMs) والوكلاء الاصطناعيين الذين يستخدمونها كنواة للتفكير. *عن المتحدث* [رسول عثمانبايلي](https://www.linkedin.com/in/rasulosmanbayli/) مطوّر أندرويد أول في بنك كابيتال، باكو/أذربيجان. وهو أكبر بنك خاص في أذربيجان. قام بتطوير deki، وهو نموذج لوصف الصور تم استخدامه كأساس لوكلاء ذكاء اصطناعي لأندرويد حقق نتائج عالية في معيارين مختلفين: Android World وAndroid Control. وقد سبق له العمل في اسطنبول/تركيا لدى شركات مختلفة كمطوّر أندرويد وخلفية تقنية. كما يحمل درجة الماجستير من جامعة اسطنبول آيدن في اسطنبول/تركيا.