انضم إلينا في حدث افتراضي للاستماع إلى محاضرات من خبراء حول الوضع الحالي للوكلاء البصريين. **متى** 7 أغسطس، 2025 الساعة 9 صباحًا (المنطقة الزمنية للساحل الهادئ) **أين** عن بُعد. **[سجّل في Zoom.](https://voxel51.com/events/understanding-visual-agents-august-7-2025)** **القدرات والنماذج الأساسية للوكلاء العامين لأجهزة الكمبيوتر** مع اتجاهنا نحو مستقبل يمكن فيه للوكلاء اللغوية تشغيل البرامج، وتصفح الويب، وأتمتة المهام عبر البيئات الرقمية، تظهر تحديات ملحة: كيف نبني نماذج أساسية يمكن أن تعمل كوكلاء عامين لأجهزة الكمبيوتر؟ في هذه المحاضرة، نستعرض تصميم مثل هذه الوكلاء — تلك التي تجمع بين الرؤية، واللغة، والفعل لفهم الواجهات المعقدة وتنفيذ نية المستخدم بدقة. نقدم OmniACT كدراسة حالة، وهي معيار يدعم هذا التصور من خلال ربط أوامر اللغة الطبيعية مع لقطات شاشة واجهة المستخدم ونصوص قابلة للتنفيذ لكل من بيئات سطح المكتب والويب. من خلال OmniACT، نُحلّل أداء أفضل النماذج اللغوية والمتعددة الوسائط الحالية، ونسلط الضوء على محدوديات السلوك الحالي للوكلاء، ونناقش اتجاهات البحث الضرورية لسد الفجوة نحو وكلاء رقميين فعليًا قادرين ومتعددي الأغراض. *عن المتحدث* [راघاف كابور](https://www.linkedin.com/in/raghavkapoor16/) هو مهندس تعلم آلي في شركة أدوب، حيث يعمل ضمن فريق خدمات العلامة التجارية، ويساهم في مشاريع رائدة في مجال ذكاء العلامات التجارية. يجمع عمله بين البحث والتعلم الآلي، مما يعكس خبرته العميقة في كلا المجالين. قبل انضمامه إلى أدوب، حصل راघاف على درجة الماجستير من جامعة كارنيغي ميلون، حيث ركّز بحثه على التعلم الآلي متعدد الوسائط والوكلاء القائمة على الويب. كما يمتلك خبرة صناعية من عمله كاستراتيجي في جولدمان ساكس إنديا. **BEARCUBS: تقييم قدرات الوكلاء الويب على جمع المعلومات في العالم الواقعي** تركز هذه المحاضرة على التحديات المتعلقة بتقييم وكلاء الذكاء الاصطناعي في بيئات الويب الديناميكية، وتصميم وتنفيذ معيار BEARCUBS، والرؤى المستفادة من مقارنة أداء البشر مع الوكلاء. في المحاضرة، سنناقش الفجوة الكبيرة في الأداء بين المستخدمين البشريين والوكلاء الرائدين حاليًا، مع تسليط الضوء على المجالات التي تحتاج إلى تحسين مستقبلي في قدرات التنقل واسترجاع المعلومات لدى وكلاء الذكاء الاصطناعي على الويب. *عن المتحدث* [ييشياو سونغ](https://www.linkedin.com/in/songyixiao/) هي طالبة دكتوراه في علوم الحاسوب بجامعة ماساتشوستس أمهيرست. يتركز بحثها على تحسين تقييم أنظمة معالجة اللغة الطبيعية، لا سيما في تقييم واقعية وموثوقية المحتوى الذي يولده الذكاء الاصطناعي. يشمل عملها تطوير أدوات ومعايير مثل VeriScore، وهو معيار تلقائي لتقييم واقعية توليد النصوص الطويلة، وBEARCUBS، وهو معيار لتقييم قدرة وكلاء الذكاء الاصطناعي على تحديد المعلومات الواقعية من محتوى الويب. **الوكلاء البصريون: ما الذي يتطلبه بناء وكيل يمكنه التنقل في واجهات المستخدم الرسومية مثل البشر** سنستعرض الأطر المفاهيمية، والتطبيقات المحتملة، واتجاهات المستقبل في التقنيات التي يمكنها «الرؤية» و«الفعل» باستقلالية متزايدة. وستتناول المناقشة كلًا من القيود الحالية والأفق الواعد في هذا المجال المتطور. *عن المتحدث* [هاربريت ساهوتا](https://www.linkedin.com/in/harpreetsahota204/) هو مهندس قرصان مقيم وهندسة تعلم آلي، يعشق التعلم العميق والذكاء الاصطناعي التوليدي. لديه اهتمام عميق بـ RAG، والوكلاء، والذكاء الاصطناعي متعدد الوسائط. **تنفيذ وكيل عملي للذكاء الاصطناعي لنظام أندرويد بالاعتماد على الرؤية** في هذه المحاضرة، سأشارككم التفاصيل العملية لتصميم وتنفيذ وكلاء الذكاء الاصطناعي لأندرويد، باستخدام [deki.](http://github.com/RasulOs/deki) من النظرية سننتقل إلى التطبيق واستخدام هذه الوكلاء في الصناعة/الإنتاج. بالنسبة للمستخدمين النهائيين — الاستخدام عن بعد لهواتف أندرويد أو لأتمتة المهام القياسية. مثل: * "اكتب لصديقي 'some_name' في واتساب أنني سأتأخر 15 دقيقة" * "افتح تويتر في المتصفح واكتب منشورًا عن 'something'" * "اقرأ آخر إشعاراتي وقل لي إن كانت هناك أي إشعارات مهمة" * "اكتب منشورًا على لينكدإن عن 'something'" أما بالنسبة للمحترفين — لتمكين الاختبارات القائمة على الوكلاء، وهي نوع جديد من الاختبارات أصبح ممكنًا فقط بسبب انتشار نماذج اللغة الكبيرة (LLMs) والوكلاء الذكية التي تستخدمها كنواة للتفكير. *عن المتحدث* [رَسُول أوزمانبايلي](https://www.linkedin.com/in/rasulosmanbayli/) هو مطوّر أندرويد أول في بنك كابيتال، باكو/أذربيجان. وهو أكبر بنك خاص في أذربيجان. وهو من أنشأ deki، وهو نموذج وصف الصور الذي استُخدم كأساس لوكلاء ذكاء اصطناعي لأندرويد حقق نتائج عالية في معيارين مختلفين: Android World وAndroid Control. عمل سابقًا في إسطنبول/تركيا لدى شركات مختلفة كمطوّر أندرويد وخلفية تقنية. كما أنه حاصل على درجة الماجستير من جامعة إسطنبول آيدن في إسطنبول/تركيا.