انضم إلينا في حدث افتراضي للاستماع إلى متحدثين خبراء حول الوضع الحالي للوكلاء البصريين. **متى** 7 أغسطس 2025، الساعة 9 صباحًا بالتوقيت الهادئ **أين** حدث افتراضي. **[سجّل حضورك عبر Zoom.](https://voxel51.com/events/understanding-visual-agents-august-7-2025)** **القدرات والنماذج الأساسية للوكلاء العامين لأجهزة الحاسوب** مع التوجه نحو مستقبل يمكن فيه للوكلاء اللغوية تشغيل البرامج، وتصفح الويب، وأتمتة المهام عبر البيئات الرقمية، تظهر تحديات كبيرة: كيف نبني نماذج أساسية يمكن أن تعمل كوكلاء عامين لأجهزة الحاسوب؟ في هذا الحديث، نستعرض تصميم هذه الوكلاء — الذين يجمعون بين الرؤية واللغة والفعل لفهم الواجهات المعقدة وتنفيذ نية المستخدم بدقة. نقدم "أومني إكت" كدراسة حالة، وهي معيار يدعم هذا التصور من خلال ربط أوامر لغوية طبيعية مع لقطات شاشة للواجهات ونصوص قابلة للتنفيذ لكل من بيئات سطح المكتب والويب. من خلال "أومني إكت"، نحلل أداء أفضل النماذج اللغوية والنموذجية المتعددة اليوم، ونسلط الضوء على محدوديات السلوك الحالي للوكلاء، ونناقش اتجاهات البحث الضرورية لسد الفجوة نحو وكلاء رقمية عامة قادرة حقًا. *عن المتحدث* [راغاف كابور](https://www.linkedin.com/in/raghavkapoor16/) هو مهندس تعلم آلي في أدوبي، يعمل ضمن فريق خدمات العلامة التجارية، ويساهم في مشاريع رائدة في مجال ذكاء العلامات التجارية. يجمع عمله بين البحث والتعلم الآلي، مما يعكس خبرته العميقة في كلا المجالين. قبل انضمامه إلى أدوبي، حصل راغاف على درجة الماجستير من جامعة كارنيغي ميلون، حيث ركز بحثه على التعلم الآلي متعدد النمط والوكلاء القائمة على الويب. كما يمتلك خبرة صناعية من عمله كاستراتيجي في جولدمان ساكس إنديا. **بياركابس: تقييم قدرات الوكلاء الافتراضيين في جمع المعلومات من العالم الحقيقي** يركز هذا الحديث على تحديات تقييم وكلاء الذكاء الاصطناعي في بيئات الويب الديناميكية، وتصميم وتنفيذ معيار "بياركابس"، والرؤى المستمدة من مقارنة أداء البشر مع أداء الوكلاء. في هذا الحديث، سنناقش الفجوة الكبيرة في الأداء بين المستخدمين البشريين والوكلاء الحاليين الأكثر تطورًا، مع تسليط الضوء على المجالات التي تحتاج إلى تحسين مستقبلي في قدرات تصفح الويب واسترجاع المعلومات باستخدام الذكاء الاصطناعي. *عن المتحدث* [ييشياو سونغ](https://www.linkedin.com/in/songyixiao/) مرشحة لنيل درجة الدكتوراه في علوم الحاسوب بجامعة ماساتشوستس في أمهيرست. يتركز بحثها على تحسين تقييم أنظمة معالجة اللغة الطبيعية، لا سيما في تقييم الدقة والموثوقية في المحتوى الذي يولده الذكاء الاصطناعي. يشمل عملها تطوير أدوات ومعايير مثل "فيريسكور"، وهو مقياس تلقائي لتقييم دقة النصوص الطويلة المُولَّدة، و"بياركابس"، وهو معيار لتقييم قدرة وكلاء الذكاء الاصطناعي على تحديد المعلومات الواقعية من محتوى الويب. **الوكلاء البصرية: ما الذي يتطلبه بناء وكيل يمكنه التنقل في واجهات المستخدم مثل البشر** سنستعرض الأطر المفاهيمية، والتطبيقات المحتملة، واتجاهات المستقبل في التقنيات التي يمكنها "الرؤية" و"التفاعل" باستقلالية متزايدة. وستتناول المناقشة كلًا من القيود الحالية والأفاق الواعدة في هذا المجال المتطور. *عن المتحدث* [هاربريت ساهوتا](https://www.linkedin.com/in/harpreetsahota204/) هو مهندس أمن ومطور تعلم آلي، يشغف بالتعلم العميق والذكاء الاصطناعي التوليدي. لديه اهتمام عميق بنماذج الاسترجاع والوكلاء والذكاء الاصطناعي متعدد النمط. **تنفيذ وكيل عملي للذكاء الاصطناعي يعمل بالرؤية على أندرويد** في هذا الحديث، سأشارككم التفاصيل العملية لتصميم وتنفيذ وكلاء ذكاء اصطناعي لأندرويد، باستخدام [ديكي.](http://github.com/RasulOs/deki) سننتقل من النظرية إلى التطبيق، واستخدام هذه الوكلاء في الصناعة والإنتاج. بالنسبة للمستخدمين النهائيين — الاستخدام عن بُعد لهواتف أندرويد أو أتمتة المهام القياسية. مثل: * "اكتب لصديقي 'اسم_معين' على واتساب أنني سأتأخر 15 دقيقة" * "افتح تويتر في المتصفح واكتب منشورًا عن 'شيء ما'" * "اقرأ آخر إشعاراتي وقل لي إن كان هناك شيء مهم" * "اكتب منشورًا على لينكدإن عن 'شيء ما'" وللمهنيين — لتمكين اختبار الوكلاء، وهو نوع جديد من الاختبارات أصبح ممكنًا فقط بسبب انتشار نماذج اللغة الكبيرة (LLMs) والوكلاء الاصطناعية التي تستخدمها كنواة تفكير. *عن المتحدث* [رسول عثمانبايلي](https://www.linkedin.com/in/rasulosmanbayli/) هو مطوّر أندرويد أول في بنك كابيتال، باكو/أذربيجان. وهو أكبر بنك خاص في أذربيجان. قام بإنشاء "ديكي"، وهو نموذج لوصف الصور استُخدم كأساس لوكلاء ذكاء اصطناعي لأندرويد حقق نتائج عالية في معيارين مختلفين: Android World وAndroid Control. عمل سابقًا في إسطنبول/تركيا لدى شركات مختلفة كمطوّر أندرويد وخلفية تقنية. كما يحمل درجة الماجستير من جامعة إسطنبول أيدين في إسطنبول/تركيا.