انضم إلينا في حدث افتراضي للاستماع إلى متحدثين خبراء حول الوضع الحالي للوكلاء المرئيين. **متى** 7 أغسطس 2025، الساعة 9 صباحًا بالتوقيت الهادئ **أين** حدث افتراضي. **[سجّل حضورك عبر Zoom.](https://voxel51.com/events/understanding-visual-agents-august-7-2025)** **القدرات والنماذج الأساسية للوكلاء العامين لأجهزة الكمبيوتر** بينما نتجه نحو مستقبل يمكن فيه للوكلاء اللغوية تشغيل البرامج، وتصفح الويب، وأتمتة المهام عبر البيئات الرقمية، تظهر تحديات كبيرة: كيف نُنشئ نماذج أساسية يمكنها العمل كوكلاء عامين لأجهزة الكمبيوتر؟ في هذا الحديث، نستعرض تصميم هذه الوكلاء—وهي وسائل تجمع بين الرؤية واللغة والعمل لفهم الواجهات المعقدة وتنفيذ نية المستخدم بدقة. نعرض OmniACT كدراسة حالة، وهي معيار يدعم هذا التصور من خلال دمج أوامر لغوية طبيعية مع لقطات شاشة للواجهات ونصوص قابلة للتنفيذ لكل من بيئات سطح المكتب والويب. من خلال OmniACT، نفحص أداء أفضل النماذج اللغوية والنموذجية المتعددة اليوم، ونسلط الضوء على محدوديات السلوك الحالي للوكلاء، ونناقش اتجاهات البحث اللازمة لسد الفجوة نحو وصول وكلاء رقمية عامة الأغراض وفعّالة حقًا. *نبذة عن المتحدث* [رغاف كابور](https://www.linkedin.com/in/raghavkapoor16/) هو مهندس تعلم آلي في أدوبي، يعمل ضمن فريق خدمات العلامة التجارية، ويساهم في مشاريع رائدة في مجال ذكاء العلامات التجارية. يجمع عمله بين البحث وتعلم الآلة، مما يعكس خبرته العميقة في كلا المجالين. قبل انضمامه إلى أدوبي، حصل رغاف على درجة الماجستير من جامعة كارنيغي ميلون، حيث ركّز بحثه على التعلم الآلي متعدد الوسائط والوكلاء القائمة على الويب. كما يمتلك خبرة صناعية من عمله كاستراتيجي في جولدمان ساكس إنديا. **BEARCUBS: تقييم قدرات الوكلاء الويبية في جمع المعلومات من العالم الواقعي** يركز الحديث على تحديات تقييم وكلاء الذكاء الاصطناعي في بيئات الويب الديناميكية، وتصميم وتنفيذ معيار BEARCUBS، والرؤى المستمدة من مقارنة أداء البشر مع الوكلاء. في هذا الحديث، سنناقش الفجوة الكبيرة في الأداء بين المستخدمين البشريين والوكلاء الرائدين حاليًا، مع تسليط الضوء على المجالات التي تحتاج إلى تحسين مستقبلي في قدرات التنقل واسترجاع المعلومات عبر الويب باستخدام الذكاء الاصطناعي. *نبذة عن المتحدثة* [ييشياو سونغ](https://www.linkedin.com/in/songyixiao/) مرشحة للدكتوراه في علوم الحاسوب بجامعة ماساتشوستس أمهيرست. يتركز بحثها على تحسين تقييم أنظمة معالجة اللغة الطبيعية، لا سيما في تقييم الدقة والموثوقية في المحتوى الذي يولده الذكاء الاصطناعي. يشمل عملها تطوير أدوات ومعايير مثل VeriScore، وهو مقياس تلقائي لتقييم دقة النصوص الطويلة المُولدة، وBEARCUBS، وهو معيار لتقييم قدرة وكلاء الذكاء الاصطناعي على تحديد المعلومات الواقعية من محتوى الويب. **الوكلاء المرئيون: ما الذي يتطلبه بناء وكيل يمكنه التنقل في واجهات المستخدم الرسومية مثل البشر** سنستعرض الأطر المفاهيمية، والتطبيقات المحتملة، واتجاهات المستقبل في التقنيات التي يمكنها "الرؤية" و"العمل" باستقلالية متزايدة. وسيتطرق النقاش إلى القيود الحالية والآفاق الواعدة في هذا المجال المتطور. *نبذة عن المتحدث* [هاربريت ساهوتا](https://www.linkedin.com/in/harpreetsahota204/) هو مهندس تعلم آلي ومتخصص في الأمن السيبراني، يمتلك شغفًا بالتعلم العميق والذكاء الاصطناعي التوليدي. لديه اهتمام كبير بـ RAG، والوكلاء، والذكاء الاصطناعي متعدد الوسائط. **تنفيذ وكيل عملي للذكاء الاصطناعي يعمل بالرؤية على أندرويد** في هذا الحديث، سأشارككم التفاصيل العملية لتصميم وتنفيذ وكلاء الذكاء الاصطناعي لأندرويد، باستخدام [deki.](http://github.com/RasulOs/deki) سنتقدم من النظرية إلى التطبيق، واستخدام هذه الوكلاء في الصناعة/الإنتاج. بالنسبة للمستخدمين النهائيين: استخدام هواتف أندرويد عن بُعد أو أتمتة المهام القياسية، مثل: * "أرسل رسالة إلى صديقي 'some_name' عبر واتساب أخبره فيها أنني سأتأخر 15 دقيقة" * "افتح تويتر في المتصفح وانشر منشورًا عن 'شيء ما'" * "اقرأ آخر إشعاراتي وقل لي إن كان هناك شيء مهم" * "انشر منشورًا على لينكدإن عن 'شيء ما'" وللمحترفين: تمكين الاختبار الوكيل، وهو نوع جديد من الاختبارات أصبح ممكنًا فقط بسبب انتشار نماذج اللغة الكبيرة (LLMs) والوكلاء الذكية التي تستخدمها كنواة تفكير. *نبذة عن المتحدث* [رسل عثمانبايلي](https://www.linkedin.com/in/rasulosmanbayli/) هو مطوّر أندرويد أول في بنك كابيتال، باكو/أذربيجان، وهو أكبر بنك خاص في أذربيجان. وهو مبتكر deki، وهو نموذج وصف الصور الذي استُخدم كأساس لوسيط ذكاء اصطناعي لأندرويد حقق نتائج عالية في معيارين مختلفين: Android World وAndroid Control. وقد سبق له العمل في إسطنبول/تركيا في شركات مختلفة كمطوّر أندرويد وخلفية تقنية. كما يحمل درجة الماجستير من جامعة إسطنبول آيدن في إسطنبول/تركيا.