انضم إلينا في اليوم الأول من سلسلة الفعاليات الافتراضية للاستماع إلى خبراء حول أحدث التطورات في مجال التقاء الذكاء الاصطناعي البصري بالزراعة. **التاريخ والوقت** 15 أكتوبر الساعة 9 صباحًا بالتوقيت الهادئ **المكان** افتراضي. [سجّل الدخول عبر زووم.](https://voxel51.com/events/visual-ai-in-agriculture-october-15-2025) **Paved2Paradise: محاكاة ليدار قابلة للتوسيع لإدراك العالم الحقيقي** غالبًا ما يتطلب تدريب نماذج الإدراك القوية للروبوتات والاستقلالية بيانات ضخمة ومتنوعة ثلاثية الأبعاد. ولكن جمع وتصنيف سحب نقاط ليدار من العالم الحقيقي بحجم كبير أمرٌ مكلفٌ للغاية ويستغرق وقتًا طويلاً، خاصة عند الحاجة إلى تسميات عالية الجودة. يقدم Paved2Paradise بديلاً اقتصاديًا: وهو خط أنابيب محاكاة ليدار قابل للتوسيع يُنتج بيانات واقعية ومصنفة تمامًا بجهد تصنيف بشري ضئيل. الفكرة الأساسية هي "تحليل العالم الحقيقي" من خلال التقاط مسح الخلفية (مثل الحقول، الطرق، مواقع البناء) ومسح الكائنات (مثل المركبات، الأشخاص، الآلات) بشكل منفصل. ومن خلال دمج هذين المصدرَين بذكاء، يمكن لـ Paved2Paradise توليد عدد كبير من مشاهد التدريب المتنوعة. يتضمن خط الأنابيب أربع خطوات: (1) جمع مسوحات ليدار واسعة النطاق للخلفية، (2) تسجيل مسوحات عالية الدقة لكائنات الهدف في ظروف خاضعة للتحكم، (3) إدخال الكائنات في الخلفيات مع وضع وتقييد فعلي متسق، (4) محاكاة هندسة الليدار لضمان الواقعية. أظهرت التجارب أن النماذج المدربة على البيانات التي يولدها Paved2Paradise تنتقل بكفاءة إلى العالم الحقيقي، وتحقق أداءً قويًا في الكشف مع تقليل كبير في الترميز اليدوي مقارنةً بجمع مجموعة البيانات التقليدية. هذه الطريقة ليست فقط فعالة من حيث التكلفة، بل أيضًا مرنة — تتيح للممارسين توسيعها بسهولة إلى فئات أو نطاقات كائنات جديدة عن طريق استبدال مسوحات الخلفية أو الكائنات. بالنسبة لممارسي التعلّم الآلي العاملين في مجالات الروبوتات، المركبات المستقلة، أو أنظمة الإدراك الحرجة للسلامة، يبرز Paved2Paradise مسارًا عمليًا نحو توسيع بيانات التدريب دون توسيع التكاليف. كما يسد الفجوة بين المحاكاة والأداء في العالم الحقيقي، مما يمكّن من التكرار السريع والنشر الأكثر موثوقية لنماذج الإدراك. *عن المتحدث* [مايكل أ. ألكورن](https://www.linkedin.com/in/michaelaalcorn/) هو مهندس رئيسي للتعلم الآلي في شركة جون دير، حيث يعمل على تطوير نماذج التعلم العميق للإدراك باستخدام بيانات الليدار والصور الملونة (RGB) في أنظمة حرجة للسلامة وتعمل في الزمن الحقيقي. حصل على درجة الدكتوراه في علوم الحاسوب من جامعة أوبرن، وكان موضوع أطروحته تحسين الرؤية الحاسوبية والشبكات العصبية العميقة المكانية-الزمنية، كما يمتلك تخصصًا فرعيًا في الرياضيات. تم الاستشهاد بأبحاث مايكل من قبل باحثين في DeepMind وGoogle وMeta وMicrosoft وOpenAI وغيرهم، وكانت ورقة \(batter\|pitcher\)2vec الخاصة به فائزة بجائزة في مؤتمر MIT Sloan Sports Analytics Conference عام 2018. كما ساهم برمجيًا في scikit\-learn وApache Solr، وحققت مستودعاته على GitHub التي حصلت مجتمعة على أكثر من 2\,100 نجمة نقطة بداية لأبحاث وأكواد إنتاجية في العديد من المنظمات المختلفة. **MothBox: جهاز رصد آفات رخيص ومفتوح المصدر وآلي** سيتحدث الدكتور آندي كوتميير عن تصميم أداة علمية مفتوحة المصدر جديدة ومثيرة تُعرف باسم Mothbox. إن Mothbox هو مشروع فائز بجوائز لمراقبة واسعة النطاق للحشرات من أجل التنوع البيولوجي. إنه جهاز منخفض التكلفة تم تطويره في غابات بنما القاسية، يقوم بالتقاط صور عالية الدقة جدًا ثم تحديد تلقائي لمستويات التنوع البيولوجي في الغابات والزراعة. بعد آلاف الملاحظات الحشرية ومئات عمليات النشر في بنما، بيرو، المكسيك، الإكوادور، والولايات المتحدة، نحن الآن بصدد تطوير نسخة جديدة قابلة للتصنيع لتعميم هذه الأداة المهمة على مستوى العالم. سنناقش تطوير هذا الجهاز في غابات بنما وأهميته لدراسة التنوع البيولوجي عالميًا. *عن المتحدث* يصمم الدكتور آندي كوتميير طرقًا جديدة للتفاعل مع العالم الطبيعي. عمل مع منظمات كبيرة مثل شبكة الكرتون، IDEO، ومعهد سميثسونيان، ودرّس كأستاذ أكاديمي في جامعة سنغافورة الوطنية، وحتى تم تحويل بحثه إلى سلسلة تلفزيونية (مضحكة) بعنوان "Hacking the Wild"، تم توزيعها بواسطة Discovery Networks. حالياً، يقضي معظم وقته في العمل التطوعي مع منظمات صغيرة، ومؤخرًا أسس ورشة عمل مخبرية ميدانية تُدعى Digital Naturalism Laboratories. في غابة الأمطار في جامبوا ببنما، تدمج Dinalab العمل الميداني البيولوجي مع الصناعة التكنولوجية ضمن مجتمع من العلماء والفنيين والفنانين والمهندسين والمتعافين المحليين والدوليين. كما يستمر حاليًا في تقديم المشورة للطلاب كبروفيسور متعاون في جامعة واشنطن. **النماذج الأساسية للذكاء الاصطناعي البصري في الزراعة** لقد مكّنت النماذج الأساسية من طريقة جديدة لمعالجة المهام، وذلك بالاستفادة من القدرات الناشئة بطريقة بدون تدريب (zero-shot). في هذا الحديث، سأناقش أحدث الأبحاث المتعلقة بتمكين الذكاء الاصطناعي البصري بطريقة بدون تدريب أو عبر عملية ضبط دقيق (fine-tuning). وعلى وجه التحديد، سأتناول العمل المشترك حول RELOCATE، وهو معيار بسيط لا يتطلب تدريبًا مصممًا لأداء مهمة التوطين البصري المعقدة في مقاطع الفيديو الطويلة. لإزالة الحاجة إلى تدريب خاص بالمهمة وللتعامل بكفاءة مع مقاطع الفيديو الطويلة، يستفيد RELOCATE من تمثيل قائم على المناطق مستمد من نماذج الرؤية المدربة مسبقًا. كما سأناقش العمل المشترك المتعلق بتمكين نماذج اللغات الكبيرة متعددة الوسائط (MLLMs) من الإجابة الصحيحة على الأوامر التي تتطلب فهمًا شاملاً مكانياً-زمنياً: إذ تواجه النماذج متعددة الوسائط صعوبة في الإجابة على أوامر تشير إلى 1) البيئة الكاملة التي يمكن لوكيل مزوّد بنموذج MLLM العمل فيها؛ وفي نفس الوقت تشير أيضًا إلى 2) الإجراءات الأخيرة التي حدثت للتو وتم ترميزها في مقطع فيديو. ومع ذلك، فإن هذا الفهم الشامل مكانياً-زمنياً مهم للوكلاء العاملين في العالم الحقيقي. يشمل حلنا تطوير خط أنابيب مخصص لجمع البيانات وضبط دقيق لنموذج MLLM مزود بمشعّات لتحسين كل من الفهم المكاني للبيئة والفهم الزمني للمشاهدات الأخيرة. *عن المتحدث* [أليكس شوينغ](https://www.linkedin.com/in/alexander-s-0a049258/) هو أستاذ مشارك في جامعة إلينوي في أوربانا-แชมبين، يعمل مع طلاب موهوبين في مجالات الذكاء الاصطناعي، والذكاء الاصطناعي التوليدي، والرؤية الحاسوبية. حصل على درجة البكالوريوس والدبلوم في الهندسة الكهربائية وتكنولوجيا المعلومات من الجامعة التقنية في ميونيخ عامي 2006 و2008 على التوالي، وحصل على درجة الدكتوراه في علوم الحاسوب من ETH زيورخ عام 2014. بعد ذلك انضم إلى جامعة تورونتو كزميل باحث حتى عام 2016. تتركز اهتماماته البحثية في مجالات الذكاء الاصطناعي، والذكاء الاصطناعي التوليدي، والرؤية الحاسوبية، حيث شارك في تأليف العديد من الأوراق العلمية حول فهم السيناريوهات، وخوارزميات الاستدلال والتعلم، والتعلم العميق، وتجهيز الصور واللغة، والنماذج التوليدية. وقد حصلت أطروحته للدكتوراه على ميدالية ETH، وحاز بحث فريقه على جائزة NSF CAREER. **خارج المختبر: كشف الشذوذ في العالم الحقيقي للرؤية الحاسوبية الزراعية** يُحدث كشف الشذوذ تغييرًا جذريًا في التصنيع والمراقبة، ولكن ماذا عن الزراعة؟ هل يمكن للذكاء الاصطناعي حقًا اكتشاف أمراض النباتات وأضرار الآفات في وقت مبكر بما يكفي لصنع فرق؟ يوضح هذا الحديث كيف يحدد كشف الشذوذ مشكلات المحاصيل ويطوّرها باستخدام صحة أوراق البن كمثال رئيسي. سنبدأ بالنظرية الأساسية، ثم ندرس كيف تكتشف هذه النماذج صدأ الورقة وأضرار المنشار في صور الأوراق. تشمل الجلسة سير عمل شاملًا عمليًا باستخدام مجموعة أدوات الرؤية الحاسوبية المفتوحة المصدر FiftyOne، ويتناول تنسيق مجموعة البيانات، واستخراج القطع، وتدريب النموذج، وتصوير النتائج. ستحصل على فهم نظري لكشف الشذوذ في الرؤية الحاسوبية، بالإضافة إلى الخبرة العملية في تطبيق هذه التقنيات على التحديات الزراعية وغيرها من المجالات. *عن المتحدث* [باولا راموس](https://www.linkedin.com/in/paula-ramos-phd/) تحمل درجة الدكتوراه في الرؤية الحاسوبية والتعلم الآلي، ولديها أكثر من 20 عامًا من الخبرة في المجال التكنولوجي. وهي تعمل منذ أوائل العقد الأول من القرن الواحد والعشرين في كولومبيا على تطوير تقنيات هندسية متكاملة جديدة، تركز أساسًا على الرؤية الحاسوبية، والروبوتات، والتعلم الآلي المطبقة في الزراعة.