انضم إلينا في اليوم الأول من سلسلة الفعاليات الافتراضية للاستماع إلى خبراء حول آخر التطورات في مجال التقاطع بين الذكاء الاصطناعي البصري والزراعة. **التاريخ والوقت** 15 أكتوبر الساعة 9 صباحًا بالتوقيت الهادئ **المكان** افتراضي. [سجّل الدخول إلى Zoom.](https://voxel51.com/events/visual-ai-in-agriculture-october-15-2025) **Paved2Paradise: محاكاة ليدار قابلة للتوسيع لإدراك العالم الحقيقي** غالبًا ما يتطلب تدريب نماذج الإدراك القوية للروبوتات والاستقلالية بيانات ضخمة ومتنوعة ثلاثية الأبعاد. ولكن جمع وترميز سحب ليدار في العالم الحقيقي بحجم كبير أمر مكلف وجهد يستغرق وقتًا طويلاً، خاصة عندما تكون العلامات عالية الجودة مطلوبة. يقدم Paved2Paradise بديلًا اقتصاديًا: وهو خط أنابيب محاكاة ليدار قابل للتوسيع يولد بيانات واقعية ومُعلَّمة بالكامل مع أقل جهد بشري في التصنيف. الفكرة الأساسية هي "تحليل العالم الحقيقي" من خلال التقاط مسح الخلفية (مثل الحقول، الطرق، مواقع البناء) ومسح الكائنات (مثل المركبات، الأشخاص، الآلات) بشكل منفصل. ومن خلال دمج هذين المصدرَين بذكاء، يمكن لـ Paved2Paradise تركيب مجموعة كبيرة جدًا من مشاهد التدريب المختلفة. يتضمن الخط الأنابيب أربع خطوات: (1) جمع مسح ليدار واسع النطاق للخلفية، (2) تسجيل مسح عالي الدقة لكائنات الهدف في ظروف مضبوطة، (3) إدخال الكائنات في الخلفيات مع وضع وحجب يتماشيان مع القوانين الفيزيائية، (4) محاكاة هندسة الليدار لضمان الواقعية. أظهرت التجارب أن النماذج المدربة على بيانات تم إنشاؤها بواسطة Paved2Paradise تنتقل بكفاءة إلى العالم الحقيقي، وتُحقق أداءً قويًا في الكشف مع جهد تصنيف يدوي أقل بكثير مقارنةً بجمع البيانات التقليدي. هذه الطريقة ليست فعالة من حيث التكلفة فحسب، بل مرنة أيضًا—تمكّن الممارسين من التوسع بسهولة إلى فئات أو نطاقات كائنات جديدة عن طريق استبدال مسحات الخلفية أو الكائنات بمسحات جديدة. بالنسبة لممارسي التعلم الآلي الذين يعملون في مجالات الروبوتات، المركبات المستقلة، أو أنظمة الإدراك الحرجة للسلامة، يبرز Paved2Paradise مسارًا عمليًا نحو توسيع بيانات التدريب دون زيادة التكاليف. إنه يسد الفجوة بين المحاكاة والأداء في العالم الحقيقي، مما يتيح تكرارًا أسرع ونشرًا أكثر موثوقية لنماذج الإدراك. *عن المتحدث* [مايكل أ. ألكورن](https://www.linkedin.com/in/michaelaalcorn/) هو مهندس رئيسي للتعلم الآلي في شركة John Deere\، حيث يطور نماذج التعلم العميق للإدراك باستخدام ليدار وRGB في أنظمة تتطلب السلامة\-وتكون حساسة للزمن الحقيقي\. حصل على درجة الدكتوراه في علوم الحاسوب من جامعة أوبرن\، وكان عن أطروحته تحسين الرؤية الحاسوبية والشبكات العصبية العميقة المكانية-الزمنية\، ويحمل أيضًا تخصصًا فرعيًا في الرياضيات\. تم الاستشهاد بأبحاث مايكل من قبل باحثين في DeepMind\، Google\، Meta\، Microsoft\، وOpenAI\، من بين آخرين\، كما فاز بجائزة في مؤتمر MIT Sloan Sports Analytics Conference عام 2018 عن ورقته \(batter\|pitcher\)2vec\. كما ساهم برمجيات تعلم آلي في scikit\-learn وApache Solr\، وحققت مستودعاته على GitHub—التي حصلت مجتمعة على أكثر من 2\,100 نجمة—نقاط بداية لأبحاث وأكواد إنتاجية في العديد من المنظمات المختلفة\. **MothBox: جهاز رصد حشرات منخفض التكلفة، مفتوح المصدر، وآلي** سيتحدث الدكتور آندي كوتميير عن تصميم أداة علمية جديدة مثيرة ومفتوحة المصدر، Mothbox. يُعد Mothbox مشروعًا فائزًا بجائزة لمراقبة واسعة النطاق للحشرات من أجل التنوع البيولوجي. إنها جهاز منخفض التكلفة تم تطويره في غابات بنما القاسية، ويقوم بالتقاط صور فائقة الدقة ثم يقوم تلقائيًا بتحديد مستويات التنوع البيولوجي في الغابات والزراعة. بعد آلاف الملاحظات على الحشرات ومئات النشرات في بنما، بيرو، المكسيك، الإكوادور، والولايات المتحدة، نحن الآن نعمل على تطوير نسخة جديدة قابلة للتصنيع لنشارك هذه الأداة المهمة في جميع أنحاء العالم. سنناقش تطوير هذا الجهاز في غابات بنما وأهميته لدراسة التنوع البيولوجي عالميًا. *عن المتحدث* يصمم الدكتور آندي كوتميير طرقًا جديدة للتفاعل مع العالم الطبيعي. عمل مع منظمات كبيرة مثل شبكة الكرتون، IDEO، ومعهد سميثسونيان، ودرّس كأستاذ على المسار الوظيفي الدائم في الجامعة الوطنية السنغافورية، وحتى تم تحويل بحثه إلى سلسلة تلفزيونية (مثيرة للضحك) بعنوان "Hacking the Wild"، تم توزيعها بواسطة Discovery Networks. حاليًا، يقضي معظم وقته في العمل التطوعي مع منظمات صغيرة، وقام مؤخرًا بتأسيس ورشة عمل مختبرات الطبيعة الرقمية (Digital Naturalism Laboratories). في غابة مطر غامبوا في بنما، تدمج Dinalab بين العمل الميداني البيولوجي والصناعة التكنولوجية مع مجتمع من العلماء والفنانين والمهندسين ومتخصصي إعادة تأهيل الحيوانات المحليين والدوليين. وحاليًا، يعمل أيضًا كأستاذ متعاون مستشار للطلاب في جامعة واشنطن. **النماذج الأساسية للذكاء الاصطناعي البصري في الزراعة** لقد مكّنت النماذج الأساسية من أسلوب جديد لمعالجة المهام، وذلك بالاستفادة من القدرات الناشئة بطريقة بدون تدريب (zero-shot). في هذا الحديث، سأناقش الأبحاث الحديثة المتعلقة بتمكين الذكاء الاصطناعي البصري بطريقة بدون تدريب أو عبر التعديل الدقيق (fine-tuning). وعلى وجه التحديد، سأتناول العمل المشترك حول RELOCATE، وهو خط أساس بسيط لا يتطلب تدريبًا مصممًا لأداء مهمة صعبة تتمثل في تحديد موقع الاستعلام البصري في مقاطع فيديو طويلة. للتخلص من الحاجة إلى تدريب خاص بالمهمة وللتعامل بكفاءة مع مقاطع الفيديو الطويلة، يستفيد RELOCATE من تمثيل قائم على المناطق مستمد من نماذج الرؤية المدربة مسبقًا. كما سأناقش العمل المشترك لتمكين نماذج اللغات الكبيرة متعددة الوسائط (MLLMs) من الإجابة الصحيحة على الأوامر التي تتطلب فهمًا شاملاً للمكان والزمن: إذ تعاني النماذج متعددة الوسائط من صعوبة في الإجابة على الأوامر التي تشير إلى 1) البيئة بأكملها التي يمكن لوكيل مزود بنموذج MLLM العمل فيها؛ وفي نفس الوقت تشير أيضًا إلى 2) الإجراءات الأخيرة التي حدثت للتو والمُرمَّزة في مقطع فيديو. لكن مثل هذا الفهم الشامل للمكان والزمن مهم للوكلاء العاملين في العالم الحقيقي. حلنا يتضمن تطوير خط أنابيب مخصص لجمع البيانات وتعديل دقيق لنموذج MLLM مزود بمشغلات (projectors) لتحسين كل من الفهم المكاني للبيئة والفهم الزمني للملاحظات الحديثة. *عن المتحدث* [ألكس شوينغ](https://www.linkedin.com/in/alexander-s-0a049258/) هو أستاذ مشارك في جامعة إلينوي في أوربانا-شامبين، يعمل مع طلاب موهوبين في موضوعات الذكاء الاصطناعي، والذكاء الاصطناعي التوليدي، والرؤية الحاسوبية. حصل على بكالوريوس ودبلومه في الهندسة الكهربائية وتكنولوجيا المعلومات من الجامعة التقنية في ميونيخ عامي 2006 و2008 على التوالي، وحصل على درجة الدكتوراه في علوم الحاسوب من ETH زيورخ عام 2014. وبعد ذلك انضم إلى جامعة تورونتو كزميل باحث حتى عام 2016. تتركز اهتماماته البحثية في مجالات الذكاء الاصطناعي، والذكاء الاصطناعي التوليدي، والرؤية الحاسوبية، حيث شارك في تأليف عدد كبير من الأوراق البحثية حول موضوعات في فهم المشهد، وخوارزميات الاستدلال والتعلم، والتعلم العميق، ومعالجة الصور واللغة، والنماذج التوليدية. وقد تم منح أطروحة دكتوراه له وسام ETH، وفاز بحث فريقه بجائزة NSF CAREER. **خارج المختبر: كشف الشذوذ في العالم الحقيقي للرؤية الحاسوبية الزراعية** يُحدث كشف الشذوذ ثورة في التصنيع والمراقبة، لكن ماذا عن الزراعة؟ هل يمكن للذكاء الاصطناعي اكتشاف أمراض النباتات وأضرار الآفات مبكرًا بما يكفي لصنع فرق؟ يوضح هذا الحديث كيف يحدد كشف الشذوذ ويحلل مشكلات المحاصيل باستخدام صحة أوراق البن كمثال رئيسي. سنبدأ بالنظرية الأساسية، ثم ندرس كيف تكتشف هذه النماذج الصدأ وأضرار المنّ في صور الأوراق. تشمل الجلسة سير عمل شاملة تطبيقية باستخدام أدوات FiftyOne مفتوحة المصدر للرؤية الحاسوبية، وتغطي تنقية مجموعة البيانات، واستخراج القطع، وتدريب النموذج، وتصور النتائج. ستحصل على فهم نظري لكشف الشذوذ في الرؤية الحاسوبية وخبرة عملية في تطبيق هذه الأساليب على التحديات الزراعية وقطاعات أخرى. *عن المتحدث* [باولا راموس](https://www.linkedin.com/in/paula-ramos-phd/) تحمل درجة الدكتوراه في الرؤية الحاسوبية والتعلم الآلي، ولديها أكثر من 20 عامًا من الخبرة في المجال التكنولوجي. وهي تعمل على تطوير تقنيات هندسية متكاملة جديدة، خاصة في مجالات الرؤية الحاسوبية، والروبوتات، والتعلم الآلي المطبقة على الزراعة، منذ أوائل العقد الأول من القرن الحادي والعشرين في كولومبيا.