انضم إلينا في اليوم الأول من سلسلة الفعاليات الافتراضية للاستماع إلى خبراء حول أحدث التطورات في مجال التقاء الذكاء الاصطناعي البصري بالزراعة. **التاريخ والوقت** 15 أكتوبر الساعة 9 صباحًا بالتوقيت الهادئ **الموقع** افتراضي. [سجّل الدخول إلى Zoom.](https://voxel51.com/events/visual-ai-in-agriculture-october-15-2025) **Paved2Paradise: محاكاة ليدار قابلة للتوسيع لإدراك العالم الحقيقي** غالبًا ما يتطلب تدريب نماذج الإدراك القوية للروبوتات والاستقلالية كميات هائلة ومتنوعة من البيانات ثلاثية الأبعاد. ولكن جمع وترميز سحب بيانات الليدار ثلاثية الأبعاد من العالم الحقيقي بحجم كبير أمر مكلف وجهد يستغرق وقتًا طويلاً، خاصة عندما تكون العلامات عالية الجودة ضرورية. يقدم Paved2Paradise بديلاً اقتصاديًا: وهو خط أنابيب محاكاة ليدار قابل للتوسيع يُنتج بيانات واقعية ومُوسومة تمامًا بتكلفة بشرية منخفضة جدًا في التسمية. الفكرة الأساسية هي "تحليل العالم الحقيقي" من خلال التقاط فحوص الخلفية (مثل الحقول، الطرق، مواقع البناء) وفحوص الكائنات (مثل المركبات، الناس، الآلات) بشكل منفصل. ومن خلال دمج هذه المصادر الاثنين بذكاء، يمكن لـ Paved2Paradise توليد مجموعة كبيرة جدًا من مشاهد التدريب المتنوعة. يتضمن خط الأنابيب أربع خطوات: (1) جمع فحوص ليدار واسعة النطاق للخلفية، (2) تسجيل فحوص ليدار عالية الدقة لكائنات الهدف في ظروف مضبوطة، (3) إدخال الكائنات إلى الخلفيات مع وضع وحجب يتماشى مع القوانين الفيزيائية، و(4) محاكاة هندسة الليدار لضمان الواقعية. أظهرت التجارب أن النماذج المدربة على بيانات تم إنشاؤها باستخدام Paved2Paradise تنتقل بكفاءة إلى العالم الحقيقي، وتُحقق أداءً قويًا في الكشف مع حاجة أقل بكثير للتسمية اليدوية مقارنةً بجمع مجموعة البيانات التقليدية. هذه الطريقة ليست فقط فعالة من حيث التكلفة، بل أيضًا مرنة – تتيح للممارسين توسيع نطاقهم بسهولة إلى فئات أو مجالات كائنات جديدة عبر استبدال فحوص الخلفية أو الكائنات. بالنسبة لممارسي التعلم الآلي العاملين في الروبوتات، المركبات ذاتية القيادة، أو أنظمة الإدراك الحرجة للسلامة، فإن Paved2Paradise يبرز مسارًا عمليًا نحو توسيع بيانات التدريب دون توسيع التكاليف. وهو يسد الفجوة بين المحاكاة والأداء في العالم الحقيقي، مما يمكّن من التكرار السريع والنماذج أكثر موثوقية عند النشر. *عن المتحدث* [مايكل أ. ألكورن](https://www.linkedin.com/in/michaelaalcorn/) هو مهندس رئيسي للتعلم الآلي في شركة John Deere\، حيث يطور نماذج التعلم العميق للإدراك باستخدام بيانات الليدار والصور الملونة في أنظمة حرجة للسلامة وتعمل في الزمن الحقيقي\. حصل على درجة الدكتوراه في علوم الحاسوب من جامعة أوبرن\، مع أطروحة حول تحسين الرؤية الحاسوبية والشبكات العصبية العميقة الزمكانية\، ويحمل أيضًا شهادة ماجستير فرعية في الرياضيات\. تم الاستشهاد بأبحاث مايكل من قبل باحثين في DeepMind\، Google\، Meta\، Microsoft\، وOpenAI\، من بين آخرين\، وكانت ورقة \(batter\|pitcher\)2vec الخاصة به فائزة بجائزة في مؤتمر MIT Sloan Sports Analytics Conference 2018\. كما ساهم برمجيًا في scikit\-learn وApache Solr\، وقد استخدمت مستودرات GitHub الخاصة به—التي حصلت مجتمعة على أكثر من 2\,100 نجمة—كمحطات انطلاق لأغراض البحث والإنتاج في العديد من المؤسسات المختلفة\. **MothBox: جهاز رصد حشرات منخفض التكلفة ومفتوح المصدر** سيتحدث الدكتور آندي كويتميير عن تصميم أداة علمية مفتوحة المصدر جديدة ومثيرة، Mothbox. يُعد مشروع Mothbox مشروعًا فائزًا بجائزة لمراقبة الحشرات على نطاق واسع من أجل التنوع البيولوجي. إنها جهاز منخفض التكلفة تم تطويره في الغابات الصعبة ببنما، ويقوم بالتقاط صور عالية الدقة جدًا ثم يقوم تلقائيًا بتحديد مستويات التنوع البيولوجي في الغابات والزراعة. بعد آلاف الملاحظات الحشرية ومئات النشرات في بنما، بيرو، المكسيك، الإكوادور، والولايات المتحدة، نحن الآن نعمل على تطوير إصدار جديد قابل للإنتاج لنشارك هذه الأداة المهمة حول العالم. سنناقش تطوير هذا الجهاز في غابات بنما وأهميته لدراسة التنوع البيولوجي عالميًا. *عن المتحدث* يصمم الدكتور آندي كويتميير طرقًا جديدة للتفاعل مع العالم الطبيعي. عمل مع منظمات كبيرة مثل شبكة كرتون نتورك، IDEO، ومعهد سميثسونيان، ودرّس كأستاذ مساعد في جامعة سنغافورة الوطنية، وتحولت حتى إحدى أبحاثه إلى سلسلة تلفزيونية (مضحكة) بعنوان "اختراق البرية"، تم توزيعها بواسطة Discovery Networks. حالياً، يقضي معظم وقته في العمل التطوعي مع منظمات صغيرة، وقام مؤخرًا بتأسيس ورشة تصنيع في موقع ميداني باسم Digital Naturalism Laboratories. في غابة جامبوا المطيرة في بنما، تدمج Dinalab بين العمل الميداني البيولوجي والصناعة التكنولوجية ضمن مجتمع من العلماء والفنيين والمهندسين والفنانين المحليين والدوليين ومتخصصي إعادة تأهيل الحيوانات. وهو يُقدم حاليًا الاستشارات للطلاب كأستاذ متعاون في جامعة واشنطن. **النماذج الأساسية للذكاء الاصطناعي البصري في الزراعة** لقد مكّنت النماذج الأساسية من طريقة جديدة لمعالجة المهام، وذلك بالاستفادة من القدرات الناشئة بطريقة بدون تدريب (zero-shot). في هذا الحديث سأناقش أبحاثًا حديثة حول تمكين الذكاء الاصطناعي البصري بطريقة بدون تدريب أو من خلال الضبط الدقيق. على وجه التحديد، سأناقش عملًا مشتركًا حول RELOCATE، وهو معيار بسيط لا يتطلب تدريبًا مصممًا لأداء مهمة صعبة وهي تحديد موقع الاستعلامات المرئية في مقاطع فيديو طويلة. لكي نتجنب الحاجة إلى تدريب خاص بالمهمة وللتعامل بكفاءة مع مقاطع الفيديو الطويلة، يستفيد RELOCATE من تمثيل قائم على المناطق مشتق من نماذج الرؤية المسبقة التدريب. سأناقش أيضًا عملًا مشتركًا حول تمكين النماذج الكبيرة متعددة الوسائط (MLLMs) من الإجابة الصحيحة على الأوامر التي تتطلب فهمًا شاملاً مكانًا وزمنًا: فالنماذج الكبيرة متعددة الوسائط تواجه صعوبة في الإجابة على أوامر تشير إلى 1) البيئة الكاملة التي يمكن لوكيل مزود بـ MLLM العمل فيها؛ وفي الوقت نفسه تشير أيضًا إلى 2) الإجراءات الأخيرة التي حدثت للتو والتي تم ترميزها في مقطع فيديو. ومع ذلك، فإن هذا الفهم الشامل المكاني والزماني مهم للوكلاء الذين يعملون في العالم الحقيقي. يشمل حلنا تطوير خط أنابيب مخصص لجمع البيانات والضبط الدقيق لنموذج MLLM مزود بمشعاعات لتحسين كل من الفهم المكاني للبيئة والفهم الزمني للملاحظات الأخيرة. *عن المتحدث* [أليكس شوينغ](https://www.linkedin.com/in/alexander-s-0a049258/) هو أستاذ مشارك في جامعة إلينوي في أوربانا-شامبين، يعمل مع طلاب موهوبين في موضوعات الذكاء الاصطناعي، والذكاء الاصطناعي التوليدي، والرؤية الحاسوبية. حصل على بكالوريوس ودبلومه في الهندسة الكهربائية وتكنولوجيا المعلومات من الجامعة التقنية بميونيخ عامي 2006 و2008 على التوالي، وحصل على درجة الدكتوراه في علوم الحاسوب من ETH زيورخ في عام 2014. وبعد ذلك انضم إلى جامعة تورونتو كزميل ما بعد الدكتوراه حتى عام 2016. تتركز اهتماماته البحثية في مجالات الذكاء الاصطناعي، والذكاء الاصطناعي التوليدي، والرؤية الحاسوبية، حيث شارك في تأليف العديد من الأوراق البحثية في مواضيع تشمل فهم المشهد، وخوارزميات الاستنتاج والتعلم، والتعلم العميق، ومعالجة الصور واللغة، والنماذج التوليدية. وقد حازت أطروحته للدكتوراه على ميدالية ETH، كما حصل فريقه البحثي على جائزة NSF CAREER. **خارج المختبر: كشف الشذوذ في العالم الحقيقي للرؤية الحاسوبية الزراعية** يُحدث كشف الشذوذ تغييرًا في التصنيع والمراقبة، لكن ماذا عن الزراعة؟ هل يمكن للذكاء الاصطناعي أن يكتشف أمراض النباتات وأضرار الآفات مبكرًا بما يكفي لصنع فرق؟ يوضح هذا الحديث كيف يحدد كشف الشذوذ ويحلل مشكلات المحاصيل باستخدام صحة أوراق البن كمثال أساسي. سنبدأ بالنظرية الأساسية، ثم نفحص كيف تكشف هذه النماذج عن صدأ الأوراق وأضرار المنشار في صور الأوراق. تشمل الجلسة سير عمل شاملًا عمليًا باستخدام أدوات FiftyOne مفتوحة المصدر للرؤية الحاسوبية، ويتناول تنقيح مجموعة البيانات، واستخراج القطع، وتدريب النموذج، وعرض النتائج. ستكتسب فهمًا نظريًا لكشف الشذوذ في الرؤية الحاسوبية، بالإضافة إلى خبرة عملية في تطبيق هذه الأساليب على التحديات الزراعية وحقول أخرى. *عن المتحدث* [باولا راموس](https://www.linkedin.com/in/paula-ramos-phd/) حاصلة على درجة الدكتوراه في الرؤية الحاسوبية والتعلم الآلي، ولديها أكثر من 20 عامًا من الخبرة في المجال التكنولوجي. وقد كانت تطور تقنيات هندسية متكاملة جديدة، خصوصًا في مجالات الرؤية الحاسوبية، والروبوتات، والتعلم الآلي المطبّق على الزراعة، منذ أوائل العقد الأول من القرن الحادي والعشرين في كولومبيا.