انضم إلينا في اليوم الأول من سلسلة الفعاليات الافتراضية للاستماع إلى متحدثين خبراء حول آخر التطورات في مجال التقاء الذكاء الاصطناعي البصري بالزراعة. **التاريخ والوقت** 15 أكتوبر الساعة 9 صباحًا بالتوقيت الهادئ **المكان** فعالية افتراضية. [سجّل حضورك عبر Zoom.](https://voxel51.com/events/visual-ai-in-agriculture-october-15-2025) **Paved2Paradise: محاكاة ليدار قابلة للتوسيع لإدراك العالم الحقيقي** غالبًا ما يتطلب تدريب نماذج الإدراك القوية للروبوتات والاستقلالية بيانات ضخمة ومتنوعة ثلاثية الأبعاد. ولكن جمع وترميز سحب الليدار الحقيقية على نطاق واسع أمر مكلف وجهد استهلك الكثير من الوقت، خاصة عندما تكون العلامات عالية الجودة ضرورية. يقدم Paved2Paradise بديلاً اقتصاديًا: خط أنابيب محاكاة ليدار قابل للتوسيع لإنشاء مجموعات بيانات واقعية ومُعلَّمة بالكامل مع أقل جهد بشري في التسمية. الفكرة الأساسية هي "تحليل الواقع" من خلال التقاط مسح الخلفيات (مثل الحقول، الطرق، مواقع البناء) ومسح الكائنات (مثل المركبات، الأشخاص، الآلات) بشكل منفصل. ومن خلال دمج هذين المصدرَين بذكاء، يمكن لـ Paved2Paradise تركيب عدد كبير من مشاهد التدريب المختلفة. يتضمن خط الأنابيب أربع خطوات: (1) جمع مسح ليدار واسع النطاق للخلفيات، (2) تسجيل مسح عالي الدقة لكائنات الهدف في ظروف خاضعة للتحكم، (3) إدخال الكائنات ضمن الخلفيات مع وضع وحجب يتماشيان مع القوانين الفيزيائية، (4) محاكاة هندسة الليدار لضمان الواقعية. أظهرت التجارب أن النماذج المدربة على بيانات تم إنشاؤها باستخدام Paved2Paradise تنتقل بكفاءة إلى العالم الحقيقي، وتُحقق أداءً قويًا في الكشف مع الحاجة إلى ترميز يدوي أقل بكثير مقارنةً بجمع مجموعة البيانات التقليدية. هذه الطريقة ليست فعالة من حيث التكلفة فحسب، بل مرنة أيضًا—تمكّن الممارسين من التوسع بسهولة إلى فئات كائنات جديدة أو مجالات جديدة عن طريق استبدال مسح الخلفيات أو الكائنات بآخر جديد. بالنسبة لممارسي التعلم الآلي العاملين في الروبوتات، أو المركبات ذاتية القيادة، أو أنظمة الإدراك الحرجة للسلامة، فإن Paved2Paradise يبرز مسارًا عمليًا نحو توسيع بيانات التدريب دون زيادة التكاليف. وهو يسد الفجوة بين المحاكاة والأداء في العالم الحقيقي، مما يتيح تكرارًا أسرع ونشرًا أكثر موثوقية لنماذج الإدراك. *عن المتحدث* [مايكل أ. ألكورن](https://www.linkedin.com/in/michaelaalcorn/) هو مهندس رئيسي للتعلم الآلي في شركة John Deere\، حيث يعمل على تطوير نماذج التعلم العميق للإدراك باستخدام بيانات الليدار وRGB في أنظمة حرجة للسلامة وتعمل في الزمن الحقيقي\. حصل على درجة الدكتوراه في علوم الحاسوب من جامعة أوبرن\، وكان موضوع أطروحته تحسين الرؤية الحاسوبية والشبكات العصبية العميقة الزمكانية\، كما يحمل تخصصًا فرعيًا للدراسات العليا في الرياضيات\. تم الاستشهاد بأبحاث مايكل من قبل باحثين في DeepMind\، Google\، Meta\، Microsoft\، وOpenAI\، من بين آخرين\، وكانت ورقة \(batter\|pitcher\)2vec الخاصة به فائزة بجائزة في مؤتمر MIT Sloan Sports Analytics Conference عام 2018\. كما ساهم برمجيًا في scikit\-learn وApache Solr\، وقد تم استخدام مستودعات GitHub الخاصة به—التي حصلت مجتمعة على أكثر من 2\,100 نجمة—كمصدر أولي لأكواد بحثية وإنتاجية في العديد من المنظمات المختلفة\. **MothBox: جهاز رصد آفات رخيص ومتاح مفتوح المصدر** سيتحدث الدكتور آندي كويتميير عن تصميم أداة علمية مفتوحة المصدر مثيرة جديدة، Mothbox. مشروع Mothbox هو مشروع فائز بجائزة لمراقبة واسعة النطاق للحشرات بهدف التنوع البيولوجي. إنها أداة منخفضة التكلفة تم تطويرها في الغابات الاستوائية القاسية ببنما، تقوم بالتقاط صور فائقة الدقة ثم تحديد مستويات التنوع البيولوجي في الغابات والزراعة تلقائيًا. بعد آلاف الملاحظات على الحشرات ومئات النشرات في بنما، بيرو، المكسيك، الإكوادور، والولايات المتحدة، نحن الآن نعمل على إصدار جديد قابل للتصنيع لنشارك هذه الأداة المهمة على مستوى العالم. سنناقش تطوير هذا الجهاز في غابات بنما وأهميته لدراسة التنوع البيولوجي عالميًا. *عن المتحدث* يصمم الدكتور آندي كويتميير طرقًا جديدة للتفاعل مع العالم الطبيعي. عمل مع منظمات كبيرة مثل شبكة كرتون نتورك، IDEO، ومعهد سميثسونيان، ودرّس كأستاذ محاضر في جامعة سنغافورة الوطنية، وتحولت أبحاثه حتى إلى برنامج تلفزيوني (مضحك) بعنوان "Hacking the Wild"، تم توزيعه بواسطة Discovery Networks. في الوقت الحالي، يقضي معظم وقته في العمل التطوعي مع منظمات صغيرة، وقام مؤخرًا بتأسيس ورشة تصنيع مختبرات Digital Naturalism Laboratories. في غابة جامبوا المطيرة ببنما، يدمج Dinalab العمل الميداني البيولوجي مع الصناعة التكنولوجية ضمن مجتمع من العلماء والفنيين والمهندسين ومحسنّي الحيوانات المحليين والدوليين. ويقوم حاليًا أيضًا بإرشاد الطلاب كبروفيسور متعاون في جامعة واشنطن. **النماذج الأساسية للذكاء الاصطناعي البصري في الزراعة** لقد مكّنت النماذج الأساسية من أسلوب جديد لمعالجة المهام، وذلك بالاستفادة من القدرات الناشئة بطريقة بدون تدريب (zero-shot). في هذا الحديث، سأناقش أحدث الأبحاث المتعلقة بتمكين الذكاء الاصطناعي البصري بطريقة بدون تدريب أو من خلال التعديل الدقيق (fine-tuning). على وجه التحديد، سأناقش عملًا مشتركًا حول RELOCATE، وهي معيار بسيط لا يتطلب تدريبًا مصممًا لأداء مهمة صعبة وهي تحديد موقع الاستعلام البصري في مقاطع فيديو طويلة. للتخلص من الحاجة إلى تدريب مخصص للمهمة وللتعامل بكفاءة مع مقاطع الفيديو الطويلة، يستفيد RELOCATE من تمثيل قائم على المناطق مستمد من نماذج بصرية مُدرّبة مسبقًا. سأناقش أيضًا عملًا مشتركًا حول تمكين نماذج اللغات الكبيرة متعددة الوسائط (MLLMs) للإجابة الصحيحة على المطالبات التي تتطلب فهمًا شاملاً مكانياً-زمانيًا: تجد النماذج متعددة الوسائط صعوبة في الإجابة على المطالبات التي تشير إلى 1) البيئة بأكملها التي يمكن لوكيل مزوّد بنموذج MLLM العمل فيها؛ وفي نفس الوقت تشير أيضًا إلى 2) الإجراءات الأخيرة التي حدثت للتو والمُشفّرة في مقطع فيديو. ومع ذلك، فإن هذا الفهم الشامل المكاني-الزماني مهم للوكلاء الذين يعملون في العالم الحقيقي. يشمل حلنا تطوير خط أنابيب مخصص لجمع البيانات وتعديل نموذج MLLM مزوّد بمشعّات لتحسين كل من الفهم المكاني للبيئة والفهم الزمني للملاحظات الأخيرة. *عن المتحدث* [ألكس شوينغ](https://www.linkedin.com/in/alexander-s-0a049258/) هو أستاذ مشارك في جامعة إلينوي في أوربانا-شمباين، يعمل مع طلاب موهوبين في مجالات الذكاء الاصطناعي، والذكاء الاصطناعي التوليدي، والرؤية الحاسوبية. تلقى دراسته الجامعية ودرجة الدبلوم في الهندسة الكهربائية وتكنولوجيا المعلومات من الجامعة التقنية في ميونيخ عامي 2006 و2008 على التوالي، وحصل على درجة الدكتوراه في علوم الحاسوب من ETH زيورخ عام 2014. وبعد ذلك انضم إلى جامعة تورونتو كزميل ما بعد الدكتوراه حتى عام 2016. تشمل اهتماماته البحثية مجالات الذكاء الاصطناعي، والذكاء الاصطناعي التوليدي، والرؤية الحاسوبية، حيث شارك في تأليف العديد من الأوراق البحثية حول مواضيع فهم السيناريو، وخوارزميات الاستنتاج والتعلم، والتعلم العميق، وتجهيز الصور واللغة، والنماذج التوليدية. حصلت أطروحته للدكتوراه على ميدالية ETH، وحاز بحث فريقه على جائزة NSF CAREER. **خارج المختبر: كشف الشذوذ في العالم الحقيقي للرؤية الحاسوبية الزراعية** إن كشف الشذوذ يُحدث تحولًا في التصنيع والمراقبة، ولكن ماذا عن الزراعة؟ هل يمكن للذكاء الاصطناعي اكتشاف أمراض النباتات وأضرار الآفات في وقت مبكر بما يكفي لتحقيق فرق؟ يوضح هذا الحديث كيف يحدد كشف الشذوذ ويحلل مشكلات المحاصيل باستخدام صحة أوراق القهوة كمثال أساسي. سنبدأ بنظرية أساسية، ثم ندرس كيف تكتشف هذه النماذج صدأ الأوراق وأضرار اليرقات في صور الأوراق. تشمل الجلسة سير عمل شاملة عملية باستخدام أدوات FiftyOne المفتوحة المصدر للرؤية الحاسوبية، وتغطي تنقيح مجموعة البيانات، واستخلاص القطع، وتدريب النموذج، وعرض النتائج. ستحصل على فهم نظري لكشف الشذوذ في الرؤية الحاسوبية وخبرة عملية في تطبيق هذه الأساليب على التحديات الزراعية وغيرها من المجالات. *عن المتحدث* [بولينا راموس](https://www.linkedin.com/in/paula-ramos-phd/) تحمل درجة الدكتوراه في الرؤية الحاسوبية والتعلم الآلي، ولديها أكثر من 20 عامًا من الخبرة في المجال التكنولوجي. تعمل على تطوير تقنيات هندسية متكاملة مبتكرة، بشكل رئيسي في مجالات الرؤية الحاسوبية، والروبوتات، والتعلم الآلي المطبقة على الزراعة، منذ أوائل العقد الأول من القرن الحادي والعشرين في كولومبيا.