انضم إلينا في اليوم الأول من سلسلة الفعاليات الافتراضية للاستماع إلى خبراء حول آخر التطورات في مجال التقاطع بين الذكاء الاصطناعي البصري والزراعة. **التاريخ والوقت** 15 أكتوبر الساعة 9 صباحًا بالتوقيت الهادئ **المكان** افتراضي. [سجّل الدخول عبر زووم.](https://voxel51.com/events/visual-ai-in-agriculture-october-15-2025) **Paved2Paradise: محاكاة ليدار قابلة للتوسيع من أجل الإدراك في العالم الحقيقي** غالبًا ما يتطلب تدريب نماذج إدراك قوية للروبوتات والاستقلالية وجود مجموعات بيانات ضخمة ومتنوعة ثلاثية الأبعاد. ولكن جمع وتصنيف سحب النقاط الليدارية من العالم الحقيقي بكميات كبيرة أمر مكلف ويتطلب وقتًا طويلاً، خاصة عند الحاجة إلى تسميات عالية الجودة. يقدم Paved2Paradise بديلاً اقتصاديًا: وهو خط أنابيب محاكاة ليدار قابل للتوسيع يُنتج مجموعات بيانات واقعية ومُصنفة بالكامل مع الحد الأدنى من الجهد اليدوي في التصنيف. الفكرة الأساسية هي "تفكيك العالم الحقيقي" من خلال التقاط فحوصات الخلفية (مثل الحقول والطرق ومواقع البناء) وفحوصات الكائنات (مثل المركبات والأشخاص والآلات) بشكل منفصل. ومن خلال دمج هذين المصدرَين بذكاء، يمكن لـ Paved2Paradise توليد عدد كبير من مشاهد التدريب المتنوعة. ويتألف خط الأنابيب من أربع خطوات: (1) جمع فحوصات ليدار واسعة النطاق للخلفية، (2) تسجيل فحوصات عالية الدقة لكائنات الهدف في ظروف مضبوطة، (3) إدخال الكائنات ضمن الخلفيات بوضع متسق فيزيائيًا مع مراعاة الحجب، و(4) محاكاة هندسة الليدار لضمان الواقعية. أظهرت التجارب أن النماذج المدربة على بيانات تم إنشاؤها باستخدام Paved2Paradise تنتقل بكفاءة إلى العالم الحقيقي، وتُحقق أداءً قويًا في الكشف مع حاجة أقل بكثير للتصنيف اليدوي مقارنةً بجمع مجموعة البيانات التقليدية. هذه الطريقة ليست فعالة من حيث التكلفة فحسب، بل أيضًا مرنة – تتيح للممارسين توسيع نطاقهم بسهولة إلى فئات كائنات جديدة أو مجالات جديدة عن طريق استبدال فحوصات الخلفية أو الكائنات بغيرها جديدة. بالنسبة لممارسي التعلّم الآلي العاملين في مجالات الروبوتات أو المركبات المستقلة أو أنظمة الإدراك الحرجة للسلامة، فإن Paved2Paradise يسلط الضوء على مسار عملي لتوسيع بيانات التدريب دون زيادة التكاليف. كما أنه يسد الفجوة بين المحاكاة والأداء في العالم الحقيقي، مما يمكّن من التكرار السريع والنشر الأكثر موثوقية لنماذج الإدراك. *عن المتحدث* [مايكل أ. ألكورن](https://www.linkedin.com/in/michaelaalcorn/) هو مهندس رئيسي للتعلم الآلي في شركة John Deere\، حيث يطوّر نماذج التعلّم العميق لإدراك الليدار والصورة بالألوان (RGB) في أنظمة تتطلب السلامة وتكون في الوقت الفعلي\. حصل على درجة الدكتوراه في علوم الحاسوب من جامعة أوبرن\، مع أطروحة حول تحسين الرؤية الحاسوبية والشبكات العصبية العميقة الزمكانية\، ويحمل أيضًا تخصصًا فرعيًا في الرياضيات\. تم الاستشهاد بأبحاث مايكل من قبل باحثين في DeepMind\، Google\، Meta\، Microsoft\، وOpenAI\، من بين آخرين\، وكانت ورقته \(batter\|pitcher\)2vec فائزة بجائزة في مؤتمر MIT Sloan Sports Analytics Conference عام 2018\. كما ساهم برمجيًا في scikit\-learn وApache Solr\، وقد استُخدم مستودعات GitHub الخاصة به—التي حصلت مجتمعة على أكثر من 2\,100 نجمة—كمصدر أولي لأبحاث وأكواد إنتاجية في العديد من المؤسسات المختلفة\. **MothBox: جهاز رصد حشرات منخفض التكلفة ومفتوح المصدر** سيتحدث الدكتور آندي كوتميير عن تصميم أداة علمية جديدة ومثيرة مفتوحة المصدر، Mothbox. إن Mothbox مشروع فائز بجوائز لمراقبة واسعة النطاق للحشرات من أجل التنوع البيولوجي. إنه جهاز منخفض التكلفة تم تطويره في غابات بنما القاسية، يقوم بالتقاط صور فائقة الدقة ثم يقوم تلقائيًا بتحديد مستويات التنوع البيولوجي في الغابات والزراعة. وبعد آلاف الملاحظات الحشرية ومئات النشرات في بنما، بيرو، المكسيك، الإكوادور، والولايات المتحدة، نحن الآن نطوّر نسخة جديدة قابلة للإنتاج لتعميم هذه الأداة المهمة على مستوى العالم. سنناقش تطوير هذا الجهاز في غابات بنما وأهميته لدراسة التنوع البيولوجي عالميًا. *عن المتحدث* يصمم الدكتور آندي كوتميير طرقًا جديدة للتفاعل مع العالم الطبيعي. عمل مع منظمات كبيرة مثل Cartoon Network وIDEO وSmithsonian، ودرّس كأستاذ مساعد في جامعة سنغافورة الوطنية، وحتى تم تحويل بحثه إلى برنامج تلفزيوني (طرifo) باسم "Hacking the Wild"، تم توزيعه عبر Discovery Networks. حاليًا، يقضي معظم وقته في العمل التطوعي مع منظمات صغيرة، ومؤخرًا أسس ورشة العمل الميدانية، Digital Naturalism Laboratories. في غابة الأمطار في جامبوا ببنما، تدمج Dinalab العمل الميداني البيولوجي مع الصنع التكنولوجي ضمن مجتمع من العلماء والفنيين والمهندسين ومحسنّي الحيوانات المحليين والدوليين. وهو حاليًا يستشار كأستاذ مشارك في جامعة واشنطن. **النماذج الأساسية للذكاء الاصطناعي البصري في الزراعة** لقد مكّنت النماذج الأساسية من أسلوب جديد لمعالجة المهام، وذلك بالاستفادة من القدرات الناشئة بطريقة بدون تدريب (zero-shot). في هذا الحديث سأناقش أحدث الأبحاث المتعلقة بتمكين الذكاء الاصطناعي البصري بطريقة بدون تدريب أو من خلال التعديل الدقيق (fine-tuning). على وجه التحديد، سأناقش عملًا مشتركًا حول RELOCATE، وهي معيار بسيط لا يتطلب تدريبًا مصممًا لأداء مهمة صعبة وهي تحديد موقع الاستعلام البصري في مقاطع فيديو طويلة. للتخلص من الحاجة إلى تدريب خاص بالمهمة ومعالجة مقاطع الفيديو الطويلة بكفاءة، يستفيد RELOCATE من تمثيل قائم على المناطق مستمد من نماذج بصرية مُدرّبة مسبقًا. كما سأناقش عملًا مشتركًا حول تمكين نماذج اللغات الكبيرة متعددة الوسائط (MLLMs) للإجابة الصحيحة على الطلبات التي تتطلب فهمًا شاملاً مكانياً-زمانياً: إذ تعاني النماذج متعددة الوسائط من صعوبة في الإجابة على طلبات تشير إلى 1) البيئة بأكملها التي يستطيع وكيل مزود بنموذج MLLM العمل فيها؛ وفي نفس الوقت تشير أيضًا إلى 2) الإجراءات الأخيرة التي حدثت للتو والتي تم ترميزها في مقطع فيديو. لكن مثل هذا الفهم الشامل المكاني-الزماني مهم للوكلاء الذين يعملون في العالم الحقيقي. وتشمل حلولنا تطوير خط أنابيب مخصص لجمع البيانات والتعديل الدقيق لنموذج MLLM مجهز بمشعات لتحسين كل من الفهم المكاني للبيئة والفهم الزمني للملاحظات الأخيرة. *عن المتحدث* [ألكس شوينغ](https://www.linkedin.com/in/alexander-s-0a049258/) هو أستاذ مشارك في جامعة إلينوي في أوربانا-شامبين، يعمل مع طلاب موهوبين في مجالات الذكاء الاصطناعي والذكاء الاصطناعي التوليدي والرؤية الحاسوبية. حصل على بكالوريوس ودبلوم في الهندسة الكهربائية وتكنولوجيا المعلومات من الجامعة التقنية في ميونيخ عامي 2006 و2008 على التوالي، وحصل على درجة الدكتوراه في علوم الحاسوب من ETH زيورخ عام 2014. بعد ذلك انضم إلى جامعة تورونتو كزميل ما بعد الدكتوراه حتى عام 2016. تتركز اهتماماته البحثية في مجالات الذكاء الاصطناعي والذكاء الاصطناعي التوليدي والرؤية الحاسوبية، حيث شارك في تأليف العديد من الأوراق العلمية حول مواضيع في فهم المشهد وخوارزميات الاستدلال والتعلم والتعلم العميق ومعالجة الصور واللغة والنماذج التوليدية. ونالت أطروحته للدكتوراه ميدالية ETH، وفاز بحث فريقه بجائزة NSF CAREER. **خارج المختبر: كشف الشذوذ في العالم الحقيقي للرؤية الحاسوبية الزراعية** يُحدث كشف الشذوذ تغييرًا في التصنيع والمراقبة، لكن ماذا عن الزراعة؟ هل يمكن للذكاء الاصطناعي اكتشاف أمراض النباتات وأضرار الآفات مبكرًا بما يكفي لصنع فرق؟ يوضح هذا الحديث كيف يحدد كشف الشذوذ مشكلات المحاصيل ويحلل مواقعها باستخدام صحة أوراق البن كمثال رئيسي. سنبدأ بالنظرية الأساسية، ثم ندرس كيف تكتشف هذه النماذج صدأ الورقة وأضرار المنشار في صور الأوراق. تشمل الجلسة سير عمل شاملًا عمليًا باستخدام مجموعة أدوات الرؤية الحاسوبية المفتوحة المصدر FiftyOne، تغطي إدارة مجموعة البيانات واستخلاص القطع (patches) وتدريب النموذج وعرض النتائج. ستحصل على فهم نظري لكشف الشذوذ في الرؤية الحاسوبية، بالإضافة إلى تجربة عملية في تطبيق هذه التقنيات على التحديات الزراعية وغيرها من المجالات. *عن المتحدث* [بولينا راموس](https://www.linkedin.com/in/paula-ramos-phd/) حاصلة على دكتوراه في الرؤية الحاسوبية والتعلم الآلي، ولديها أكثر من 20 عامًا من الخبرة في المجال التكنولوجي. تعمل منذ أوائل العقد الأول من القرن الحادي والعشرين في كولومبيا على تطوير تقنيات هندسية متكاملة جديدة، تركز أساسًا على الرؤية الحاسوبية والروبوتات والتعلم الآلي المطبقة في الزراعة.