انضم إلينا في اليوم الأول من سلسلة الفعاليات الافتراضية للاستماع إلى متحدثين خبراء حول آخر التطورات في مجال التقاطع بين الذكاء الاصطناعي البصري والزراعة. **التاريخ والوقت** 15 أكتوبر الساعة 9 صباحًا بالتوقيت الهادئ **الموقع** افتراضي. [سجّل الدخول إلى Zoom.](https://voxel51.com/events/visual-ai-in-agriculture-october-15-2025) **Paved2Paradise: محاكاة ليدار قابلة للتوسيع لإدراك العالم الحقيقي** غالبًا ما يتطلب تدريب نماذج الإدراك القوية للروبوتات والاستقلالية وجود مجموعات بيانات ضخمة ومتنوعة ثلاثية الأبعاد. لكن جمع وتصنيف سحب نقاط الليدار من العالم الحقيقي على نطاق واسع أمرٌ مكلفٌ للغاية ويستغرق وقتًا طويلاً، خاصة عند الحاجة إلى تسميات عالية الجودة. يقدم مشروع Paved2Paradise بديلاً اقتصاديًا: وهو خط أنابيب محاكاة ليدار قابل للتوسيع لإنتاج مجموعات بيانات واقعية ومُصنَّفة بالكامل مع الحد الأدنى من الجهد البشري في التسمية. الفكرة الأساسية هي "تحليل العالم الحقيقي" من خلال التقاط فحوص الخلفية (مثل الحقول، الطرق، مواقع البناء) وفحوص الكائنات (مثل المركبات، الأشخاص، الآلات) بشكل منفصل. ومن خلال دمج هذين المصدرَين بذكاء، يمكن لـ Paved2Paradise توليد مجموعة كبيرة من مشاهد التدريب المتنوعة. يتضمن خط الأنابيب أربع خطوات: (1) جمع فحوص ليدار واسعة النطاق للخلفية، (2) تسجيل فحوص عالية الدقة لكائنات الهدف في ظروف مضبوطة، (3) إدخال الكائنات في الخلفيات مع وضع وحجب يتماشيان مع القوانين الفيزيائية، و(4) محاكاة هندسة الليدار لضمان الواقعية. أظهرت التجارب أن النماذج المدرّبة باستخدام بيانات تم إنشاؤها بواسطة Paved2Paradise تنتقل بكفاءة إلى العالم الحقيقي، وتُحقق أداءً قويًا في الكشف مع جهد تصنيف يدوي أقل بكثير مقارنةً بجمع مجموعات البيانات التقليدية. هذه الطريقة ليست فعالة من حيث التكلفة فحسب، بل مرنة أيضًا — مما يتيح للممارسين توسيعها بسهولة إلى فئات كائنات جديدة أو مجالات جديدة عن طريق استبدال فحوص الخلفية أو الكائنات. بالنسبة لممارسي التعلّم الآلي العاملين في الروبوتات، المركبات المستقلة، أو أنظمة الإدراك الحرجة للسلامة، يبرز Paved2Paradise مسارًا عمليًا نحو توسيع بيانات التدريب دون زيادة التكاليف. كما يسد الفجوة بين الأداء في المحاكاة والأداء في العالم الحقيقي، ما يتيح تكرارًا أسرع ونشرًا أكثر موثوقية لنماذج الإدراك. *عن المتحدث* [مايكل أ. ألكورن](https://www.linkedin.com/in/michaelaalcorn/) هو مهندس تعلم آلي أول في شركة John Deere\، حيث يطوّر نماذج تعلّم عميق للإدراك باستخدام الليدار والصور RGB في أنظمة حرجة للسلامة\، تعمل في الوقت الفعلي\. حصل على درجة الدكتوراه في علوم الحاسوب من جامعة أوبرن\، وكان عن أطروحته تحسين الرؤية الحاسوبية والشبكات العصبية العميقة المكانية-الزمنية\، كما يحمل تخصصًا فرعيًا في الرياضيات\. تم الاستشهاد بأبحاث مايكل من قبل باحثين في DeepMind\، Google\، Meta\، Microsoft\، وOpenAI\، من بين آخرين\، كما فاز بجائزة في مؤتمر MIT Sloan Sports Analytics Conference عام 2018 عن ورقته \(batter\|pitcher\)2vec\. كما ساهم برمجيًا في scikit\-learn وApache Solr\، وقد تلقّت مستودعاته على GitHub أكثر من 2\,100 نجمة مجتمعة\، وكانت نقطة انطلاق لأبحاث وأكواد إنتاجية في العديد من المؤسسات المختلفة\. **MothBox: جهاز رصد حشرات منخفض التكلفة ومفتوح المصدر** سيتحدث الدكتور آندي كويتمير عن تصميم أداة علمية جديدة ومثيرة مفتوحة المصدر، Mothbox. إن Mothbox هو مشروع فائز بجوائز لمراقبة واسعة النطاق للحشرات من أجل التنوّع البيولوجي. وهو جهاز منخفض التكلفة تم تطويره في غابات بنما القاسية، يقوم بتصوير صور فائقة الدقة ثم تحديد تلقائي لمستويات التنوّع البيولوجي في الغابات والزراعة. بعد آلاف الملاحظات على الحشرات ومئات النشرات في بنما، بيرو، المكسيك، الإكوادور، والولايات المتحدة، نحن الآن نعمل على تطوير نسخة جديدة قابلة للتصنيع لتعميم هذه الأداة المهمة عالميًا. سنناقش تطوير هذا الجهاز في غابات بنما وأهميته لدراسة التنوّع البيولوجي عالميًا. *عن المتحدث* يصمم الدكتور آندي كويتمير طرقًا جديدة للتفاعل مع العالم الطبيعي. عمل مع منظمات كبيرة مثل Cartoon Network وIDEO وSmithsonian، ودرّس كأستاذ محاضر في جامعة سنغافورة الوطنية، وحتى تم تحويل بحثه إلى سلسلة تلفزيونية (مضحكة) بعنوان "Hacking the Wild"، تم توزيعها عبر Discovery Networks. حاليًا، يقضي معظم وقته في العمل التطوعي مع منظمات صغيرة، ومؤخرًا أسس ورشة العمل الميدانية Digital Naturalism Laboratories. في غابة جامبوا الاستوائية في بنما، تدمج Dinalab العمل الميداني البيولوجي مع الصناعة التكنولوجية ضمن مجتمع من العلماء والفنانين والمهندسين ومحسنّي الحيوانات المحليين والدوليين. وهو حاليًا يستشار كأستاذ مشارك في جامعة واشنطن. **النماذج الأساسية للذكاء الاصطناعي البصري في الزراعة** لقد مكّنت النماذج الأساسية من طريقة جديدة لمعالجة المهام، وذلك بالاستفادة من القدرات الناشئة بطريقة بدون تدريب (zero-shot). في هذا الحديث، سأناقش الأبحاث الحديثة حول تمكين الذكاء الاصطناعي البصري بطريقة بدون تدريب أو عبر الضبط الدقيق (fine-tuning). على وجه التحديد، سأناقش عملًا مشتركًا حول RELOCATE، وهو معيار بسيط لا يتطلب تدريبًا مصممًا لأداء مهمة صعبة تتمثل في تحديد موقع الاستعلامات البصرية في مقاطع فيديو طويلة. لإزالة الحاجة إلى تدريب مخصص للمهمة والتعامل بكفاءة مع مقاطع الفيديو الطويلة، يستفيد RELOCATE من تمثيل قائم على المناطق مستمد من نماذج بصرية مُدرّبة مسبقًا. كما سأناقش عملًا مشتركًا حول تمكين نماذج اللغات الكبيرة متعددة الوسائط (MLLMs) من الإجابة الصحيحة على الأوامر التي تتطلب فهمًا شاملاً مكانياً-زمنياً: فالنماذج MLLMs تجد صعوبة في الإجابة على الأوامر التي تشير إلى 1) البيئة بأكملها التي يمكن لوكيل مزوّد بنموذج MLLM العمل فيها؛ وفي نفس الوقت تشير أيضًا إلى 2) الإجراءات الأخيرة التي حدثت للتو والمُشفّرة في مقطع فيديو. لكن مثل هذا الفهم الشامل مكانياً-زمنياً مهم للوكلاء الذين يعملون في العالم الحقيقي. حلنا يتضمن تطوير خط أنابيب مخصص لجمع البيانات والضبط الدقيق لنموذج MLLM مزوّد بمشعّات لتحسين كل من الفهم المكاني للبيئة والفهم الزمني للملاحظات الحديثة. *عن المتحدث* [أليكس شوينغ](https://www.linkedin.com/in/alexander-s-0a049258/) هو أستاذ مشارك في جامعة إلينوي في أوربانا-شمباين، يعمل مع طلاب موهوبين في مجالات الذكاء الاصطناعي، والذكاء الاصطناعي التوليدي، والرؤية الحاسوبية. حصل على بكالوريوس الهندسة الكهربائية وهندسة المعلومات من الجامعة التقنية بميونيخ عام 2006 و2008 على التوالي، وحصل على درجة الدكتوراه في علوم الحاسوب من ETH زيورخ عام 2014. بعد ذلك انضم إلى جامعة تورونتو كزميل باحث حتى عام 2016. تشمل اهتماماته البحثية مجالات الذكاء الاصطناعي، والذكاء الاصطناعي التوليدي، والرؤية الحاسوبية، حيث شارك في تأليف العديد من الأوراق البحثية حول فهم السيناريوهات، وخوارزميات الاستدلال والتعلم، والتعلّم العميق، ومعالجة الصور واللغة، والنماذج التوليدية. حصلت أطروحته للدكتوراه على ميدالية ETH، وحاز بحث فريقه على جائزة NSF CAREER. **خارج المختبر: كشف الشذوذ في العالم الحقيقي للرؤية الحاسوبية الزراعية** يُحدث كشف الشذوذ ثورة في التصنيع والمراقبة، ولكن ماذا عن الزراعة؟ هل يمكن للذكاء الاصطناعي اكتشاف أمراض النباتات وأضرار الآفات في وقت مبكر بما يكفي لتحقيق فرق؟ يوضح هذا الحديث كيف يحدد كشف الشذوذ مشكلات المحاصيل ويحددها بدقة باستخدام صحة أوراق القهوة كمثال رئيسي. سنبدأ بالنظرية الأساسية، ثم نحلل كيف تكتشف هذه النماذج الصدأ وأضرار المنّ في صور الأوراق. تشمل الجلسة سير عمل شاملًا عمليًا باستخدام أدوات FiftyOne مفتوحة المصدر للرؤية الحاسوبية، ويغطي إدارة مجموعة البيانات، واستخراج القطع، وتدريب النموذج، وتصور النتائج. ستحصل على فهم نظري لكشف الشذوذ في الرؤية الحاسوبية وعلى خبرة عملية في تطبيق هذه التقنيات على التحديات الزراعية وغيرها من المجالات. *عن المتحدث* [بولينا راموس](https://www.linkedin.com/in/paula-ramos-phd/) حاصلة على دكتوراه في الرؤية الحاسوبية والتعلم الآلي، ولديها أكثر من 20 عامًا من الخبرة في المجال التكنولوجي. وهي تطور تقنيات هندسية متكاملة جديدة، وبشكل رئيسي في مجالات الرؤية الحاسوبية، والروبوتات، والتعلم الآلي المطبّق على الزراعة، منذ أوائل العقد الأول من القرن الحادي والعشرين في كولومبيا.