انضم إلينا في اليوم الأول من سلسلة الفعاليات الافتراضية للاستماع إلى متحدثين خبراء حول أحدث التطورات في مجال التقاء الذكاء الاصطناعي البصري والزراعة. **التاريخ والوقت** 15 أكتوبر الساعة 9 صباحًا (التوقيت الهادئ) **المكان** افتراضي. [سجّل الدخول إلى Zoom.](https://voxel51.com/events/visual-ai-in-agriculture-october-15-2025) **Paved2Paradise: محاكاة ليدار قابلة للتوسيع من أجل الإدراك في العالم الحقيقي** غالبًا ما يتطلب تدريب نماذج الإدراك القوية للروبوتات والاستقلالية بيانات ضخمة ومتنوعة ثلاثية الأبعاد. ولكن جمع وتصنيف سحب نقاط ليدار من العالم الحقيقي على نطاق واسع عملية مكلفة وطويلة، خاصة عند الحاجة إلى تسميات عالية الجودة. يقدم مشروع Paved2Paradise بديلاً اقتصاديًا: خط أنابيب محاكاة ليدار قابل للتوسيع لإنتاج بيانات واقعية ومكتملة التصنيف مع الحد الأدنى من الجهد البشري في التسمية. الفكرة الأساسية هي "تفكيك العالم الحقيقي" من خلال التقاط مسح للخلفيات (مثل الحقول والطرق ومواقع البناء) ومسح للأشياء (مثل المركبات والأشخاص والآلات) بشكل منفصل. وبدمج هذين المصدرَين بذكاء، يمكن لـ Paved2Paradise توليد عدد كبير من مشاهد التدريب المتنوعة. يتضمن خط الأنابيب أربع خطوات: (1) جمع مسح ليدار واسع النطاق للخلفيات، (2) تسجيل مسح عالي الدقة للأشياء المستهدفة في ظروف خاضعة للرقابة، (3) إدخال الأشياء في الخلفيات مع وضع وحجب يتماشيان مع القوانين الفيزيائية، (4) محاكاة هندسة ليدار لضمان الواقعية. أظهرت التجارب أن النماذج المدربة على بيانات تم إنشاؤها باستخدام Paved2Paradise تنتقل بكفاءة إلى العالم الحقيقي، وتحقق أداءً قويًا في الكشف مع تقليل كبير في التصنيف اليدوي مقارنةً بجمع البيانات التقليدي. هذه الطريقة ليست فعالة من حيث التكلفة فحسب، بل أيضًا مرنة – تسمح للممارسين بتوسيع النموذج بسهولة إلى فئات أو مجالات جديدة من الأشياء من خلال استبدال مسح الخلفيات أو الأشياء. بالنسبة لممارسي التعلم الآلي العاملين في الروبوتات أو المركبات ذاتية القيادة أو أنظمة الإدراك الحرجة للسلامة، يُظهر Paved2Paradise مسارًا عمليًا نحو توسيع بيانات التدريب دون توسيع التكاليف. وهو يُقلّص الفجوة بين الأداء في المحاكاة والأداء في العالم الحقيقي، ما يتيح تكرارًا أسرع ونشرًا أكثر موثوقية لنماذج الإدراك. *عن المتحدث* [مايكل أ. ألكورن](https://www.linkedin.com/in/michaelaalcorn/) هو مهندس تعلم آلي أول في شركة جون دير، حيث يُطوّر نماذج التعلم العميق لإدراك ليدار والصور الملونة (RGB) في أنظمة حرجة للسلامة وتُعمل في الزمن الحقيقي. حصل على درجة الدكتوراه في علوم الحاسوب من جامعة أوبرن، مع أطروحة حول تحسين الرؤية الحاسوبية والشبكات العصبية العميقة المكانية-الزمنية، كما يمتلك تخصصًا فرعيًا في الرياضيات. تم الاستشهاد بأبحاث مايكل من قبل باحثين في DeepMind وGoogle وMeta وMicrosoft وOpenAI، من بين آخرين، وكانت ورقة \(batter\|pitcher\)2vec الخاصة به فائزة بجائزة في مؤتمر MIT Sloan لتحليلات رياضة 2018. كما ساهم برمجيًا في scikit\-learn وApache Solr، وتم استخدام مستودعات GitHub الخاصة به – التي حصلت مجتمعة على أكثر من 2\,100 نجمة – كنقطة بداية لأبحاث وشفرات إنتاجية في العديد من المؤسسات المختلفة. **MothBox: جهاز رصد حشرات منخفض التكلفة ومفتوح المصدر** سيتحدث الدكتور آندي كويتماير عن تصميم أداة علمية جديدة ومثيرة مفتوحة المصدر، تُسمى Mothbox. إن Mothbox مشروع فائز بجائزة لمراقبة الحشرات على نطاق واسع من أجل التنوع البيولوجي. إنها جهاز منخفض التكلفة تم تطويره في غابات بنما القاسية، ويُجري صورًا فائقة الدقة ثم يقوم تلقائيًا بتحديد مستويات التنوع البيولوجي في الغابات والزراعة. بعد آلاف الملاحظات على الحشرات ومئات النشرات في بنما وبيرو والمكسيك والإكوادور والولايات المتحدة، نحن الآن نُطوّر نسخة جديدة قابلة للتصنيع لنشارك هذه الأداة المهمة في جميع أنحاء العالم. سنناقش تطوير هذا الجهاز في غابات بنما وأهميته لدراسة التنوع البيولوجي عالميًا. *عن المتحدث* يُصمم الدكتور آندي كويتماير طرقًا جديدة للتفاعل مع العالم الطبيعي. عمل مع منظمات كبيرة مثل شبكة كرتون نتورك وIDEO وسميثسونيان، ودرّس كبروفيسور في مسار الترقي الوظيفي في الجامعة الوطنية السنغافورية، وحتى تم تحويل بحثه إلى سلسلة تلفزيونية (سخيفة) بعنوان "اختراق البرية"، تم توزيعها بواسطة شبكة ديسكفري. حاليًا، يُكرّس معظم وقته للعمل التطوعي مع منظمات صغيرة، ومؤخرًا أسس ورشة العمل في موقع الحقل، مختبرات Digital Naturalism. في غابة مطيرة في جامبوا ببنما، يجمع Dinalab بين العمل الميداني البيولوجي والصناعة التكنولوجية مع مجتمع من العلماء والفنانين والمهندسين ومتخصصي إعادة تأهيل الحيوانات المحليين والدوليين. وهو حاليًا أيضًا مستشار للطلاب كبروفيسور مشارك في جامعة واشنطن. **النماذج الأساسية للذكاء الاصطناعي البصري في الزراعة** لقد مكّنت النماذج الأساسية من طريقة جديدة لمعالجة المهام، من خلال الاستفادة من القدرات الناشئة بطريقة خالية من التدريب (zero-shot). في هذا الحديث سأناقش أبحاثًا حديثة حول تمكين الذكاء الاصطناعي البصري بطريقة خالية من التدريب أو من خلال التعديل الدقيق (fine-tuning). على وجه التحديد، سأناقش العمل المشترك حول RELOCATE، وهو معيار بسيط لا يتطلب تدريبًا مصممًا لأداء المهمة الصعبة لتحديد موقع الاستعلام البصري في مقاطع فيديو طويلة. للتخلص من الحاجة إلى تدريب مخصص للمهمة والتعامل بكفاءة مع مقاطع الفيديو الطويلة، يستفيد RELOCATE من تمثيل قائم على المناطق مشتق من نماذج بصرية مُدرّبة مسبقًا. سأناقش أيضًا العمل المشترك المتعلق بتمكين نماذج اللغات الكبيرة متعددة الوسائط (MLLMs) من الإجابة الصحيحة على الأوامر التي تتطلب فهمًا شاملاً مكانياً-زمنياً: حيث تواجه النماذج متعددة الوسائط صعوبة في الإجابة على الأوامر التي تشير إلى 1) البيئة بأكملها التي يمكن لعامل مزود بـ MLLM العمل فيها؛ وتشير في الوقت نفسه إلى 2) الإجراءات الحديثة التي حدثت للتو ومُرمّزة في مقطع فيديو. إلا أن هذا الفهم الشامل المكاني-الزماني مهم للوكلاء العاملين في العالم الحقيقي. يشمل حلنا تطوير خط أنابيب مخصص لجمع البيانات وتعديل نموذج لغوي متعدد الوسائط مزود بمشعّات لتحسين الفهم المكاني للبيئة والفهم الزمني للملاحظات الحديثة. *عن المتحدث* [ألكس شوينغ](https://www.linkedin.com/in/alexander-s-0a049258/) هو أستاذ مشارك في جامعة إلينوي في أوربانا-شامبين، يعمل مع طلاب موهوبين في مجالات الذكاء الاصطناعي والذكاء الاصطناعي التوليدي والرؤية الحاسوبية. حصل على درجة البكالوريوس والدبلوم في الهندسة الكهربائية وتكنولوجيا المعلومات من الجامعة التقنية في ميونخ عامي 2006 و2008 على التوالي، ونال درجة الدكتوراه في علوم الحاسوب من ETH زيورخ في 2014. بعد ذلك انضم إلى جامعة تورونتو كزميل ما بعد الدكتوراه حتى عام 2016. تتمحور اهتماماته البحثية حول الذكاء الاصطناعي والذكاء الاصطناعي التوليدي والرؤية الحاسوبية، حيث شارك في تأليف العديد من الأوراق العلمية في مواضيع فهم المشهد وخوارزميات الاستدلال والتعلم والتعلم العميق ومعالجة الصور واللغة والنماذج التوليدية. حصلت أطروحته للدكتوراه على ميدالية ETH، وحاز بحث فريقه على جائزة NSF CAREER. **ما وراء المختبر: كشف الشذوذ في العالم الحقيقي للرؤية الحاسوبية الزراعية** يُحدث كشف الشذوذ تغييرًا في التصنيع والمراقبة، ولكن ماذا عن الزراعة؟ هل يمكن للذكاء الاصطناعي اكتشاف أمراض النباتات وأضرار الآفات مبكرًا بما يكفي لصنع فرق؟ يُظهر هذا الحديث كيف يحدد كشف الشذوذ مشكلات المحاصيل ويُحلل مواقعها باستخدام صحة أوراق القهوة كمثال رئيسي. سنبدأ بالنظرية الأساسية، ثم ندرس كيف تكتشف هذه النماذج الصدأ وأضرار العُثّ في صور الأوراق. يشمل الجلسة سير عمل عملي شامل باستخدام أداة FiftyOne مفتوحة المصدر للرؤية الحاسوبية، ويغطي تجميع البيانات، واستخراج القطع، وتدريب النموذج، وتصور النتائج. ستحصل على فهم نظري لكشف الشذوذ في الرؤية الحاسوبية، بالإضافة إلى خبرة عملية في تطبيق هذه التقنيات على التحديات الزراعية وحقول أخرى. *عن المتحدث* [باولا راموس](https://www.linkedin.com/in/paula-ramos-phd/) تحمل درجة الدكتوراه في الرؤية الحاسوبية والتعلم الآلي، ولديها أكثر من 20 عامًا من الخبرة في المجال التكنولوجي. تعمل على تطوير تقنيات هندسية متكاملة جديدة، خصوصًا في مجالات الرؤية الحاسوبية والروبوتات والتعلم الآلي المطبقة على الزراعة، منذ أوائل العقد الأول من القرن الحادي والعشرين في كولومبيا.