انضم إلينا في اليوم الأول من سلسلة الفعاليات الافتراضية للاستماع إلى خبراء حول أحدث التطورات في مجال التقاطع بين الذكاء الاصطناعي البصري والزراعة. **التاريخ والوقت** 15 أكتوبر الساعة 9 صباحًا بالتوقيت الباسيفيكي **الموقع** افتراضي. [سجّل في Zoom.](https://voxel51.com/events/visual-ai-in-agriculture-october-15-2025) **Paved2Paradise: محاكاة ليدار قابلة للتوسيع لإدراك العالم الحقيقي** غالبًا ما يتطلب تدريب نماذج إدراك قوية للروبوتات والأنظمة المستقلة مجموعات بيانات ضخمة ومتنوعة ثلاثية الأبعاد. ولكن جمع وتصنيف سحب نقاط ليدار من العالم الحقيقي بكميات كبيرة أمر مكلف ويتطلب وقتًا طويلاً، خاصة عند الحاجة إلى تسميات عالية الجودة. يقدم Paved2Paradise بديلاً اقتصاديًا: وهو خط أنابيب محاكاة ليدار قابل للتوسيع لإنشاء مجموعات بيانات واقعية ومكتملة التسمية بجهد تصنيف بشري ضئيل. الفكرة الأساسية هي "تحليل العالم الحقيقي" من خلال التقاط مسح للخلفيات (مثل الحقول، الطرق، مواقع البناء) ومسح للأشياء (مثل المركبات، الأشخاص، الآلات) بشكل منفصل. ومن خلال دمج هذين المصدرَين بذكاء، يمكن لـ Paved2Paradise توليد مجموعة كبيرة جدًا من مشاهد التدريب المتنوعة. يتضمن خط الأنابيب أربع خطوات: (1) جمع مسحات ليدار واسعة النطاق للخلفيات، (2) تسجيل مسحات عالية الدقة للأشياء المستهدفة في ظروف خاضعة للتحكم، (3) إدخال الأشياء في الخلفيات مع وضع وحجب متسقين من الناحية الفيزيائية، (4) محاكاة هندسة الليدار لضمان الواقعية. أظهرت التجارب أن النماذج المدربة على بيانات تم إنشاؤها باستخدام Paved2Paradise تنتقل بكفاءة إلى العالم الحقيقي، وتحقق أداءً قويًا في الكشف مع تقليل كبير في التسمية اليدوية مقارنةً بجمع مجموعة البيانات التقليدي. هذه الطريقة ليست فعالة من حيث التكلفة فحسب، بل مرنة أيضًا — تسمح للممارسين بسهولة التوسع إلى فئات أو مجالات كائنات جديدة من خلال استبدال مسحات الخلفية أو الكائنات. بالنسبة لممارسي التعلم الآلي العاملين في الروبوتات، أو المركبات المستقلة، أو أنظمة الإدراك الحرجة للسلامة، يبرز Paved2Paradise طريقًا عمليًا نحو توسيع بيانات التدريب دون زيادة التكاليف. وهو يسد الفجوة بين المحاكاة والأداء في العالم الحقيقي، مما يتيح التكرار الأسرع والنشر الأكثر موثوقية لنماذج الإدراك. *عن المتحدث* [مايكل أ. ألكورن](https://www.linkedin.com/in/michaelaalcorn/) هو مهندس تعلم آلي أول في John Deere\، حيث يطور نماذج تعلم عميق للإدراك باستخدام الليدار والصورة الملونة في أنظمة حرجة للسلامة وتعمل في الوقت الفعلي\. حصل على درجة الدكتوراه في علوم الحاسوب من جامعة أوبرن\، مع أطروحة حول تحسين الرؤية الحاسوبية والشبكات العصبية العميقة المكانية-الزمنية\، وله أيضًا تخصص فرعي في الرياضيات\. تم الاستشهاد بأبحاث مايكل من قبل باحثين في DeepMind\، Google\، Meta\، Microsoft\، وOpenAI\، من بين آخرين\، وكانت ورقة \(batter\|pitcher\)2vec الخاصة به فائزة بجائزة في مؤتمر MIT Sloan Sports Analytics 2018\. كما ساهم برمجيات تعلم آلي في scikit\-learn وApache Solr\، وقد تلقى مستودعات GitHub الخاصة به — التي حصلت مجتمعة على أكثر من 2\,100 نجمة — دعمًا كنقاط بداية لأبحاث وشفرات إنتاجية في العديد من المنظمات المختلفة\. **MothBox: جهاز رصد حشرات منخفض التكلفة ومفتوح المصدر** سيتحدث الدكتور آندي كويتماير عن تصميم أداة علمية مفتوحة المصدر مثيرة جديدة، Mothbox. يعد Mothbox مشروعًا فائزًا بالجائزة لمراقبة الحشرات على نطاق واسع لأغراض التنوع البيولوجي. إنه جهاز منخفض التكلفة تم تطويره في غابات بنما القاسية، ويُجري صورًا فائقة الدقة ثم يقوم تلقائيًا بتحديد مستويات التنوع البيولوجي في الغابات والزراعة. بعد آلاف الملاحظات الحشرية ومئات النشرات في بنما، بيرو، المكسيك، الإكوادور، والولايات المتحدة، نحن الآن نطور نسخة جديدة قابلة للإنتاج لنشارك هذه الأداة المهمة في جميع أنحاء العالم. سنناقش تطوير هذا الجهاز في غابات بنما وأهميته لدراسة التنوع البيولوجي عالميًا. *عن المتحدث* يصمم الدكتور آندي كويتماير طرقًا جديدة للتفاعل مع العالم الطبيعي. عمل مع منظمات كبيرة مثل Cartoon Network وIDEO وSmithsonian، ودرّس كأستاذ على مسار الترقي الوظيفي في الجامعة الوطنية السنغافورية، وتم حتى تحويل بحثه إلى سلسلة تلفزيونية (متهورة) بعنوان "Hacking the Wild"، موزعة بواسطة Discovery Networks. الآن، يقضي معظم وقته في العمل التطوعي مع منظمات صغيرة، ومؤخرًا أسس ورشة عمل المختبرات الميدانية، Digital Naturalism Laboratories. في غابة الأمطار في جامبوا، بنما، تدمج Dinalab بين العمل الميداني البيولوجي والصناعة التكنولوجية مع مجتمع من العلماء والفنانين والمهندسين ومتعافي الحيوانات المحليين والدوليين. وهو حاليًا مستشار طلاب أيضًا كبروفيسور متعاون في جامعة واشنطن. **النماذج الأساسية للذكاء الاصطناعي البصري في الزراعة** لقد مكّنت النماذج الأساسية من طريقة جديدة لمعالجة المهام، من خلال الاستفادة من القدرات الناشئة بطريقة بدون تدريب. في هذا الحديث، سأناقش أحدث الأبحاث حول تمكين الذكاء الاصطناعي البصري بطريقة بدون تدريب أو من خلال ضبط دقيق. على وجه التحديد، سأناقش العمل المشترك حول RELOCATE، وهو خط أساس بسيط لا يتطلب تدريبًا مصممًا لأداء مهمة تحديد موقع الاستعلام البصري في مقاطع فيديو طويلة. لإزالة الحاجة إلى تدريب خاص بالمهمة والتعامل بكفاءة مع مقاطع الفيديو الطويلة، يستفيد RELOCATE من تمثيل قائم على المناطق مستمد من نماذج رؤية مسبقة التدريب. سأناقش أيضًا العمل المشترك حول تمكين نماذج اللغة الكبيرة متعددة الوسائط (MLLMs) من الإجابة الصحيحة على المطالبات التي تتطلب فهمًا شاملاً مكانيًا-زمانيًا: تجد النماذج MLLM صعوبة في الإجابة على المطالبات التي تشير إلى 1) البيئة بأكملها التي يمكن لوكيل مزود بـ MLLM العمل فيها؛ وفي نفس الوقت تشير أيضًا إلى 2) الإجراءات الحديثة التي حدثت للتو ومُشفرة في مقطع فيديو. ومع ذلك، فإن هذا الفهم الشامل المكاني-الزماني مهم للوكلاء الذين يعملون في العالم الحقيقي. يشمل حلنا تطوير خط أنابيب جمع بيانات مخصص وضبط دقيق لنموذج MLLM مزود بمشعات لتحسين الفهم المكاني للبيئة والفهم الزمني للملاحظات الحديثة. *عن المتحدث* [ألكس شوينغ](https://www.linkedin.com/in/alexander-s-0a049258/) هو أستاذ مشارك في جامعة إلينوي في أوربانا-شمباين، يعمل مع طلاب موهوبين في مجالات الذكاء الاصطناعي، والذكاء الاصطناعي التوليدي، والرؤية الحاسوبية. حصل على درجة البكالوريوس والدبلوم في الهندسة الكهربائية وتكنولوجيا المعلومات من الجامعة التقنية في ميونخ عام 2006 و2008 على التوالي، وحصل على درجة الدكتوراه في علوم الحاسوب من ETH زيورخ عام 2014. بعد ذلك انضم إلى جامعة تورونتو كزميل ما بعد الدكتوراه حتى عام 2016. تتركز اهتماماته البحثية في مجالات الذكاء الاصطناعي، والذكاء الاصطناعي التوليدي، والرؤية الحاسوبية، حيث شارك في تأليف العديد من الأوراق حول موضوعات في فهم المشهد، وخوارزميات الاستدلال والتعلم، والتعلم العميق، وتجهيز الصور واللغة، والنمذجة التوليدية. حصلت أطروحته للدكتوراه على ميدالية ETH، وتم منح بحث فريقه جائزة NSF CAREER. **خارج المختبر: كشف الشذوذ في العالم الحقيقي للرؤية الحاسوبية الزراعية** يُحدث كشف الشذوذ تغييرًا في التصنيع والمراقبة، ولكن ماذا عن الزراعة؟ هل يمكن للذكاء الاصطناعي أن يكشف حقًا عن أمراض النباتات وأضرار الآفات مبكرًا بما يكفي لصنع فرق؟ يوضح هذا الحديث كيف يحدد كشف الشذوذ ويحلل مشكلات المحاصيل باستخدام صحة أوراق البن كمثال رئيسي. سنبدأ بالنظرية الأساسية، ثم نفحص كيف تكتشف هذه النماذج صدأ الأوراق وأضرار العاملين. تشمل الجلسة سير عمل شاملاً عمليًا باستخدام أدوات الرؤية الحاسوبية المفتوحة المصدر FiftyOne، تغطي تهيئة مجموعة البيانات، واستخراج القطع، وتدريب النموذج، وتصور النتائج. ستحصل على فهم نظري لكشف الشذوذ في الرؤية الحاسوبية وتجربة عملية تطبيق هذه التقنيات على التحديات الزراعية وغيرها من المجالات. *عن المتحدث* [باولا راموس](https://www.linkedin.com/in/paula-ramos-phd/) تحمل درجة الدكتوراه في الرؤية الحاسوبية والتعلم الآلي، ولديها أكثر من 20 عامًا من الخبرة في المجال التكنولوجي. وهي تطور تقنيات هندسية متكاملة جديدة، خاصة في مجالات الرؤية الحاسوبية، والروبوتات، والتعلم الآلي المطبقة على الزراعة، منذ أوائل العقد الأول من القرن الحادي والعشرين في كولومبيا.