انضم إلينا في اليوم الأول من سلسلة الفعاليات الافتراضية للاستماع إلى خبراء حول أحدث التطورات في مجال التقاء الذكاء الاصطناعي البصري بالزراعة. **التاريخ والوقت** 15 أكتوبر الساعة 9 صباحًا (المنطقة الزمنية للساحل الهادئ) **المكان** افتراضي. [سجّل الدخول عبر زووم.](https://voxel51.com/events/visual-ai-in-agriculture-october-15-2025) **Paved2Paradise: محاكاة ليدار قابلة للتوسيع من أجل إدراك العالم الواقعي** غالبًا ما يتطلب تدريب نماذج الإدراك القوية للروبوتات والاستقلالية وجود مجموعات بيانات ثلاثية الأبعاد ضخمة ومتنوعة. لكن جمع وتصنيف سحب نقاط ليدار من العالم الواقعي على نطاق واسع عملية مكلفة وطويلة، خاصة عند الحاجة إلى تسميات عالية الجودة. يقدم Paved2Paradise بديلاً اقتصاديًا: خط أنابيب محاكاة ليدار قابل للتوسيع لإنتاج مجموعات بيانات واقعية ومُصنَّفة بالكامل بجهد تسمية بشري ضئيل. الفكرة الأساسية هي "تحليل العالم الواقعي" من خلال التقاط مسح خلفية (مثل الحقول، الطرق، مواقع البناء) ومسح كائنات (مثل المركبات، الأشخاص، الآلات) بشكل منفصل. وبدمج هذين المصدرَين بذكاء، يمكن لـ Paved2Paradise توليد عدد كبير توفيقيًا من مشاهد التدريب المتنوعة. يتضمن خط الأنابيب أربع خطوات: (1) جمع مسح ليدار خلفي واسع النطاق، (2) تسجيل مسح عالي الدقة لكائنات الهدف في ظروف مضبوطة، (3) إدخال الكائنات في الخلفيات مع وضع وحجب متسقين فيزيائيًا، و(4) محاكاة هندسة الليدار لضمان الواقعية. أظهرت التجارب أن النماذج المدربة على بيانات تم إنشاؤها بواسطة Paved2Paradise تنتقل بفعالية إلى العالم الحقيقي، وتحقق أداءً قويًا في الكشف مع تقليل كبير في التصنيف اليدوي مقارنةً بجمع مجموعة البيانات التقليدي. هذه الطريقة ليست فعالة من حيث التكلفة فحسب، بل مرنة أيضًا — مما يسمح للممارسين بسهولة التوسع إلى فئات أو مجالات كائنات جديدة عن طريق استبدال مسح الخلفية أو الكائنات بمسوحات جديدة. بالنسبة لممارسي التعلم الآلي العاملين في مجالات الروبوتات، المركبات المستقلة، أو أنظمة الإدراك الحرجة للسلامة، يبرز Paved2Paradise مسارًا عمليًا نحو توسيع بيانات التدريب دون توسيع التكاليف. إنه يُقلِّص الفجوة بين المحاكاة والأداء في العالم الحقيقي، مما يتيح التكرار الأسرع والنشر الأكثر موثوقية لنماذج الإدراك. *عن المتحدث* [مايكل أ. ألكورن](https://www.linkedin.com/in/michaelaalcorn/) هو مهندس تعلم آلي أول في شركة جون دير، حيث يطور نماذج التعلم العميق لاستشعار الليدار والصورة الحمراء-الخضراء-الزرقاء (RGB) في أنظمة حرجة للسلامة وتُعمل في الزمن الحقيقي. حصل على درجة الدكتوراه في علوم الحاسوب من جامعة أوبرن، مع أطروحة حول تحسين الرؤية الحاسوبية والشبكات العصبية العميقة الزمكانية، ويحمل أيضًا تخصصًا فرعيًا في الرياضيات. تم الاستشهاد بأبحاث مايكل من قبل باحثين في DeepMind، جوجل، ميتا، مايكروسوفت، وOpenAI، من بين آخرين، كما فاز ورقة \(batter\|pitcher\)2vec الخاصة به بجائزة في مؤتمر MIT Sloan للإحصائيات الرياضية 2018. كما ساهم برمجيًا في scikit\-learn وApache Solr، وقد استُخدم مستودعات GitHub الخاصة به — التي تلقّت مجتمعة أكثر من 2\,100 نجمة — كنقاط بداية لأبحاث وشفرات إنتاجية في العديد من المؤسسات المختلفة. **MothBox: جهاز مراقبة آفات منخفض التكلفة ومفتوح المصدر** سيتحدث الدكتور آندي كويتميير عن تصميم أداة علمية مفتوحة المصدر ومثيرة جديدة، Mothbox. إن Mothbox مشروع حائز على جوائز لمراقبة واسعة النطاق للحشرات من أجل التنوع البيولوجي. إنه جهاز منخفض التكلفة تم تطويره في غابات بنما القاسية، ويُجري صورًا عالية الدقة جدًا ثم يقوم تلقائيًا بتحديد مستويات التنوع البيولوجي في الغابات والزراعة. بعد آلاف الملاحظات الحشرية ومئات النشرات في بنما، بيرو، المكسيك، الإكوادور، والولايات المتحدة، نحن الآن نُطوّر نسخة جديدة قابلة للتصنيع لنشارك هذه الأداة المهمة على مستوى العالم. سنناقش تطوير هذا الجهاز في غابات بنما وأهميته لدراسة التنوع البيولوجي عالميًا. *عن المتحدث* يصمم الدكتور آندي كويتميير طرقًا جديدة للتفاعل مع العالم الطبيعي. عمل مع منظمات كبيرة مثل شبكة كرتون نتورك، IDEO، ومؤسسة سميثسونيان، ودرّس كأستاذ على ملاك التعيين الدائم في الجامعة الوطنية السنغافورية، بل وتم تحويل بحثه إلى سلسلة تلفزيونية (مضحكة) بعنوان "Hacking the Wild"، موزعة بواسطة شبكات ديسكفري. حاليًا، يقضي معظم وقته في العمل التطوعي مع منظمات صغيرة، وشارك مؤخرًا في تأسيس ورشة العمل الميدانية، Digital Naturalism Laboratories. في غابة مطيرة في جامبوا ببنما، يجمع Dinalab بين العمل الميداني البيولوجي والصناعة التكنولوجية مع مجتمع من العلماء والفنانين والمهندسين ومتخصصي إعادة تأهيل الحيوانات المحليين والدوليين. كما يُقدّم حاليًا استشارات للطلاب بصفته أستاذًا مرتبطًا في جامعة واشنطن. **النماذج الأساسية للذكاء الاصطناعي البصري في الزراعة** لقد مكّنت النماذج الأساسية من طريقة جديدة لمعالجة المهام، وذلك بالاستفادة من القدرات الناشئة بطريقة بدون تدريب (zero-shot). في هذا الحديث، سأناقش أبحاثًا حديثة حول تمكين الذكاء الاصطناعي البصري بطريقة بدون تدريب أو عبر ضبط دقيق (fine-tuning). على وجه التحديد، سأناقش عملًا مشتركًا حول RELOCATE، وهو معيار بسيط لا يتطلب تدريبًا مصممًا لأداء المهمة الصعبة لتحديد موقع الاستعلام البصري في مقاطع فيديو طويلة. للتخلص من الحاجة إلى تدريب خاص بالمهمة والتعامل بكفاءة مع مقاطع الفيديو الطويلة، يستفيد RELOCATE من تمثيل قائم على المناطق مشتق من نماذج بصرية مُدرّبة مسبقًا. سأناقش أيضًا عملًا مشتركًا حول تمكين نماذج اللغات الكبيرة متعددة الوسائط (MLLMs) من الإجابة الصحيحة على الاستعلامات التي تتطلب فهمًا شموليًا مكانزمنيًا: تجد النماذج الصعبة صعوبة في الإجابة على استعلامات تشير إلى 1) البيئة بأكملها التي يمكن لوكيل مزود بنموذج MLLM العمل فيها؛ وتُشير في نفس الوقت إلى 2) الإجراءات الحديثة التي حدثت للتو وتم ترميزها في مقطع فيديو. ومع ذلك، فإن هذا الفهم الشمولي المكانزمني مهم للوكلاء العاملين في العالم الحقيقي. يتمثل حلنا في تطوير خط أنابيب مخصص لجمع البيانات وضبط نموذج MLLM مزود بمشعّات لتحسين كل من الفهم المكاني للبيئة والفهم الزمني للملاحظات الحديثة. *عن المتحدث* [ألكس شوينغ](https://www.linkedin.com/in/alexander-s-0a049258/) أستاذ مشارك في جامعة إلينوي في أوربانا-شامبين، يعمل مع طلاب موهوبين في مجالات الذكاء الاصطناعي، والذكاء الاصطناعي التوليدي، والرؤية الحاسوبية. تلقّى درجة البكالوريوس والدبلوم في الهندسة الكهربائية وتكنولوجيا المعلومات من الجامعة التقنية في ميونيخ عامي 2006 و2008 على التوالي، وحصل على درجة الدكتوراه في علوم الحاسوب من ETH زيورخ عام 2014. بعد ذلك، انضم إلى جامعة تورونتو كزميل باحث ما بعد الدكتوراه حتى عام 2016. تتمحور اهتماماته البحثية حول الذكاء الاصطناعي، والذكاء الاصطناعي التوليدي، والرؤية الحاسوبية، حيث شارك في تأليف العديد من الأوراق العلمية في مجالات فهم السيناريو، وخوارزميات الاستدلال والتعلم، والتعلم العميق، وتجهيز الصور واللغة، والنماذج التوليدية. مُنحت أطروحته للدكتوراه ميدالية ETH، وحاز بحث فريقه على جائزة NSF CAREER. **ما وراء المختبر: كشف الشذوذ في العالم الحقيقي للرؤية الحاسوبية الزراعية** يُحدث كشف الشذوذ تغييرًا في التصنيع والمراقبة، ولكن ماذا عن الزراعة؟ هل يمكن للذكاء الاصطناعي اكتشاف أمراض النباتات وأضرار الآفات مبكرًا بما يكفي لصنع فرق؟ يُظهر هذا الحديث كيف يحدد كشف الشذوذ مشكلات المحاصيل ويُحلل مواقعها باستخدام صحة أوراق القهوة كمثال رئيسي. سنبدأ بالنظرية الأساسية، ثم نفحص كيف تكتشف هذه النماذج الصدأ وأضرار اليرقة في صور الأوراق. تشمل الجلسة سير عمل عمليًا شاملاً باستخدام مجموعة أدوات الرؤية الحاسوبية المفتوحة المصدر FiftyOne، وتغطي تجميع مجموعة البيانات، واستخراج القطع، وتدريب النموذج، وتصور النتائج. ستحصل على فهم نظري لكشف الشذوذ في الرؤية الحاسوبية، بالإضافة إلى خبرة عملية في تطبيق هذه التقنيات على التحديات الزراعية وقطاعات أخرى. *عن المتحدث* [باولا راموس](https://www.linkedin.com/in/paula-ramos-phd/) حاصلة على درجة الدكتوراه في الرؤية الحاسوبية والتعلم الآلي، ولديها أكثر من 20 عامًا من الخبرة في المجال التكنولوجي. وهي تُطور تقنيات هندسية متكاملة جديدة، خاصة في مجالات الرؤية الحاسوبية، والروبوتات، والتعلم الآلي المطبّق على الزراعة، منذ أوائل العقد الأول من القرن الحادي والعشرين في كولومبيا.