انضم إلينا في اليوم الأول من سلسلة فعاليات افتراضية للاستماع إلى متحدثين خبراء حول أحدث التطورات في مجال التقاطع بين الذكاء الاصطناعي البصري والزراعة. **التاريخ والوقت** 15 أكتوبر الساعة 9 صباحًا بالتوقيت الهادئ **الموقع** افتراضي. [سجّل الدخول عبر Zoom.](https://voxel51.com/events/visual-ai-in-agriculture-october-15-2025) **Paved2Paradise: محاكاة ليدار قابلة للتوسيع لإدراك العالم الحقيقي** غالبًا ما يتطلب تدريب نماذج الإدراك القوية للروبوتات والاستقلالية بيانات ثلاثية الأبعاد ضخمة ومتنوعة. ولكن جمع وتصنيف سحب نقاط ليدار من العالم الحقيقي بحجم كبير أمر مكلفٌ للغاية ويستغرق وقتًا طويلاً، خاصة عندما تكون التصنيفات عالية الجودة ضرورية. يقدم Paved2Paradise بديلاً اقتصاديًا: وهو خط أنابيب محاكاة ليدار قابل للتوسيع يُنتج بيانات واقعية ومصنفة تمامًا مع الحد الأدنى من الجهد البشري في التسمية. الفكرة الأساسية هي "تحليل الواقع" من خلال التقاط مسح الخلفيات (مثل الحقول، الطرق، مواقع البناء) ومسح الكائنات (مثل المركبات، الأشخاص، الآلات) بشكل منفصل. ومن خلال دمج هذين المصدرَين بذكاء، يمكن لـ Paved2Paradise توليد مجموعة كبيرة جدًا ومتنوعة من مشاهد التدريب. يتضمن خط الأنابيب أربع خطوات: (1) جمع مسح ليدار واسع النطاق للخلفيات، (2) تسجيل مسح عالي الدقة لكائنات الهدف في ظروف مضبوطة، (3) إدخال الكائنات داخل الخلفيات مع وضع وحجب يتماشيان مع القوانين الفيزيائية، (4) محاكاة هندسة الليدار لضمان الواقعية. أظهرت التجارب أن النماذج المدربة على البيانات التي يولدها Paved2Paradise تنتقل بكفاءة إلى العالم الحقيقي، وتحقق أداءً قويًا في الكشف مع حاجة أقل بكثير للتسمية اليدوية مقارنةً بجمع مجموعة البيانات التقليدية. هذه الطريقة ليست فقط فعالة من حيث التكلفة، بل أيضًا مرنة — تتيح للممارسين توسيعها بسهولة إلى فئات كائنات جديدة أو مجالات جديدة عن طريق استبدال مسح الخلفيات أو الكائنات بمسوحات جديدة. بالنسبة لممارسي تعلم الآلة العاملين في مجال الروبوتات أو المركبات المستقلة أو أنظمة الإدراك الحرجة للسلامة، يبرز Paved2Paradise مسارًا عمليًا نحو توسيع بيانات التدريب دون زيادة التكاليف. كما أنه يسد الفجوة بين المحاكاة والأداء في العالم الحقيقي، مما يمكّن من التكرار الأسرع والنشر الأكثر موثوقية لنماذج الإدراك. *عن المتحدث* [مايكل أ. ألْكورن](https://www.linkedin.com/in/michaelaalcorn/) هو مهندس متقدم في تعلم الآلة في شركة John Deere\، حيث يطور نماذج التعلّم العميق للإدراك باستخدام بيانات الليدار والصور ذات الألوان الثلاثة (RGB) في أنظمة حرجة للسلامة وتُعمل في الزمن الحقيقي\. حصل على درجة الدكتوراه في علوم الحاسوب من جامعة أوبرن\، مع أطروحة حول تحسين الرؤية الحاسوبية والشبكات العصبية العميقة الزمكانية\، ويحمل أيضًا شهادة ماجستير فرعية في الرياضيات\. تم الاستشهاد بأبحاث مايكل من قبل باحثين في DeepMind\، Google\، Meta\، Microsoft\، وOpenAI\، من بين آخرين\، وكانت ورقة \(batter\|pitcher\)2vec الخاصة به فائزة بجائزة في مؤتمر MIT Sloan Sports Analytics Conference عام 2018\. كما ساهم في كتابة شيفرات تعلم الآلة لبرامج scikit\-learn وApache Solr\، وقد تلقى مستودعاته على GitHub أكثر من 2\,100 نجمة—وقد استخدمت هذه المستودرات كنقاط بداية لأبحاث وشيفرات إنتاجية في العديد من المؤسسات المختلفة\. **MothBox: جهاز رصد حشرات منخفض التكلفة، مفتوح المصدر، وأوتوماتيكي** سيتحدث الدكتور آندي كويتماير عن تصميم أداة علمية مثيرة جديدة مفتوحة المصدر، وهي Mothbox. يُعد مشروع Mothbox فائزًا بجائزة لرصد الحشرات على نطاق واسع من أجل التنوع البيولوجي. إنه جهاز منخفض التكلفة تم تطويره في غابات بنما القاسية، ويقوم بالتقاط صور فائقة الدقة ثم يقوم تلقائيًا بتحديد مستويات التنوع البيولوجي في الغابات والزراعة. بعد آلاف الملاحظات على الحشرات ومئات النشرات في بنما، بيرو، المكسيك، الإكوادور، والولايات المتحدة، نحن الآن نعمل على تطوير نسخة جديدة يمكن تصنيعها لتعميم هذه الأداة المهمة عالميًا. سنناقش تطوير هذا الجهاز في غابات بنما وأهميته لدراسة التنوع البيولوجي عالميًا. *عن المتحدث* يصمم الدكتور آندي كويتماير طرقًا جديدة للتفاعل مع العالم الطبيعي. عمل مع مؤسسات كبيرة مثل شبكة كرتون نتورك، IDEO، ومعهد سميثسونيان، ودرّس كأستاذ مساعد في جامعة سنغافورة الوطنية، وحتى تحولت أبحاثه إلى سلسلة تلفزيونية (مضحكة) بعنوان "قرصنة البرية"، تم توزيعها بواسطة Discovery Networks. في الوقت الحالي، يقضي معظم وقته في العمل التطوعي مع منظمات صغيرة، وقام مؤخرًا بتأسيس ورشة عمل حقول البحث، Digital Naturalism Laboratories. في غابة الأمطار في جامبوا ببنما، يدمج Dinalab العمل الميداني البيولوجي مع الصناعة التكنولوجية ضمن مجتمع من العلماء والفنانين والمهندسين ومحسنّي الحيوانات المحليين والدوليين. وهو حاليًا مستشار طلابي كبروفيسور متعاون في جامعة واشنطن. **النماذج الأساسية للذكاء الاصطناعي البصري في الزراعة** لقد مكّنت النماذج الأساسية من طريقة جديدة لمعالجة المهام، وذلك بالاستفادة من القدرات الناشئة بطريقة بدون تدريب (zero-shot). في هذا الحديث، سأناقش أحدث الأبحاث المتعلقة بتمكين الذكاء الاصطناعي البصري بطريقة بدون تدريب أو من خلال التعديل الدقيق (fine-tuning). على وجه التحديد، سأناقش العمل المشترك حول RELOCATE، وهو معيار بسيط لا يتطلب تدريبًا مصممًا لأداء مهمة صعبة تتمثل في تحديد موقع الاستعلام البصري في مقاطع فيديو طويلة. للتخلص من الحاجة إلى تدريب خاص بالمهمة وللتعامل بكفاءة مع مقاطع الفيديو الطويلة، يستفيد RELOCATE من تمثيل قائم على المناطق مشتق من نماذج الرؤية المدربة مسبقًا. كما سأناقش العمل المشترك على تمكين نماذج اللغات الكبيرة متعددة الوسائط (MLLMs) من الإجابة الصحيحة على المطالبات التي تتطلب فهمًا شاملاً مكانياً-زمانيًا: فالنماذج MLLMs تواجه صعوبة في الإجابة على المطالبات التي تشير إلى 1) البيئة بأكملها التي يمكن لوكيل مزوّد بنموذج MLLM العمل فيها؛ وفي نفس الوقت تشير أيضًا إلى 2) الإجراءات الأخيرة التي حدثت للتو والتي تم ترميزها في مقطع فيديو. ومع ذلك، فإن هذا الفهم الشامل المكاني-الزماني مهم للوكلاء الذين يعملون في العالم الحقيقي. يشمل حلنا تطوير خط أنابيب مخصص لجمع البيانات والتعديل الدقيق لنموذج MLLM مجهز بمشعّات لتحسين كل من الفهم المكاني للبيئة والفهم الزمني للملاحظات الحديثة. *عن المتحدث* [ألكس شوينغ](https://www.linkedin.com/in/alexander-s-0a049258/) هو أستاذ مشارك في جامعة إلينوي في أوربانا-شامبين، يعمل مع طلاب موهوبين في مجالات الذكاء الاصطناعي، والذكاء الاصطناعي التوليدي، والرؤية الحاسوبية. حصل على بكالوريوس ودبلومه في الهندسة الكهربائية وتكنولوجيا المعلومات من الجامعة التقنية في ميونخ عامي 2006 و2008 على التوالي، وحصل على درجة الدكتوراه في علوم الحاسوب من ETH زيوريخ عام 2014. وبعد ذلك انضم إلى جامعة تورونتو كزميل ما بعد الدكتوراه حتى عام 2016. تشمل اهتماماته البحثية مجالات الذكاء الاصطناعي، والذكاء الاصطناعي التوليدي، والرؤية الحاسوبية، حيث شارك في تأليف عدد كبير من الأوراق البحثية في مواضيع مثل فهم السيناريوهات، وخوارزميات الاستنتاج والتعلم، والتعلم العميق، ومعالجة الصور واللغة، والنماذج التوليدية. حصلت أطروحته للدكتوراه على ميدالية ETH، وحاز بحث فريقه على جائزة NSF CAREER. **خارج المختبر: كشف الشذوذ في العالم الحقيقي للرؤية الحاسوبية الزراعية** يُحدث كشف الشذوذ تغييرًا جذريًا في التصنيع والمراقبة، لكن ماذا عن الزراعة؟ هل يمكن للذكاء الاصطناعي اكتشاف أمراض النباتات وأضرار الآفات مبكرًا بما يكفي لتحقيق فرق حقيقي؟ يوضح هذا الحديث كيف يحدد كشف الشذوذ ويحلل مشكلات المحاصيل باستخدام صحة أوراق البن كمثال أساسي. سنبدأ بالنظرية الأساسية، ثم ندرس كيف تكتشف هذه النماذج الصدأ وأضرار المنّ في صور الأوراق. تشمل الجلسة سير عمل شاملة عملية باستخدام أدوات FiftyOne المفتوحة المصدر للرؤية الحاسوبية، وتشمل تنقيح مجموعة البيانات، واستخراج القطع، وتدريب النموذج، وعرض النتائج. ستحصل على فهم نظري لكشف الشذوذ في الرؤية الحاسوبية، بالإضافة إلى خبرة عملية في تطبيق هذه الأساليب على التحديات الزراعية وغيرها من المجالات. *عن المتحدث* [باولا راموس](https://www.linkedin.com/in/paula-ramos-phd/) تحمل درجة الدكتوراه في الرؤية الحاسوبية وتعلّم الآلة، ولديها أكثر من 20 سنة من الخبرة في المجال التكنولوجي. وقد كانت تعمل منذ أوائل العقد الأول من القرن الحادي والعشرين في كولومبيا على تطوير تقنيات هندسية متكاملة مبتكرة، تركز بشكل رئيسي على الرؤية الحاسوبية، والروبوتات، وتعلّم الآلة المطبقة على الزراعة.