انضم إلينا في اليوم الأول من سلسلة فعاليات افتراضية للاستماع إلى متحدثين خبراء حول أحدث التطورات في مجال التقاطع بين الذكاء الاصطناعي البصري والزراعة. **التاريخ والوقت** 15 أكتوبر الساعة 9 صباحًا بالتوقيت الهادئ **المكان** افتراضي. [سجّل الدخول إلى Zoom.](https://voxel51.com/events/visual-ai-in-agriculture-october-15-2025) **Paved2Paradise: محاكاة ليدار قابلة للتوسيع لإدراك العالم الحقيقي** غالبًا ما يتطلب تدريب نماذج إدراك قوية للروبوتات والاستقلالية بيانات ضخمة ومتنوعة ثلاثية الأبعاد. ولكن جمع وتصنيف سحب نقاط الليدار من العالم الحقيقي بحجم كبير أمر مكلف وجهد يتطلب وقتًا طويلاً، خاصة عند الحاجة إلى تسميات عالية الجودة. يقدم Paved2Paradise بديلاً اقتصاديًا: خط أنابيب محاكاة ليدار قابل للتوسيع لإنشاء مجموعات بيانات واقعية ومُصنفة بالكامل مع أقل جهد بشري في التصنيف. الفكرة الأساسية هي "تفكيك العالم الحقيقي" من خلال التقاط مسح الخلفية (مثل الحقول، الطرق، مواقع البناء) ومسح الكائنات (مثل المركبات، الأشخاص، الآلات) بشكل منفصل. وبدمج هذين المصدرَين بذكاء، يمكن لـ Paved2Paradise توليد عدد كبير توفيقيًا من مشاهد التدريب المتنوعة. يشمل خط الأنابيب أربع خطوات: (1) جمع مسوحات ليدار واسعة النطاق للخلفية، (2) تسجيل مسوحات عالية الدقة لكائنات الهدف في ظروف مضبوطة، (3) إدخال الكائنات في الخلفيات مع وضع متناسق فيزيائيًا واحتجاب واقعي، (4) محاكاة هندسة الليدار لضمان الواقعية. أظهرت التجارب أن النماذج المدربة على بيانات تم إنشاؤها بواسطة Paved2Paradise تنتقل بكفاءة إلى العالم الحقيقي، وتحقق أداءً قويًا في الكشف مع تقليل كبير في التصنيف اليدوي مقارنةً بجمع مجموعة البيانات التقليدية. هذه الطريقة ليست فعالة من حيث التكلفة فحسب، بل مرنة أيضًا — مما يتيح للممارسين توسيعها بسهولة إلى فئات أو مجالات كائنات جديدة عن طريق استبدال مسوحات الخلفية أو الكائنات. بالنسبة لممارسي التعلم الآلي العاملين في الروبوتات أو المركبات المستقلة أو أنظمة الإدراك الحرجة للسلامة، يبرز Paved2Paradise مسارًا عمليًا نحو توسيع بيانات التدريب دون زيادة التكاليف. وهو يسد الفجوة بين المحاكاة والأداء في العالم الحقيقي، مما يمكّن من التكرار الأسرع والنشر الأكثر موثوقية لنماذج الإدراك. *عن المتحدث* [مايكل أ. ألكورن](https://www.linkedin.com/in/michaelaalcorn/) هو مهندس رئيسي للتعلم الآلي في شركة John Deere\، حيث يطور نماذج التعلم العميق للإدراك باستخدام الليدار والصورة (RGB) في أنظمة حرجة للسلامة وتُعمل في الزمن الحقيقي\. حصل على درجة الدكتوراه في علوم الحاسوب من جامعة أوبرن\، وكان موضوع أطروحته تحسين الرؤية الحاسوبية والشبكات العصبية العميقة المكانية-الزمنية\، كما يحمل تخصصًا فرعيًا في الرياضيات\. تم الاستشهاد بأبحاث مايكل من قبل باحثين في DeepMind\، Google\، Meta\، Microsoft\، وOpenAI\، من بين آخرين\، وكانت ورقة \(batter\|pitcher\)2vec الخاصة به فائزة بجائزة في مؤتمر MIT Sloan Sports Analytics Conference عام 2018\. كما ساهم برمجيات تعلم آلي إلى scikit\-learn وApache Solr\، وقد تلقى مستودعاته على GitHub أكثر من 2\,100 نجمة—وقد شكلت نقطة انطلاق لأبحاث وأكواد إنتاجية في العديد من المؤسسات المختلفة\. **MothBox: جهاز رصد حشرات منخفض التكلفة ومفتوح المصدر** سيتحدث د. آندي كويتماير عن تصميم أداة علمية جديدة ومثيرة مفتوحة المصدر، Mothbox. يعد مشروع Mothbox مشروعًا فائزًا بجائزة لمراقبة واسعة النطاق للحشرات من أجل التنوع البيولوجي. إنه جهاز منخفض التكلفة تم تطويره في الغابات القاسية ببنما، ويأخذ صورًا عالية الدقة جدًا ثم يقوم تلقائيًا بتحديد مستويات التنوع البيولوجي في الغابات والزراعة. بعد آلاف الملاحظات على الحشرات ومئات النشرات في بنما، بيرو، المكسيك، الإكوادور، والولايات المتحدة، نحن الآن نطور إصدارًا جديدًا قابلاً للإنتاج لنشارك هذه الأداة المهمة في جميع أنحاء العالم. سنناقش تطوير هذا الجهاز في غابات بنما وأهميته لدراسة التنوع البيولوجي عالميًا. *عن المتحدث* يصمم د. آندي كويتماير طرقًا جديدة للتفاعل مع العالم الطبيعي. عمل مع منظمات كبيرة مثل شبكة كرتون نتورك، IDEO، ومعهد سميثسونيان، ودرّس كأستاذ ذو وظيفة أكاديمية دائمة في الجامعة الوطنية السنغافورية، وحتى تم تحويل بحثه إلى سلسلة تلفزيونية (مضحكة) بعنوان "Hacking the Wild"، تم توزيعها عبر Discovery Networks. وحاليًا، يقضي معظم وقته في العمل التطوعي مع منظمات صغيرة، وقام مؤخرًا بتأسيس مختبر الحرف الرقمية (Digital Naturalism Laboratories)، وهو فضاء لصنع الأجهزة العلمية الميدانية. في غابة الأمطار في جامبوا ببنما، يجمع Dinalab بين العمل الميداني البيولوجي والابتكار التكنولوجي ضمن مجتمع من العلماء والفنيين والمهندسين والفنانين المحليين والدوليين، بالإضافة إلى متخصصي إعادة تأهيل الحيوانات. وهو حاليًا مستشار طلابي كأستاذ متعاون في جامعة واشنطن. **النماذج الأساسية للذكاء الاصطناعي البصري في الزراعة** لقد مكّنت النماذج الأساسية من طريقة جديدة لمعالجة المهام، وذلك بالاستفادة من القدرات الناشئة بطريقة بدون تدريب (zero-shot). في هذا الحديث، سأناقش أبحاثًا حديثة حول تمكين الذكاء الاصطناعي البصري بطريقة بدون تدريب (zero-shot) أو عبر التعديل الدقيق (fine-tuning). على وجه التحديد، سأناقش عملًا مشتركًا حول RELOCATE، وهو معيار بسيط لا يتطلب تدريبًا مصممًا لأداء مهمة صعبة وهي تحديد موقع الاستعلام البصري في مقاطع فيديو طويلة. للتخلص من الحاجة إلى تدريب خاص بالمهمة وللتعامل بكفاءة مع مقاطع الفيديو الطويلة، يستفيد RELOCATE من تمثيل قائم على المناطق مشتق من نماذج بصرية مُدرّبة مسبقًا. سأناقش أيضًا عملًا مشتركًا حول تمكين نماذج اللغات الكبيرة متعددة الوسائط (MLLMs) من الإجابة الصحيحة على المطالب التي تتطلب فهمًا شاملاً مكانياً-زمنياً: فالنماذج MLLMs تجد صعوبة في الإجابة على المطالب التي تشير إلى 1) البيئة بأكملها التي يمكن لوكيل مزوّد بنموذج MLLM العمل فيها؛ وفي الوقت نفسه تشير أيضًا إلى 2) الإجراءات الأخيرة التي حدثت للتو والتي تم ترميزها في مقطع فيديو. ومع ذلك، فإن هذا الفهم الشامل مكانياً-زمنياً مهم للوكلاء الذين يعملون في العالم الحقيقي. يشمل حلنا تطوير خط أنابيب مخصص لجمع البيانات وتعديل دقيق لنموذج MLLM مزود بمشعّات لتحسين كل من الفهم المكاني للبيئة والفهم الزمني للملاحظات الحديثة. *عن المتحدث* [ألكس شوينغ](https://www.linkedin.com/in/alexander-s-0a049258/) هو أستاذ مشارك في جامعة إلينوي في أوربانا-شمباين، يعمل مع طلاب موهوبين في مواضيع الذكاء الاصطناعي، والذكاء الاصطناعي التوليدي، والرؤية الحاسوبية. حصل على بكالوريوس ودبلوم في الهندسة الكهربائية وتكنولوجيا المعلومات من الجامعة التقنية في ميونيخ عامي 2006 و2008 على التوالي، وحصل على درجة الدكتوراه في علوم الحاسوب من ETH زيورخ عام 2014. وبعد ذلك انضم إلى جامعة تورونتو كزميل ما بعد الدكتوراه حتى عام 2016. تتمحور اهتماماته البحثية في مجال الذكاء الاصطناعي، والذكاء الاصطناعي التوليدي، والرؤية الحاسوبية، حيث شارك في تأليف العديد من الأوراق البحثية في مواضيع فهم المشهد، وخوارزميات الاستنتاج والتعلم، والتعلم العميق، وتجهيز الصور واللغة، والنماذج التوليدية. تم منح أطروحته للدكتوراه ميدالية ETH، وحاز بحث فريقه على جائزة NSF CAREER. **خارج المختبر: كشف الشذوذ في العالم الحقيقي للرؤية الحاسوبية الزراعية** يُحدث كشف الشذوذ ثورة في التصنيع والمراقبة، ولكن ماذا عن الزراعة؟ هل يمكن للذكاء الاصطناعي اكتشاف أمراض النباتات وأضرار الآفات مبكرًا بما يكفي لصنع فرق؟ يوضح هذا الحديث كيف يحدد كشف الشذوذ مشكلات المحاصيل ويحللها باستخدام صحة أوراق القهوة كمثال رئيسي. سنبدأ بالنظرية الأساسية، ثم نفحص كيف تكتشف هذه النماذج الصدأ وأضرار المنّ في صور الأوراق. تشمل الجلسة سير عمل عملي شامل باستخدام أدوات FiftyOne مفتوحة المصدر للرؤية الحاسوبية، وتغطي تنقيح مجموعة البيانات، واستخراج القطع، وتدريب النموذج، وعرض النتائج. ستحصل على فهم نظري لكشف الشذوذ في الرؤية الحاسوبية وعلى خبرة عملية في تطبيق هذه التقنيات على التحديات الزراعية وغيرها من المجالات. *عن المتحدث* [بولينا راموس](https://www.linkedin.com/in/paula-ramos-phd/) تحمل درجة الدكتوراه في الرؤية الحاسوبية والتعلم الآلي، ولديها أكثر من 20 سنة من الخبرة في المجال التكنولوجي. تعمل على تطوير تقنيات هندسية متكاملة جديدة، خاصة في مجالات الرؤية الحاسوبية، والروبوتات، والتعلم الآلي المطبّق على الزراعة، منذ أوائل العقد الأول من القرن الحادي والعشرين في كولومبيا.