انضم إلينا في اليوم الأول من سلسلة الفعاليات الافتراضية للاستماع إلى متحدثين خبراء حول آخر التطورات في مجال التقاطع بين الذكاء الاصطناعي البصري والزراعة. **التاريخ والوقت** 15 أكتوبر الساعة 9 صباحًا بالتوقيت الهادئ **الموقع** افتراضي. [سجّل الدخول عبر Zoom.](https://voxel51.com/events/visual-ai-in-agriculture-october-15-2025) **Paved2Paradise: محاكاة ليدار قابلة للتوسيع لإدراك العالم الحقيقي** غالبًا ما يتطلب تدريب نماذج الإدراك القوية للروبوتات والاستقلالية بيانات ضخمة ومتنوعة ثلاثية الأبعاد. لكن جمع وتصنيف سحب نقاط ليدار من العالم الحقيقي بحجم كبير أمر مكلف وطويل جدًا، خاصة عند الحاجة إلى تسميات عالية الجودة. يقدم مشروع Paved2Paradise بديلًا اقتصاديًا: وهو خط أنابيب محاكاة ليدار قابل للتوسيع يُنتج بيانات واقعية ومصنفة بالكامل مع الحد الأدنى من الجهد البشري في التسمية. الفكرة الأساسية هي "تفكيك العالم الحقيقي" من خلال التقاط فحوص الخلفية (مثل الحقول، الطرق، مواقع البناء) وفحوص الكائنات (مثل المركبات، الأشخاص، الآلات) بشكل منفصل. ومن خلال دمج هذين المصدرَين بذكاء، يمكن لـ Paved2Paradise توليد مجموعة كبيرة جدًا من مشاهد التدريب المختلفة. يتضمن خط الأنابيب أربع خطوات: (1) جمع فحوص ليدار واسعة النطاق للخلفية، (2) تسجيل فحوص عالية الدقة لكائنات الهدف في ظروف مضبوطة، (3) إدخال الكائنات داخل الخلفيات مع وضع وحجب يتماشيان مع القوانين الفيزيائية، و(4) محاكاة هندسة الليدار لضمان الواقعية. أظهرت التجارب أن النماذج المدربة على بيانات تم إنشاؤها بواسطة Paved2Paradise تنتقل بكفاءة إلى العالم الحقيقي، وتحقق أداءً قويًا في الكشف مع حاجة أقل بكثير للتسمية اليدوية مقارنةً بجمع البيانات التقليدي. هذه الطريقة ليست فقط فعالة من حيث التكلفة، بل مرنة أيضًا — مما يتيح للممارسين توسيعها بسهولة إلى فئات كائنات جديدة أو مجالات جديدة عن طريق استبدال فحوص الخلفية أو الكائنات. بالنسبة لممارسي تعلم الآلة العاملين في الروبوتات، أو المركبات المستقلة، أو أنظمة الإدراك الحرجة للسلامة، فإن Paved2Paradise يسلط الضوء على مسار عملي لتوسيع بيانات التدريب دون زيادة التكاليف. كما أنه يسد الفجوة بين المحاكاة والأداء في العالم الحقيقي، مما يتيح التكرار الأسرع والنشر الأكثر موثوقية لنماذج الإدراك. *عن المتحدث* [مايكل أ. ألكورن](https://www.linkedin.com/in/michaelaalcorn/) هو مهندس رئيسي للتعلم الآلي في شركة John Deere\، حيث يطور نماذج التعلم العميق للإدراك باستخدام بيانات الليدار والصور الملونة في أنظمة تتطلب السلامة وتكون في الوقت الفعلي\. حصل على درجة الدكتوراه في علوم الحاسوب من جامعة أوبرن\، وكان موضوع أطروحته تحسين الرؤية الحاسوبية والشبكات العصبية العميقة الزمكانية\، ويحمل أيضًا تخصصًا فرعيًا في الرياضيات\. تم الاستشهاد بأبحاث مايكل من قبل باحثين في DeepMind\، Google\، Meta\، Microsoft\، وOpenAI\، من بين آخرين\، وكانت ورقة \(batter\|pitcher\)2vec الخاصة به فائزة بجائزة في مؤتمر MIT Sloan Sports Analytics Conference لعام 2018\. كما ساهم برمجيًا في scikit\-learn وApache Solr\، وقد تلقى مستودعات GitHub الخاصة به أكثر من 2\,100 نجمة\، وشكلت نقطة بداية لأبحاث وأكواد إنتاجية في العديد من المنظمات المختلفة\. **MothBox: جهاز رصد حشرات منخفض التكلفة، مفتوح المصدر، وآلي** سيتحدث الدكتور آندي كوتميير عن تصميم أداة علمية مفتوحة المصدر جديدة ومثيرة، تُعرف باسم Mothbox. يُعد مشروع Mothbox فائزًا بجائزة، ويهدف إلى رصد الحشرات على نطاق واسع لتقييم التنوع البيولوجي. إنها جهاز منخفض التكلفة تم تطويره في غابات بنما القاسية، ويقوم بالتقاط صور عالية الدقة جدًا ثم يقوم بتحديد تلقائي لمستويات التنوع البيولوجي في الغابات والزراعة. بعد آلاف الملاحظات الحشرية ومئات النشرات في بنما، بيرو، المكسيك، الإكوادور، والولايات المتحدة، نحن الآن نعمل على تطوير نسخة جديدة قابلة للتصنيع لنشارك هذه الأداة المهمة على مستوى العالم. سنناقش تطوير هذا الجهاز في غابات بنما وأهميته لدراسة التنوع البيولوجي عالميًا. *عن المتحدث* يصمم الدكتور آندي كوتميير طرقًا جديدة للتفاعل مع العالم الطبيعي. عمل مع منظمات كبيرة مثل شبكة كرتون نتورك، وIDEO، ومعهد سميثسونيان، ودرّس كأستاذ أكاديمي في جامعة سنغافورة الوطنية، وحتى تم تحويل بحثه إلى برنامج تلفزيوني (مضحك) بعنوان "Hacking the Wild"، تم توزيعه عبر Discovery Networks. حاليًا، يقضي معظم وقته في العمل التطوعي مع منظمات صغيرة، وقام مؤخرًا بتأسيس ورشة تصنيع مختبرات Digital Naturalism Laboratories. في غابة الأمطار في جامboa، بنما، تدمج Dinalab بين العمل الميداني البيولوجي والحرف التكنولوجية ضمن مجتمع من العلماء والفنانين والمهندسين ومُنقذي الحيوانات المحليين والدوليين. ويشغل حاليًا منصب أستاذ متعاون في جامعة واشنطن حيث يستشار الطلاب. **النماذج الأساسية للذكاء الاصطناعي البصري في الزراعة** لقد مكّنت النماذج الأساسية من طريقة جديدة لمعالجة المهام، وذلك بالاستفادة من القدرات الناشئة بطريقة بدون تدريب (zero-shot). في هذا الحديث، سأناقش أحدث الأبحاث المتعلقة بتمكين الذكاء الاصطناعي البصري بطريقة بدون تدريب أو من خلال التعديل الدقيق (fine-tuning). على وجه التحديد، سأتناول بحثًا مشتركًا حول RELOCATE، وهو معيار بسيط لا يتطلب تدريبًا مصممًا لأداء مهمة صعبة وهي تحديد موقع الاستعلام البصري في مقاطع فيديو طويلة. للحد من الحاجة إلى تدريب مخصص لكل مهمة، ومعالجة مقاطع الفيديو الطويلة بكفاءة، يستفيد RELOCATE من تمثيل قائم على المناطق مستمد من نماذج بصرية مُدرّبة مسبقًا. سأناقش أيضًا بحثًا مشتركًا حول تمكين نماذج اللغات الكبيرة متعددة الوسائط (MLLMs) من الإجابة الصحيحة على المطالبات التي تتطلب فهمًا شاملاً مكانياً وزمنياً: فالنماذج متعددة الوسائط تجد صعوبة في الإجابة على مطالبات تشير إلى 1) بيئة كاملة يمكن لوكيل مزود بنموذج MLLM العمل فيها؛ وفي نفس الوقت تشير أيضًا إلى 2) إجراءات حديثة حدثت للتو ومُشفّرة في مقطع فيديو. لكن مثل هذا الفهم الشامل المكاني والزماني مهم للوكلاء الذين يعملون في العالم الحقيقي. يشمل حلنا تطوير خط أنابيب مخصص لجمع البيانات والتعديل الدقيق لنموذج MLLM مجهز بمشعّات لتحسين كل من الفهم المكاني للبيئة والفهم الزمني للمشاهدات الأخيرة. *عن المتحدث* [ألكس شوينغ](https://www.linkedin.com/in/alexander-s-0a049258/) هو أستاذ مشارك في جامعة إلينوي في أوربانا-شامبين، يعمل مع طلاب موهوبين في مجالات الذكاء الاصطناعي، والذكاء الاصطناعي التوليدي، والرؤية الحاسوبية. تلقى تعليمه الجامعي والحصول على دبلومه في الهندسة الكهربائية وتكنولوجيا المعلومات من الجامعة التقنية في ميونيخ عامي 2006 و2008 على التوالي، وحصل على درجة الدكتوراه في علوم الحاسوب من ETH زيورخ في عام 2014. وبعد ذلك انضم إلى جامعة تورونتو كزميل ما بعد الدكتوراه حتى عام 2016. تتركز اهتماماته البحثية في مجالات الذكاء الاصطناعي، والذكاء الاصطناعي التوليدي، والرؤية الحاسوبية، حيث شارك في تأليف العديد من الأوراق البحثية في مواضيع تتعلق بفهم المشهد، وخوارزميات الاستدلال والتعلم، والتعلم العميق، وتحليل الصور واللغة، والنماذج التوليدية. وقد تم منح أطروحته للدكتوراه وسام ETH، كما حصل فريقه البحثي على جائزة NSF CAREER. **خارج المختبر: كشف الشذوذ في العالم الحقيقي للرؤية الحاسوبية الزراعية** يُحدث كشف الشذوذ ثورة في التصنيع والمراقبة، ولكن ماذا عن الزراعة؟ هل يمكن للذكاء الاصطناعي أن يكتشف أمراض النباتات وأضرار الآفات مبكرًا بما يكفي لصنع فرق؟ يوضح هذا الحديث كيف يحدد كشف الشذوذ ويحلل مشكلات المحاصيل باستخدام صحة أوراق القهوة كمثال رئيسي. سنبدأ بنظرية أساسية، ثم نفحص كيف تكشف هذه النماذج عن الصدأ وأضرار المنّ في صور الأوراق. تشمل الجلسة سير عمل شاملة تطبيقية باستخدام أدوات FiftyOne المفتوحة المصدر للرؤية الحاسوبية، وتشمل تنقيح مجموعة البيانات، واستخراج القطع، وتدريب النموذج، وعرض النتائج. ستحصل على فهم نظري لكشف الشذوذ في الرؤية الحاسوبية، بالإضافة إلى خبرة عملية في تطبيق هذه التقنيات على التحديات الزراعية وغيرها من المجالات. *عن المتحدث* [باولا راموس](https://www.linkedin.com/in/paula-ramos-phd/) حاصلة على درجة الدكتوراه في الرؤية الحاسوبية وتعلم الآلة، ولديها أكثر من 20 عامًا من الخبرة في المجال التكنولوجي. تعمل على تطوير تقنيات هندسية متكاملة جديدة، خاصة في مجالات الرؤية الحاسوبية، والروبوتات، وتعلم الآلة المطبقة على الزراعة، منذ أوائل العقد الأول من القرن الحادي والعشرين في كولومبيا.