انضم إلينا في اليوم الأول من سلسلة الفعاليات الافتراضية للاستماع إلى خبراء حول آخر التطورات في مجال تقاطع الذكاء الاصطناعي البصري مع الزراعة. **التاريخ والوقت** 15 أكتوبر الساعة 9 صباحًا بالتوقيت الهادئ **المكان** افتراضي. [سجّل الدخول عبر زووم.](https://voxel51.com/events/visual-ai-in-agriculture-october-15-2025) **Paved2Paradise: محاكاة ليدار قابلة للتوسيع لإدراك العالم الحقيقي** غالبًا ما يتطلب تدريب نماذج الإدراك القوية للروبوتات والاستقلالية وجود مجموعات بيانات ثلاثية الأبعاد ضخمة ومتنوعة. لكن جمع وتصنيف سحب نقاط الليدار في العالم الحقيقي على نطاق واسع أمر مكلف وجهد يستغرق وقتًا طويلاً، خاصة عند الحاجة إلى تسميات عالية الجودة. يقدم مشروع Paved2Paradise بديلاً اقتصاديًا: وهو خط أنابيب محاكاة ليدار قابل للتوسيع يُنتج مجموعات بيانات واقعية ومكتملة التصنيف مع الحد الأدنى من الجهد البشري في التسمية. الفكرة الأساسية هي "تحليل الواقع" من خلال التقاط مسح خلفيات (مثل الحقول، الطرق، مواقع البناء) ومسح كائنات (مثل المركبات، الأشخاص، الآلات) بشكل منفصل. ومن خلال دمج هذين المصدرَين بذكاء، يمكن لـ Paved2Paradise تركيب عدد كبير جدًا من مشاهد التدريب المتنوعة. يتضمن الخط أنابيب أربع خطوات: (1) جمع مسح ليدار خلفي واسع النطاق، (2) تسجيل مسح عالي الدقة لكائنات الهدف في ظروف مضبوطة، (3) إدخال الكائنات في الخلفيات مع وضع وحجب يتماشيان مع القوانين الفيزيائية، و(4) محاكاة هندسة الليدار لضمان الواقعية. أظهرت التجارب أن النماذج المدربة على بيانات تم إنشاؤها بواسطة Paved2Paradise تنتقل بكفاءة إلى العالم الحقيقي، وتُحقق أداءً قويًا في الكشف مع جهد أقل بكثير في التسمية اليدوية مقارنةً بجمع مجموعة البيانات التقليدية. هذه الطريقة ليست فعالة من حيث التكلفة فحسب، بل مرنة أيضًا — مما يسمح للممارسين بسهولة التوسع إلى فئات أو مجالات كائنات جديدة من خلال استبدال مسحات الخلفية أو الكائنات. بالنسبة لممارسي التعلّم الآلي العاملين في مجالات الروبوتات أو المركبات ذاتية القيادة أو نظم الإدراك الحرجة للسلامة، يبرز Paved2Paradise طريقًا عمليًا نحو توسيع بيانات التدريب دون زيادة التكاليف. ويُعد هذا المشروع جسرًا بين الأداء في المحاكاة والأداء في العالم الحقيقي، ما يتيح تكرار التطوير بشكل أسرع ونشرًا أكثر موثوقية لنماذج الإدراك. *عن المتحدث* [مايكل أ. ألْكورن](https://www.linkedin.com/in/michaelaalcorn/) هو مهندس تعلم آلي أول في شركة John Deere\، حيث يطور نماذج تعلّم عميق للإدراك باستخدام بيانات الليدار والصور الملونة في نظم حرجة للسلامة وتعمل في الزمن الحقيقي\. حصل على درجة الدكتوراه في علوم الحاسوب من جامعة أوبرن\، مع أطروحة حول تحسين رؤية الحاسوب والشبكات العصبية العميقة الزمكانية\، كما يمتلك تخصصًا فرعيًا في الرياضيات\. تم الاستشهاد بأبحاث مايكل من قبل باحثين في DeepMind\، Google\، Meta\، Microsoft\، وOpenAI\، من بين آخرين\، وكانت ورقته \(batter\|pitcher\)2vec فائزة بجائزة في مؤتمر MIT Sloan Sports Analytics Conference عام 2018\. كما ساهم برمجيًا في scikit\-learn وApache Solr\، وقد تلقّت مستودعاته على GitHub أكثر من 2\,100 نجمة\، وشكّلت نقطة انطلاق لأبحاث وأكواد إنتاجية في العديد من المنظمات المختلفة\. **MothBox: جهاز رصد آفات منخفض التكلفة، مفتوح المصدر، وآلي** سيتحدث الدكتور آندي كويتماير عن تصميم أداة علمية مبتكرة جديدة ومفتوحة المصدر، وهي Mothbox. يعد مشروع Mothbox فائزًا بالجوائز لمراقبة الحشرات على نطاق واسع من أجل التنوع البيولوجي. إنها جهاز منخفض التكلفة تم تطويره في غابات بنما القاسية، ويقوم بالتقاط صور عالية الدقة جدًا ثم يقوم تلقائيًا بتحديد مستويات التنوع البيولوجي في الغابات والزراعة. بعد آلاف الملاحظات على الحشرات ومئات عمليات النشر في بنما، بيرو، المكسيك، الإكوادور، والولايات المتحدة، نحن الآن نطوّر نسخة جديدة يمكن تصنيعها لتوزيع هذه الأداة المهمة عالميًا. سنناقش تطوير هذا الجهاز في غابات بنما وأهميته لدراسة التنوع البيولوجي عالميًا. *عن المتحدث* يصمم الدكتور آندي كويتماير طرقًا جديدة للتفاعل مع العالم الطبيعي. عمل مع منظمات كبيرة مثل Cartoon Network وIDEO وSmithsonian، ودرّس كأستاذ محاضر في الجامعة الوطنية السنغافورية، وحتى تحولت أبحاثه إلى سلسلة تلفزيونية (مضحكة) بعنوان "Hacking the Wild"، تم توزيعها عبر Discovery Networks. في الوقت الحالي، يقضي معظم وقته في العمل التطوعي مع منظمات صغيرة، وقام مؤخرًا بتأسيس مختبر الحرف الرقمية (Digital Naturalism Laboratories)، وهو مساحة صناعية في موقع ميداني. في غابة الأمطار في جامبوا ببنما، يدمج Dinalab العمل الميداني البيولوجي مع الصناعة التكنولوجية ضمن مجتمع من العلماء والفنانين والمهندسين ومحسنّي الحيوانات المحليين والدوليين. وحاليًا، يعمل أيضًا كأستاذ مشارك مستشار للطلاب في جامعة واشنطن. **النماذج الأساسية للذكاء الاصطناعي البصري في الزراعة** لقد مكّنت النماذج الأساسية من طريقة جديدة لمعالجة المهام، وذلك بالاستفادة من القدرات الناشئة بطريقة بدون تدريب (zero-shot). في هذا الحديث، سأناقش أحدث الأبحاث المتعلقة بتمكين الذكاء الاصطناعي البصري بطريقة بدون تدريب أو عبر عملية ضبط دقيق (fine-tuning). على وجه التحديد، سأتناول العمل المشترك حول RELOCATE، وهو خط أساس بسيط لا يتطلب تدريبًا مصممًا لأداء مهمة صعبة تتمثل في تحديد مكان الاستعلام البصري في مقاطع فيديو طويلة. للإزالة الحاجة إلى تدريب مخصص للمهمة وللتعامل بكفاءة مع مقاطع الفيديو الطويلة، يستفيد RELOCATE من تمثيل قائم على المناطق مستمد من نماذج بصرية مسبقة التدريب. سأناقش أيضًا العمل المشترك على تمكين نماذج اللغة الكبيرة متعددة الوسائط (MLLMs) للإجابة الصحيحة على الأوامر التي تتطلب فهمًا شاملاً مكانيًا وزمنيًا: فنماذج MLLMs تعجز عن الإجابة على أوامر تشير إلى 1) البيئة الكاملة التي يمكن لوكيل مزوّد بنموذج MLLM العمل فيها؛ وفي نفس الوقت تشير أيضًا إلى 2) الإجراءات الأخيرة التي حدثت للتو والتي تم ترميزها في مقطع فيديو. ومع ذلك، فإن هذا الفهم الشامل المكاني-الزماني مهم للوكلاء الذين يعملون في العالم الحقيقي. حلنا يتضمن تطوير خط أنابيب مخصص لجمع البيانات وضبط دقيق لنموذج MLLM مجهّز بمشعّات لتحسين كل من الفهم المكاني للبيئة والفهم الزمني للملاحظات الأخيرة. *عن المتحدث* [ألكس شوينغ](https://www.linkedin.com/in/alexander-s-0a049258/) هو أستاذ مشارك في جامعة إلينوي في أوربانا-แชมبين، يعمل مع طلاب موهوبين في مجالات الذكاء الاصطناعي، والذكاء الاصطناعي التوليدي، ورؤية الحاسوب. حصل على درجة البكالوريوس والدبلوم في الهندسة الكهربائية وتكنولوجيا المعلومات من الجامعة التقنية بميونيخ عامي 2006 و2008 على التوالي، وحصل على درجة الدكتوراه في علوم الحاسوب من ETH زيورخ عام 2014. وبعد ذلك انضم إلى جامعة تورونتو كزميل باحث حتى عام 2016. تشمل اهتماماته البحثية مجالات الذكاء الاصطناعي، والذكاء الاصطناعي التوليدي، ورؤية الحاسوب، حيث شارك في تأليف العديد من الأوراق البحثية في موضوعات فهم المشهد، وخوارزميات الاستنتاج والتعلم، والتعلم العميق، ومعالجة الصور واللغة، والنماذج التوليدية. تم منح أطروحته للدكتوراه ميدالية ETH، وفاز بحث فريقه بجائزة NSF CAREER. **خارج المختبر: كشف الشذوذ في العالم الحقيقي لرؤية الحاسوب الزراعية** إن كشف الشذوذ يُحدث تحوّلًا في التصنيع والمراقبة، ولكن ماذا عن الزراعة؟ هل يمكن للذكاء الاصطناعي اكتشاف أمراض النباتات وأضرار الآفات مبكرًا بما يكفي لصنع فرق؟ يوضح هذا الحديث كيف يحدد كشف الشذوذ ويحلل مشكلات المحاصيل باستخدام صحة أوراق القهوة كمثال أساسي. سنبدأ بالنظرية الأساسية، ثم ندرس كيف تكتشف هذه النماذج صدأ الأوراق وأضرار المنّ في صور الأوراق. تشمل الجلسة سير عمل شاملًا عمليًا باستخدام مجموعة أدوات رؤية الحاسوب مفتوحة المصدر FiftyOne، ويتناول تنظيم مجموعة البيانات، واستخراج القطع، وتدريب النموذج، وتصور النتائج. ستحصل على فهم نظري لكشف الشذوذ في رؤية الحاسوب وعلى خبرة عملية في تطبيق هذه التقنيات على التحديات الزراعية وغيرها من المجالات. *عن المتحدث* [باولا راموس](https://www.linkedin.com/in/paula-ramos-phd/) حاصلة على درجة الدكتوراه في رؤية الحاسوب والتعلم الآلي، ولديها أكثر من 20 سنة من الخبرة في المجال التكنولوجي. وهي تعمل منذ أوائل العقد الأول من القرن الواحد والعشرين في كولومبيا على تطوير تقنيات هندسية متكاملة جديدة، تركز بشكل رئيسي على رؤية الحاسوب، والروبوتات، والتعلم الآلي المطبّق على الزراعة.