انضم إلينا في اليوم الأول من سلسلة الفعاليات الافتراضية للاستماع إلى متحدثين خبراء حول أحدث التطورات في مجال التقاء الذكاء الاصطناعي البصري بالزراعة. **التاريخ والوقت** 15 أكتوبر الساعة 9 صباحًا بالتوقيت الهادئ **الموقع** افتراضي. [سجّل الدخول إلى Zoom.](https://voxel51.com/events/visual-ai-in-agriculture-october-15-2025) **Paved2Paradise: محاكاة ليدار قابلة للتوسيع من أجل الإدراك في العالم الحقيقي** غالبًا ما يتطلب تدريب نماذج الإدراك القوية للروبوتات والأنظمة المستقلة مجموعات بيانات ضخمة ومتنوعة ثلاثية الأبعاد. لكن جمع وتوسيم سحب نقاط ليدار من العالم الحقيقي بكميات كبيرة أمر مكلف وطويل، خاصة عند الحاجة إلى تسميات عالية الجودة. يقدم مشروع Paved2Paradise بديلاً اقتصاديًا: وهو خط أنابيب محاكاة ليدار قابل للتوسيع لإنتاج مجموعات بيانات واقعية ومكتملة التسمية مع أقل جهد بشري ممكن في التسمية. الفكرة الأساسية هي "تحليل العالم الحقيقي" من خلال التقاط مسح خلفيات (مثل الحقول، الطرق، مواقع البناء) ومسح كائنات (مثل المركبات، الأشخاص، الآلات) بشكل منفصل. وبدمج هذين المصدرَين بذكاء، يمكن لـ Paved2Paradise إنتاج مجموعة واسعة جدًا من مشاهد التدريب المتنوعة. يتضمن خط الأنابيب أربع خطوات: (1) جمع مسح ليدار خلفي واسع النطاق، (2) تسجيل مسح عالي الدقة لكائنات الهدف في ظروف خاضعة للتحكم، (3) إدخال الكائنات إلى الخلفيات بوضع وحجب يتماشيان مع القوانين الفيزيائية، (4) محاكاة هندسة الليدار لضمان الواقعية. أظهرت التجارب أن النماذج المدربة على بيانات تم إنشاؤها باستخدام Paved2Paradise تنتقل بفعالية إلى العالم الحقيقي، وتحقق أداءً قويًا في الكشف مع تقليل كبير في التسمية اليدوية مقارنةً بطرق جمع البيانات التقليدية. هذه الطريقة ليست فعالة من حيث التكلفة فحسب، بل مرنة أيضًا—تمكّن الممارسين من التوسع بسهولة إلى فئات كائنات جديدة أو مجالات جديدة من خلال استبدال مسح الخلفية أو الكائنات بمسوحات جديدة. بالنسبة لممارسي تعلم الآلات العاملين في مجالات الروبوتات، المركبات المستقلة، أو أنظمة الإدراك الحرجة للسلامة، يُبرز Paved2Paradise مسارًا عمليًا نحو توسيع بيانات التدريب دون توسيع التكاليف. وهو يسد الفجوة بين الأداء في المحاكاة والأداء في العالم الحقيقي، مما يتيح تكرارًا أسرع ونشرًا أكثر موثوقية لنماذج الإدراك. *عن المتحدث* [مايكل أ. ألكورن](https://www.linkedin.com/in/michaelaalcorn/) هو مهندس رئيسي في تعلم الآلات في شركة جون دير، حيث يطور نماذج تعلم عميق للإدراك باستخدام بيانات الليدار والصورة الملونة (RGB) في أنظمة حرجة للسلامة وتعمل في الزمن الحقيقي. حصل على درجة الدكتوراه في علوم الحاسوب من جامعة أوبرن، مع أطروحة حول تحسين الرؤية الحاسوبية والشبكات العصبية العميقة المكانية-الزمنية، كما يمتلك تخصصًا فرعيًا دراسيًا في الرياضيات. تم الاستشهاد بأبحاث مايكل من قبل باحثين في DeepMind، جوجل، ميتا، مايكروسوفت، وOpenAI، من بين آخرين، وكانت ورقة \(batter\|pitcher\)2vec الخاصة به فائزة بجائزة في مؤتمر MIT Sloan لتحليلات رياضة 2018. كما ساهم برمجيًا في scikit\-learn وApache Solr، وقد تلقت مستودرات GitHub الخاصة به والتي بلغت مجتمعة أكثر من 2\,100 نجمة، استخدمت كنقطة بداية لأبحاث وشفرات إنتاجية في العديد من المؤسسات المختلفة. **MothBox: جهاز رصد آفات منخفض التكلفة، مفتوح المصدر، وآلي** سيتحدث الدكتور آندي كويتماير عن تصميم أداة علمية جديدة ومثيرة مفتوحة المصدر، تُعرف باسم Mothbox. يعد مشروع Mothbox مشروعًا فائزًا بالجوائز لمراقبة واسعة النطاق للحشرات من أجل التنوع البيولوجي. إنه جهاز منخفض التكلفة تم تطويره في الغابات الاستوائية القاسية ببنما، ويقوم بالتقاط صور فائقة الدقة لتحديد تلقائي لمستويات التنوع البيولوجي في الغابات والزراعة. بعد آلاف الملاحظات على الحشرات ومئات النشرات في بنما، بيرو، المكسيك، الإكوادور، والولايات المتحدة، نحن الآن نعمل على تطوير نسخة جديدة قابلة للتصنيع لتعميم هذه الأداة المهمة عالميًا. سنناقش تطوير هذا الجهاز في غابات بنما الاستوائية وأهميته لدراسة التنوع البيولوجي عالميًا. *عن المتحدث* يصمم الدكتور آندي كويتماير طرقًا جديدة للتفاعل مع العالم الطبيعي. عمل مع منظمات كبيرة مثل شبكة كرتون نتورك، IDEO، والمؤسسة الوطنية، ودرّس كأستاذ على ملاك التدريس في الجامعة الوطنية السنغافورية، وتم تحويل أبحاثه إلى سلسلة تلفزيونية (مضحكة) بعنوان "Hacking the Wild"، تم توزيعها عبر شبكة ديسكفري. حاليًا، يقضي معظم وقته في العمل التطوعي مع منظمات صغيرة، وقام مؤخرًا بتأسيس ورشة عمل مختبرات الطبيعة الرقمية (Digital Naturalism Laboratories). في غابة جامبوا الاستوائية ببنما، تدمج Dinalab العمل الميداني البيولوجي مع الحرف التكنولوجية ضمن مجتمع من العلماء والفنانين والمهندسين ومتخصصي إعادة تأهيل الحيوانات المحليين والدوليين. وهو حاليًا مستشار طلابي كأستاذ مشارك في جامعة واشنطن. **النماذج الأساسية للذكاء الاصطناعي البصري في الزراعة** لقد مكّنت النماذج الأساسية من أسلوب جديد لمعالجة المهام، من خلال الاستفادة من القدرات الناشئة بطريقة خالية من التدريب (zero-shot). في هذا الحديث، سأناقش أحدث الأبحاث المتعلقة بتمكين الذكاء الاصطناعي البصري بطريقة خالية من التدريب أو من خلال التعديل الدقيق (fine-tuning). على وجه التحديد، سأناقش بحثًا مشتركًا حول مشروع RELOCATE، وهو معيار بسيط لا يتطلب تدريبًا مصممًا لأداء المهمة الصعبة المتمثلة في تحديد موقع الاستعلام البصري في مقاطع فيديو طويلة. للتخلص من الحاجة إلى تدريب مخصص للمهمة والتعامل بكفاءة مع مقاطع الفيديو الطويلة، يستفيد RELOCATE من تمثيل قائم على المناطق مستمد من نماذج رؤية تم تدريبها مسبقًا. سأناقش أيضًا بحثًا مشتركًا حول تمكين النماذج الكبيرة متعددة الوسائط (MLLMs) من الإجابة الصحيحة على الاستعلامات التي تتطلب فهمًا شاملاً مكانيًا-زمانيًا: حيث تجد النماذج الكبيرة متعددة الوسائط صعوبة في الإجابة على استعلامات تشير إلى 1) البيئة بأكملها التي يمكن لوكيل مزود بنموذج MLLM العمل فيها؛ وتشير في الوقت نفسه إلى 2) الإجراءات الحديثة التي حدثت للتو وتم ترميزها في مقطع فيديو. ومع ذلك، فإن هذا الفهم الشامل المكاني-الزماني مهم للوكلاء الذين يعملون في العالم الحقيقي. يشمل حلنا تطوير خط أنابيب مخصص لجمع البيانات والتعديل الدقيق لنموذج MLLM مزود بمشعات لتحسين كل من الفهم المكاني للبيئة والفهم الزمني للملاحظات الحديثة. *عن المتحدث* [ألكس شوينغ](https://www.linkedin.com/in/alexander-s-0a049258/) هو أستاذ مشارك في جامعة إلينوي في أوربانا-شامبين، يعمل مع طلاب موهوبين في مجالات الذكاء الاصطناعي، والذكاء الاصطناعي التوليدي، ومواضيع الرؤية الحاسوبية. حصل على بكالوريوس ودبلومه في الهندسة الكهربائية وتكنولوجيا المعلومات من الجامعة التقنية في ميونخ عام 2006 و2008 على التوالي، وحصل على درجة الدكتوراه في علوم الحاسوب من ETH زيورخ عام 2014. وبعد ذلك انضم إلى جامعة تورونتو كزميل ما بعد الدكتوراه حتى عام 2016. تتركز اهتماماته البحثية في مجالات الذكاء الاصطناعي، والذكاء الاصطناعي التوليدي، والرؤية الحاسوبية، حيث شارك في تأليف العديد من الأوراق البحثية في مواضيع تشمل فهم السيناريو، خوارزميات الاستدلال والتعلم، التعلم العميق، ومعالجة الصور واللغة، والنماذج التوليدية. حصلت أطروحته للدكتوراه على ميدالية ETH، وفاز بحث فريقه بجائزة NSF CAREER. **خارج المختبر: كشف الشذوذ في العالم الحقيقي للرؤية الحاسوبية الزراعية** يُحدث كشف الشذوذ تغييرًا في التصنيع والمراقبة، ولكن ماذا عن الزراعة؟ هل يمكن للذكاء الاصطناعي أن يكشف فعليًا عن أمراض النباتات وأضرار الآفات في وقت مبكر بما يكفي لصنع فرق؟ يوضح هذا الحديث كيف يُمكن لكشف الشذوذ تحديد مشكلات المحاصيل وموقعها باستخدام صحة أوراق القهوة كمثالنا الرئيسي. سنبدأ بالنظرية الأساسية، ثم نفحص كيف تكتشف هذه النماذج صدأ الأوراق وأضرار اليرقة الحافرة في الصور. تشمل الجلسة سير عمل عمليًا شاملاً باستخدام أداة الرؤية الحاسوبية مفتوحة المصدر FiftyOne، تغطي تجميع مجموعة البيانات، واستخراج القطع، وتدريب النموذج، وعرض النتائج. ستحصل على فهم نظري لكشف الشذوذ في الرؤية الحاسوبية وتجربة عملية في تطبيق هذه التقنيات على التحديات الزراعية وDomains أخرى. *عن المتحدث* [باولا راموس](https://www.linkedin.com/in/paula-ramos-phd/) حاصلة على درجة الدكتوراه في الرؤية الحاسوبية وتعلم الآلات، ولديها أكثر من 20 عامًا من الخبرة في المجال التكنولوجي. وهي تطور تقنيات هندسية متكاملة جديدة، خاصة في مجالات الرؤية الحاسوبية، والروبوتات، وتعلم الآلات المطبقة على الزراعة، منذ أوائل العقد الأول من القرن الحادي والعشرين في كولومبيا.