انضم إلينا في اليوم الأول من سلسلة الفعاليات الافتراضية للاستماع إلى متحدثين خبراء حول آخر التطورات في مجال التقاء الذكاء الاصطناعي البصري والزراعة. **التاريخ والوقت** 15 أكتوبر الساعة 9 صباحًا بالتوقيت الهادئ **المكان** افتراضي. [سجّل الدخول عبر زووم.](https://voxel51.com/events/visual-ai-in-agriculture-october-15-2025) **Paved2Paradise: محاكاة ليدار قابلة للتوسيع لإدراك العالم الحقيقي** غالبًا ما يتطلب تدريب نماذج الإدراك القوية للروبوتات والاستقلالية وجود مجموعات بيانات ضخمة ومتنوعة ثلاثية الأبعاد. لكن جمع وتصنيف سحب نقاط ليدار من العالم الحقيقي على نطاق واسع أمرٌ مكلفٌ ويتطلب وقتًا طويلاً، خاصة عند الحاجة إلى تسميات عالية الجودة. يقدم مشروع Paved2Paradise بديلًا اقتصاديًا: وهو خط أنابيب محاكاة ليدار قابل للتوسيع يُنتج مجموعات بيانات واقعية ومُصنفة بالكامل مع أقل جهد بشري في التصنيف. الفكرة الأساسية هي "تحليل العالم الحقيقي" من خلال التقاط مسح الخلفية (مثل الحقول، الطرق، مواقع البناء) ومسح الكائنات (مثل المركبات، الأشخاص، الآلات) بشكل منفصل. ومن خلال دمج هذين المصدرَين بذكاء، يمكن لـ Paved2Paradise تركيب عدد كبير من مشاهد التدريب المتنوعة. يتضمن خط الأنابيب أربع خطوات: (1) جمع مسح ليدار واسع النطاق للخلفية، (2) تسجيل مسح عالي الدقة لكائنات مستهدفة في ظروف مضبوطة، (3) إدخال الكائنات في الخلفيات مع وضع وحجب يتماشيان مع القوانين الفيزيائية، (4) محاكاة هندسة الليدار لضمان الواقعية. أظهرت التجارب أن النماذج المدربة على بيانات تم إنشاؤها باستخدام Paved2Paradise تنتقل بكفاءة إلى العالم الحقيقي، وتُحقق أداءً قويًا في الكشف مع حاجة أقل بكثير للتسمية اليدوية مقارنةً بجمع مجموعة البيانات التقليدية. هذه الطريقة ليست فعالة من حيث التكلفة فحسب، بل مرنة أيضًا—تمكّن الممارسين من التوسع بسهولة إلى فئات كائنات جديدة أو مجالات جديدة عن طريق استبدال مسح الخلفية أو الكائنات بمسوحات جديدة. بالنسبة لممارسي تعلم الآلة العاملين في الروبوتات، أو المركبات المستقلة، أو نظم الإدراك الحرجة للسلامة، يبرز مشروع Paved2Paradise مسارًا عمليًا نحو توسيع بيانات التدريب دون زيادة التكاليف. كما يسد الفجوة بين المحاكاة والأداء في العالم الحقيقي، مما يتيح تكرارًا أسرع ونشرًا أكثر موثوقية لنماذج الإدراك. *عن المتحدث* [مايكل أ. ألكورن](https://www.linkedin.com/in/michaelaalcorn/) هو مهندس رئيسي للتعلم الآلي في شركة جون دير، حيث يطوّر نماذج التعلّم العميق لإدراك الليدار والصورة بالألوان الكاملة في نظم حرجة للسلامة وتعمل في الزمن الحقيقي. حصل على درجة الدكتوراه في علوم الحاسوب من جامعة أوبرن، مع أطروحة حول تحسين الرؤية الحاسوبية والشبكات العصبية العميقة الزمكانية، ويحمل أيضًا تخصصًا فرعيًا في الرياضيات. وقد استشهد ببحث مايكل باحثون في DeepMind وGoogle وMeta وMicrosoft وOpenAI وغيرهم، وكانت ورقة \(batter\|pitcher\)2vec الخاصة به فائزة بجائزة في مؤتمر MIT Sloan Sports Analytics لعام 2018. كما ساهم برمجيًا في scikit\-learn وApache Solr، وحققت مستودعاته على GitHub التي تلقّت مجتمعة أكثر من 2\,100 نجمة نقطة بداية لأبحاث وأكواد إنتاجية في العديد من المؤسسات المختلفة. **MothBox: جهاز رصد آفات منخفض التكلفة، مفتوح المصدر، وآلي** سيتحدث الدكتور آندي كوتميير عن تصميم أداة علمية مثيرة جديدة ومفتوحة المصدر، وهي Mothbox. يعد مشروع Mothbox مشروعًا فائزًا بالجوائز لمراقبة واسعة النطاق للحشرات من أجل التنوع البيولوجي. إنه جهاز منخفض التكلفة تم تطويره في غابات بنما القاسية، ويقوم بالتقاط صور عالية الدقة جدًا ثم يقوم تلقائيًا بتحديد مستويات التنوع البيولوجي في الغابات والزراعة. وبعد آلاف الملاحظات على الحشرات ومئات النشرات في بنما، بيرو، المكسيك، الإكوادور، والولايات المتحدة، نحن الآن نعمل على تطوير نسخة جديدة قابلة للإنتاج لمشاركة هذه الأداة المهمة في جميع أنحاء العالم. وسنناقش تطوير هذا الجهاز في غابات بنما وأهميته لدراسة التنوع البيولوجي عالميًا. *عن المتحدث* يصمم الدكتور آندي كوتميير طرقًا جديدة للتفاعل مع العالم الطبيعي. عمل مع منظمات كبيرة مثل شبكة كرتون نتورك وIDEO وSmithsonian، ودرّس كبروفيسور مساعد في جامعة سنغافورة الوطنية، وتحول بحثه حتى إلى برنامج تلفزيوني (ساخر) بعنوان "اختراق البرية"، تم توزيعه عبر Discovery Networks. في الوقت الحالي، يقضي معظم وقته في العمل التطوعي مع منظمات صغيرة، وقام مؤخرًا بتأسيس مختبر الحرف الرقمية للطبيعة (Digital Naturalism Laboratories)، وهو مساحة إبداعية متخصصة في محطات الميدان. في غابة جامبوا الاستوائية في بنما، يدمج Dinalab العمل الميداني البيولوجي مع الحرف التكنولوجية ضمن مجتمع من العلماء والفنانين والمهندسين ومتخصصي إعادة تأهيل الحيوانات المحليين والدوليين. وهو يُقدم حاليًا المشورة للطلاب بصفته أستاذًا مرتبطًا في جامعة واشنطن. **النماذج الأساسية للذكاء الاصطناعي البصري في الزراعة** لقد مكّنت النماذج الأساسية من أسلوب جديد لمعالجة المهام، وذلك بالاستفادة من القدرات الناشئة بطريقة بدون تدريب (zero-shot). في هذا الحديث، سأناقش الأبحاث الحديثة المتعلقة بتمكين الذكاء الاصطناعي البصري بطريقة بدون تدريب أو عبر عملية ضبط دقيق (fine-tuning). على وجه التحديد، سأتناول العمل المشترك حول RELOCATE، وهو معيار بسيط لا يتطلب تدريبًا مصممًا لأداء مهمة صعبة تتمثل في تحديد موقع الاستعلام البصري في مقاطع فيديو طويلة. للتخلص من الحاجة إلى تدريب خاص بالمهمة ومعالجة مقاطع الفيديو الطويلة بكفاءة، يستفيد RELOCATE من تمثيل قائم على المناطق مشتق من نماذج رؤية مسبقة التدريب. سأناقش أيضًا العمل المشترك المتعلق بتمكين نماذج اللغات الكبيرة متعددة الوسائط (MLLMs) من الإجابة الصحيحة على المطالبات التي تتطلب فهمًا شاملاً مكانياً وزمنياً: فالنماذج متعددة الوسائط تجد صعوبة في الإجابة على المطالبات التي تشير إلى 1) البيئة بأكملها التي يمكن لوكيل مزود بنموذج MLLM العمل فيها؛ وفي نفس الوقت تشير أيضًا إلى 2) الإجراءات الأخيرة التي حدثت للتو والمُشفرة في مقطع فيديو. ومع ذلك، فإن هذا الفهم الشامل المكاني والزماني مهم للوكلاء العاملين في العالم الحقيقي. ويشمل حلنا تطوير خط أنابيب مخصص لجمع البيانات وضبط دقيق لنموذج MLLM مجهز بمشعات لتحسين كل من الفهم المكاني للبيئة والفهم الزمني للملاحظات الحديثة. *عن المتحدث* [ألكس شوينغ](https://www.linkedin.com/in/alexander-s-0a049258/) هو أستاذ مشارك في جامعة إلينوي في أوربانا-شامبين، يعمل مع طلاب موهوبين في مجالات الذكاء الاصطناعي، والذكاء الاصطناعي التوليدي، والرؤية الحاسوبية. تلقّى درجة البكالوريوس والدبلوم في الهندسة الكهربائية وتكنولوجيا المعلومات من الجامعة التقنية في ميونيخ عامي 2006 و2008 على التوالي، وحصل على درجة الدكتوراه في علوم الحاسوب من ETH زيورخ عام 2014. بعد ذلك انضم إلى جامعة تورونتو كزميل باحث ما بعد الدكتوراه حتى عام 2016. تشمل اهتماماته البحثية مجالات الذكاء الاصطناعي، والذكاء الاصطناعي التوليدي، والرؤية الحاسوبية، حيث شارك في تأليف العديد من الأوراق العلمية في مواضيع تشمل فهم السيناريوهات، وخوارزميات الاستدلال والتعلم، والتعلم العميق، وتجهيز الصور واللغة، والنماذج التوليدية. وقد كُرّمت أطروحته للدكتوراه بوسام ETH، وفاز بحث فريقه بجائزة NSF CAREER. **خارج المختبر: كشف الشذوذ في العالم الحقيقي للرؤية الحاسوبية الزراعية** يُحدث كشف الشذوذ ثورة في التصنيع والمراقبة، ولكن ماذا عن الزراعة؟ هل يمكن للذكاء الاصطناعي اكتشاف أمراض النباتات وأضرار الآفات مبكرًا بما يكفي لتحقيق فرق حقيقي؟ يوضح هذا الحديث كيف يحدد كشف الشذوذ مشكلات المحاصيل ويحددها بدقة، باستخدام صحة أوراق القهوة كمثال أساسي. سنبدأ بالنظرية الأساسية، ثم نفحص كيف تكتشف هذه النماذج صدأ الورقة وأضرار المنشار في صور الأوراق. تتضمن الجلسة سير عمل شاملًا عمليًا باستخدام أدوات FiftyOne المفتوحة المصدر للرؤية الحاسوبية، وتشمل تنظيم مجموعة البيانات، واستخراج القطع، وتدريب النموذج، وتصور النتائج. ستحصل على فهم نظري لكشف الشذوذ في الرؤية الحاسوبية، بالإضافة إلى خبرة عملية في تطبيق هذه الأساليب على التحديات الزراعية وغيرها من المجالات. *عن المتحدث* [بولينا راموس](https://www.linkedin.com/in/paula-ramos-phd/) تحمل درجة الدكتوراه في الرؤية الحاسوبية وتعلّم الآلة، ولديها أكثر من 20 سنة من الخبرة في المجال التكنولوجي. تعمل على تطوير تقنيات هندسية متكاملة جديدة، خصوصًا في مجالات الرؤية الحاسوبية، والروبوتات، وتعلّم الآلة المطبقة على الزراعة، منذ أوائل العقد الأول من القرن الحادي والعشرين في كولومبيا.