انضم إلينا في اليوم الأول من سلسلة فعاليات افتراضية للاستماع إلى متحدثين خبراء حول آخر التطورات في مجال التقاطع بين الذكاء الاصطناعي البصري والزراعة. **التاريخ والوقت** 15 أكتوبر الساعة 9 صباحًا بالتوقيت الهادئ **المكان** افتراضي. [سجّل الدخول عبر زووم.](https://voxel51.com/events/visual-ai-in-agriculture-october-15-2025) **Paved2Paradise: محاكاة ليدار قابلة للتوسيع لإدراك العالم الحقيقي** غالبًا ما يتطلب تدريب نماذج الإدراك القوية للروبوتات والاستقلالية بيانات ضخمة ومتنوعة ثلاثية الأبعاد. لكن جمع وتصنيف سحب نقاط ليدار من العالم الحقيقي بحجم كبير أمرٌ مكلفٌ ويستغرق وقتًا طويلاً، خاصة عندما تكون التصنيفات عالية الجودة ضرورية. يقدم Paved2Paradise بديلاً اقتصاديًا: وهو خط أنابيب محاكاة ليدار قابل للتوسيع يُنتج بيانات واقعية ومُصنفة بالكامل مع أقل جهد بشري في التصنيف. الفكرة الأساسية هي "تحليل الواقع" من خلال التقاط مسح خلفيات (مثل الحقول، الطرق، مواقع البناء) ومسح كائنات (مثل المركبات، الأشخاص، الآلات) بشكل منفصل. وبدمج هذين المصدرَين بذكاء، يمكن لـ Paved2Paradise توليد مجموعة كبيرة جدًا من مشاهد التدريب المختلفة. يتضمن خط الأنابيب أربع خطوات: (1) جمع مسح ليدار خلفي واسع النطاق، (2) تسجيل مسح عالي الدقة لكائنات مستهدفة في ظروف مضبوطة، (3) إدخال الكائنات داخل الخلفيات مع وضع وحجب يتماشيان مع القوانين الفيزيائية، (4) محاكاة هندسة الليدار لضمان الواقعية. أظهرت التجارب أن النماذج المدربة على بيانات تم إنشاؤها بواسطة Paved2Paradise تنتقل بكفاءة إلى العالم الحقيقي، وتحقق أداءً قويًا في الكشف مع حاجة أقل بكثير للتصنيف اليدوي مقارنةً بجمع البيانات التقليدي. هذه الطريقة ليست فعالة من حيث التكلفة فحسب، بل مرنة أيضًا — مما يسمح للممارسين بسهولة التوسع نحو فئات أو نطاقات كائنات جديدة عن طريق استبدال مسحات الخلفية أو الكائنات. بالنسبة لممارسي تعلم الآلة العاملين في الروبوتات أو المركبات ذاتية القيادة أو أنظمة الإدراك الحرجة للسلامة، فإن Paved2Paradise يبرز مسارًا عمليًا نحو توسيع بيانات التدريب دون زيادة التكاليف. كما يسد الفجوة بين الأداء في المحاكاة والأداء في العالم الحقيقي، مما يتيح التكرار الأسرع والنشر الأكثر موثوقية لنماذج الإدراك. *عن المتحدث* [مايكل أ. ألكورن](https://www.linkedin.com/in/michaelaalcorn/) هو مهندس رئيسي للتعلم الآلي في شركة John Deere\، حيث يطور نماذج التعلم العميق للإدراك باستخدام بيانات الليدار والصورة (RGB) لأنظمة حرجة للسلامة وتُعمل في الزمن الحقيقي\. حصل على درجة الدكتوراه في علوم الحاسوب من جامعة أوبرن\، مع أطروحة حول تحسين الرؤية الحاسوبية والشبكات العصبية العميقة الزمكانية\، ويحمل أيضًا تخصصًا فرعيًا في الرياضيات\. تم الاستشهاد بأبحاث مايكل من قبل باحثين في DeepMind\، Google\، Meta\، Microsoft\، وOpenAI\، من بين آخرين\، وكانت ورقته \(batter\|pitcher\)2vec فائزة بجائزة في مؤتمر MIT Sloan Sports Analytics Conference عام 2018\. كما ساهم برمجيًا في scikit\-learn وApache Solr\، وقد استُخدمت مستودرات GitHub الخاصة به — التي حصلت مجتمعة على أكثر من 2\,100 نجمة — كنقاط بداية لأبحاث وأكواد إنتاجية في العديد من المنظمات المختلفة\. **MothBox: جهاز رصد حشرات منخفض التكلفة، مفتوح المصدر، وآلي** سيتحدث الدكتور آندي كويتميير عن تصميم أداة علمية جديدة ومثيرة مفتوحة المصدر، Mothbox. إن Mothbox مشروع فائز بجوائز لمراقبة الحشرات على نطاق واسع من أجل التنوع البيولوجي. إنه جهاز منخفض التكلفة تم تطويره في الغابات الصعبة ببنما، ويقوم بالتقاط صور فائقة الدقة ثم يقوم تلقائيًا بتحديد مستويات التنوع البيولوجي في الغابات والزراعة. بعد آلاف الملاحظات على الحشرات ومئات النشرات في بنما، بيرو، المكسيك، الإكوادور، والولايات المتحدة، نحن الآن نعمل على تطوير نسخة جديدة قابلة للإنتاج لتعميم هذه الأداة المهمة عالميًا. سنناقش تطوير هذا الجهاز في غابات بنما وأهميته لدراسة التنوع البيولوجي عالميًا. *عن المتحدث* يصمم الدكتور آندي كويتميير طرقًا جديدة للتفاعل مع العالم الطبيعي. عمل مع منظمات كبيرة مثل Cartoon Network وIDEO وSmithsonian، ودرّس كأستاذ متفرغ في الجامعة الوطنية السنغافورية، وتحولت أبحاثه حتى إلى سلسلة تلفزيونية (مضحكة) بعنوان "Hacking the Wild"، تم توزيعها عبر Discovery Networks. حاليًا، يقضي معظم وقته في التطوع مع منظمات صغيرة، وقام مؤخرًا بتأسيس مختبر صناعة محطة ميدانية باسم Digital Naturalism Laboratories. في غابة الأمطار في جامبوا ببنما، يجمع Dinalab بين العمل الميداني البيولوجي والصناعة التكنولوجية ضمن مجتمع من العلماء والفنانين والمهندسين ومحسنّي الحيوانات المحليين والدوليين. ويشغل حاليًا منصب أستاذ متعاون مستشار للطلاب في جامعة واشنطن. **النماذج الأساسية للذكاء الاصطناعي البصري في الزراعة** لقد مكّنت النماذج الأساسية من أسلوب جديد لمعالجة المهام، وذلك بالاستفادة من القدرات الناشئة بطريقة بدون تدريب (zero-shot). في هذا الحديث، سأناقش أحدث الأبحاث المتعلقة بتمكين الذكاء الاصطناعي البصري بطريقة بدون تدريب أو عبر عملية ضبط دقيق (fine-tuning). وعلى وجه التحديد، سأتناول بحثًا مشتركًا حول RELOCATE، وهو معيار بسيط لا يتطلب تدريبًا مصممًا لأداء مهمة صعبة وهي تحديد موقع الاستعلام البصري في مقاطع فيديو طويلة. للتخلص من الحاجة للتدريب المخصص للمهمة وللتعامل بكفاءة مع مقاطع الفيديو الطويلة، يستفيد RELOCATE من تمثيل قائم على المناطق مستمد من نماذج بصرية مُدرّبة مسبقًا. كما سأناقش بحثًا مشتركًا حول تمكين نماذج اللغة الكبيرة متعددة الوسائط (MLLMs) من الإجابة الصحيحة على الطلبات التي تتطلب فهمًا شاملاً مكانياً-زمانيًا: إذ تعاني النماذج متعددة الوسائط من صعوبة في الإجابة على طلبات تشير إلى 1) البيئة الكاملة التي يمكن لوكيل مزوّد بنموذج MLLM العمل فيها؛ وفي نفس الوقت تشير أيضًا إلى 2) الإجراءات الأخيرة التي حدثت للتو والمشفرة في مقطع فيديو. لكن مثل هذا الفهم الشامل المكاني-الزماني مهم للوكلاء الذين يعملون في العالم الحقيقي. ويتضمن حلنا تطوير خط أنابيب مخصص لجمع البيانات وضبط دقيق لنموذج MLLM مجهز بمشعّات لتحسين كل من الفهم المكاني للبيئة والفهم الزمني للملاحظات الحديثة. *عن المتحدث* [أليكس شوينغ](https://www.linkedin.com/in/alexander-s-0a049258/) هو أستاذ مشارك في جامعة إلينوي في أوربانا-แชมبين، يعمل مع طلاب موهوبين في موضوعات الذكاء الاصطناعي، والذكاء الاصطناعي التوليدي، والرؤية الحاسوبية. حصل على بكالوريوس ودبلومه في الهندسة الكهربائية وتكنولوجيا المعلومات من الجامعة التقنية بميونيخ عامي 2006 و2008 على التوالي، وحصل على درجة الدكتوراه في علوم الحاسوب من ETH زيورخ عام 2014. بعد ذلك انضم إلى جامعة تورونتو كزميل باحث ما بعد الدكتوراه حتى عام 2016. تشمل اهتماماته البحثية مجالات الذكاء الاصطناعي، والذكاء الاصطناعي التوليدي، والرؤية الحاسوبية، حيث شارك في تأليف العديد من الأوراق العلمية حول مواضيع في فهم السيناريوهات، وخوارزميات الاستدلال والتعلم، والتعلم العميق، ومعالجة الصور واللغة، والنماذج التوليدية. ونالت أطروحته للدكتوراه ميدالية ETH، كما حصل بحث فريقه على جائزة NSF CAREER. **خارج المختبر: كشف الشذوذ في العالم الحقيقي للرؤية الحاسوبية الزراعية** إن كشف الشذوذ يُحدث تحوّلًا في التصنيع والمراقبة، ولكن ماذا عن الزراعة؟ هل يمكن للذكاء الاصطناعي اكتشاف أمراض النباتات وأضرار الآفات مبكرًا بما يكفي لصنع فرق حقيقي؟ يوضح هذا الحديث كيف يقوم كشف الشذوذ بتحديد مشكلات المحاصيل وموضعها باستخدام صحة أوراق البن كمثال أساسي. سنبدأ بالنظرية الأساسية، ثم نحلل كيف تكتشف هذه النماذج صدأ الورقة وأضرار العامل (miner) في صور الأوراق. تشمل الجلسة سير عمل عمليًا شاملًا باستخدام أدوات FiftyOne المفتوحة المصدر للرؤية الحاسوبية، وتشمل تنقيح مجموعة البيانات، واستخراج القطع (patches)، وتدريب النموذج، وعرض النتائج. ستحصل على فهم نظري لكشف الشذوذ في الرؤية الحاسوبية بالإضافة إلى خبرة عملية في تطبيق هذه الأساليب على التحديات الزراعية وغيرها من المجالات. *عن المتحدث* [باولا راموس](https://www.linkedin.com/in/paula-ramos-phd/) تحمل درجة الدكتوراه في الرؤية الحاسوبية وتعلم الآلة، ولديها أكثر من 20 عامًا من الخبرة في المجال التكنولوجي. تعمل على تطوير تقنيات هندسية متكاملة جديدة، خصوصًا في مجالات الرؤية الحاسوبية، والروبوتات، وتعلم الآلة المطبقة على الزراعة، منذ أوائل العقد الأول من القرن الحادي والعشرين في كولومبيا.