انضم إلينا في اليوم الأول من سلسلة الفعاليات الافتراضية للاستماع إلى خبراء يناقشون آخر التطورات في مجال التقاطع بين الذكاء الاصطناعي البصري والزراعة. **التاريخ والوقت** 15 أكتوبر الساعة 9 صباحًا بالتوقيت الهادئ **الموقع** افتراضي. [سجّل الدخول إلى Zoom.](https://voxel51.com/events/visual-ai-in-agriculture-october-15-2025) **Paved2Paradise: محاكاة ليدار قابلة للتوسيع من أجل الإدراك في العالم الحقيقي** غالبًا ما يتطلب تدريب نماذج إدراك قوية للروبوتات والاستقلالية بيانات ضخمة ومتنوعة ثلاثية الأبعاد. ولكن جمع وتصنيف سحب نقاط ليدار من العالم الحقيقي بحجم كبير أمر مكلف ويتطلب وقتًا طويلاً، خاصة عند الحاجة إلى تسميات عالية الجودة. يقدم Paved2Paradise بديلاً اقتصاديًا: وهو خط أنابيب محاكاة ليدار قابل للتوسيع لإنشاء بيانات واقعية ومُصنفة بالكامل بجهد تصنيف بشري ضئيل. الفكرة الأساسية هي "تحليل العالم الحقيقي" من خلال التقاط مسح خلفية (مثلًا: الحقول، الطرق، مواقع البناء) ومسح كائنات (مثلًا: المركبات، الأشخاص، الآلات) بشكل منفصل. ومن خلال دمج هذين المصدرَين بذكاء، يمكن لـ Paved2Paradise توليد مجموعة كبيرة من مشاهد التدريب المتنوعة. يتضمن خط الأنابيب أربع خطوات: (1) جمع مسح ليدار خلفي واسع النطاق، (2) تسجيل مسح عالي الدقة للكائنات المستهدفة في ظروف خاضعة للرقابة، (3) إدخال الكائنات إلى الخلفيات مع وضع وحجب متسقين من الناحية الفيزيائية، (4) محاكاة هندسة الليدار لضمان الواقعية. تُظهر التجارب أن النماذج المدربة على بيانات تم إنشاؤها باستخدام Paved2Paradise تنتقل بفعالية إلى العالم الحقيقي، وتحقق أداءً قويًا في الكشف مع تقليل كبير في الترميز اليدوي مقارنةً بطرق جمع البيانات التقليدية. هذه الطريقة ليست فعالة من حيث التكلفة فحسب، بل مرنة أيضًا — مما يسمح للممارسين بسهولة التوسع إلى فئات أو مجالات كائنات جديدة عن طريق استبدال مسحات الخلفية أو الكائنات. بالنسبة لممارسي تعلم الآلة العاملين في مجالات الروبوتات، أو المركبات المستقلة، أو أنظمة الإدراك الحرجة للسلامة، يُبرز Paved2Paradise مسارًا عمليًا نحو توسيع بيانات التدريب دون زيادة التكاليف. وهو يُغلق الفجوة بين الأداء في المحاكاة والعالم الحقيقي، مما يتيح تكرارًا أسرع ونشرًا أكثر موثوقية لنماذج الإدراك. *عن المتحدث* [مايكل أ. ألكورن](https://www.linkedin.com/in/michaelaalcorn/) هو مهندس رئيسي للتعلم الآلي في شركة جون دير، حيث يطور نماذج التعلم العميق للإدراك باستخدام بيانات الليدار والألوان (RGB) في أنظمة حرجة للسلامة وتعمل في الزمن الحقيقي. حصل على درجة الدكتوراه في علوم الحاسوب من جامعة أوبرن، مع أطروحة حول تحسين الرؤية الحاسوبية والشبكات العصبية العميقة الزمكانية، ويحمل أيضًا تخصصًا فرعيًا للدراسات العليا في الرياضيات. تم الاستشهاد بأبحاث مايكل من قبل باحثين في DeepMind وGoogle وMeta وMicrosoft وOpenAI وغيرهم، وفاز ورقة \(batter\|pitcher\)2vec الخاصة به بجائزة في مؤتمر MIT Sloan Sports Analytics 2018. كما ساهم برمجيًا في scikit\-learn وApache Solr، وقد تلقى مستودعات GitHub الخاصة به — التي حصلت مجتمعة على أكثر من 2\,100 نجمة — دعمًا كنقطة بداية لأبحاث وشفرات إنتاجية في العديد من المؤسسات المختلفة. **MothBox: جهاز رصد حشرات منخفض التكلفة ومفتوح المصدر** سيتحدث الدكتور آندي كويتماير عن تصميم أداة علمية مفتوحة المصدر جديدة ومثيرة، تُسمى Mothbox. يُعد مشروع Mothbox فائزًا بجائزة، ويهدف إلى رصد الحشرات على نطاق واسع من أجل دراسة التنوع البيولوجي. وهو جهاز منخفض التكلفة تم تطويره في غابات بنما القاسية، ويُجري صورًا عالية الدقة جدًا لتحديد مستويات التنوع البيولوجي في الغابات والزراعة تلقائيًا. بعد آلاف الملاحظات على الحشرات ومئات النشرات في بنما، بيرو، المكسيك، الإكوادور، والولايات المتحدة، نحن الآن نطور نسخة جديدة قابلة للتصنيع لنشر هذه الأداة المهمة في جميع أنحاء العالم. سنناقش تطوير هذا الجهاز في غابات بنما وأهميته لدراسة التنوع البيولوجي عالميًا. *عن المتحدث* يصمم الدكتور آندي كويتماير طرقًا جديدة للتفاعل مع العالم الطبيعي. عمل مع منظمات كبيرة مثل شبكة كرتون نتورك وIDEO وSmithsonian، ودرّس كأستاذ مساعد في جامعة سنغافورة الوطنية، وتحولت أبحاثه حتى إلى سلسلة تلفزيونية (مضحكة) بعنوان "Hacking the Wild"، تم توزيعها بواسطة Discovery Networks. حاليًا، يقضي معظم وقته في العمل التطوعي مع منظمات صغيرة، وقام مؤخرًا بتأسيس مختبر للحِرف اليدوية الميدانية، Digital Naturalism Laboratories. في غابة جامبوا الاستوائية في بنما، يدمج Dinalab بين العمل الميداني البيولوجي والصناعة التكنولوجية ضمن مجتمع من العلماء والفنانين والمهندسين ومُنقذي الحيوانات المحليين والدوليين. وحاليًا، يُقدم الاستشارات للطلاب بصفته أستاذًا مرتبطًا في جامعة واشنطن. **النماذج الأساسية للذكاء الاصطناعي البصري في الزراعة** لقد مكّنت النماذج الأساسية من طريقة جديدة لمعالجة المهام، مستفيدة من القدرات الناشئة بطريقة بدون تدريب (zero-shot). في هذا الحديث، سأناقش أبحاثًا حديثة حول تمكين الذكاء الاصطناعي البصري بطريقة بدون تدريب أو عبر التخصيص الدقيق (fine-tuning). على وجه التحديد، سأناقش عملًا مشتركًا حول RELOCATE، وهو معيار بسيط لا يتطلب تدريبًا مصممًا لأداء مهمة التحديد البصري للطلبات في مقاطع فيديو طويلة. للتخلص من الحاجة إلى تدريب خاص بالمهمة والتعامل بكفاءة مع مقاطع الفيديو الطويلة، يستفيد RELOCATE من تمثيل قائم على المناطق مستمد من نماذج رؤية مُدرّبة مسبقًا. سأناقش أيضًا عملًا مشتركًا حول تمكين نماذج اللغات الكبيرة متعددة الوسائط (MLLMs) من الإجابة الصحيحة على الطلبات التي تتطلب فهمًا شاملاً مكانزمنيًا: فنماذج MLLM تجد صعوبة في الإجابة على طلبات تشير إلى 1) بيئة كاملة يمكن لوكيل مزود بنموذج MLLM العمل فيها؛ وتُشير في الوقت نفسه إلى 2) أفعال حديثة حدثت للتو وتم ترميزها في مقطع فيديو. ومع ذلك، فإن هذا الفهم الشامل المكانزمني مهم للوكلاء العاملين في العالم الحقيقي. يشمل حلنا تطوير خط أنابيب مخصص لجمع البيانات وتخصيص نموذج MLLM مزود بمشعاعات لتحسين الفهم المكاني للبيئة والفهم الزمني للملاحظات الحديثة. *عن المتحدث* [ألكس شوينغ](https://www.linkedin.com/in/alexander-s-0a049258/) هو أستاذ مشارك في جامعة إلينوي في أوربانا-شامبين، يعمل مع طلاب موهوبين في مجالات الذكاء الاصطناعي، والذكاء الاصطناعي التوليدي، ورؤية الحاسوب. حصل على بكالوريوس ودبلومه في الهندسة الكهربائية وتكنولوجيا المعلومات من الجامعة التقنية في ميونخ عامي 2006 و2008 على التوالي، ونال درجة الدكتوراه في علوم الحاسوب من معهد إيث زيورخ عام 2014. وبعد ذلك انضم إلى جامعة تورونتو كزميل ما بعد الدكتوراه حتى عام 2016. تتركز اهتماماته البحثية في مجالات الذكاء الاصطناعي، والذكاء الاصطناعي التوليدي، ورؤية الحاسوب، حيث شارك في تأليف العديد من الأوراق البحثية في مواضيع فهم المشهد، وخوارزميات الاستدلال والتعلم، والتعلم العميق، ومعالجة الصور واللغة، والنماذج التوليدية. حصلت أطروحته للدكتوراه على ميدالية ETH، ونال بحث فريقه جائزة NSF CAREER. **ما وراء المختبر: كشف الشذوذ في العالم الحقيقي للرؤية الحاسوبية الزراعية** يُحدث كشف الشذوذ تغييرًا في التصنيع والمراقبة، لكن ماذا عن الزراعة؟ هل يمكن للذكاء الاصطناعي اكتشاف أمراض النباتات وأضرار الآفات مبكرًا بما يكفي لصنع فرق؟ يوضح هذا الحديث كيف يحدد كشف الشذوذ مشكلات المحاصيل ويحددها، مستخدمًا صحة أوراق القهوة كمثال أساسي. سنبدأ بالنظرية الأساسية، ثم نحلل كيف تكتشف هذه النماذج الصدأ وأضرار المنّ في صور الأوراق. تشمل الجلسة سير عمل عمليًا شاملاً باستخدام أداة FiftyOne مفتوحة المصدر للرؤية الحاسوبية، تغطي تنظيم مجموعة البيانات، واستخراج القطع، وتدريب النموذج، وتصور النتائج. ستحصل على فهم نظري لكشف الشذوذ في الرؤية الحاسوبية، بالإضافة إلى خبرة عملية في تطبيق هذه التقنيات على التحديات الزراعية ومجالات أخرى. *عن المتحدث* [باولا راموس](https://www.linkedin.com/in/paula-ramos-phd/) حاصلة على دكتوراه في الرؤية الحاسوبية وتعلم الآلة، ولديها أكثر من 20 عامًا من الخبرة في المجال التكنولوجي. وقد كانت تطور تقنيات هندسية متكاملة جديدة، خاصة في مجالات الرؤية الحاسوبية، والروبوتات، وتعلم الآلة المطبقة على الزراعة، منذ أوائل العقد الأول من القرن الحادي والعشرين في كولومبيا.