انضم إلينا في اليوم الأول من سلسلة الفعاليات الافتراضية للاستماع إلى خبراء حول آخر التطورات في مجال التقاطع بين الذكاء الاصطناعي البصري والزراعة. **التاريخ والوقت** 15 أكتوبر الساعة 9 صباحًا بالتوقيت الهادئ **المكان** فعالية افتراضية. [سجّل الدخول عبر زووم.](https://voxel51.com/events/visual-ai-in-agriculture-october-15-2025) **Paved2Paradise: محاكاة ليدار قابلة للتوسيع لإدراك العالم الحقيقي** غالبًا ما يتطلب تدريب نماذج الإدراك القوية للروبوتات والاستقلالية بيانات ضخمة ومتنوعة ثلاثية الأبعاد. ولكن جمع وتصنيف سحب نقاط الليدار من العالم الحقيقي على نطاق واسع أمر مكلفٌ ويتطلب وقتًا طويلاً، خاصة عند الحاجة إلى تسميات عالية الجودة. يقدم Paved2Paradise بديلًا اقتصاديًا: وهو خط أنابيب محاكاة ليدار قابل للتوسيع يولد مجموعات بيانات واقعية ومُصنفة بالكامل مع أقل جهد بشري في التصنيف. الفكرة الأساسية هي "تحليل العالم الحقيقي" من خلال التقاط مسح خلفي (مثل الحقول، الطرق، مواقع البناء) ومسح كائنات منفصلة (مثل المركبات، الأشخاص، الآلات). ومن خلال دمج هذين المصدرَين بشكل ذكي، يمكن لـ Paved2Paradise تركيب عدد كبير تآزريًا من مشاهد التدريب المختلفة. يتضمن الخط الأنابيب أربع خطوات: (1) جمع مسوحات ليدار خلفية واسعة النطاق، (2) تسجيل مسوحات عالية الدقة لكائنات مستهدفة في ظروف خاضعة للتحكم، (3) إدخال الكائنات إلى الخلفيات مع وضع وحجب متسقين فيزيائيًا، (4) محاكاة هندسة الليدار لضمان الواقعية. أظهرت التجارب أن النماذج المدربة على بيانات تم إنشاؤها باستخدام Paved2Paradise تنتقل بكفاءة إلى العالم الحقيقي، وتُحقق أداءً قويًا في الكشف مع تقليل كبير في العمل اليدوي للتصنيف مقارنةً بجمع مجموعة البيانات التقليدية. هذه الطريقة ليست فعالة من حيث التكلفة فحسب، بل مرنة أيضًا — مما يسمح للممارسين بسهولة التوسع إلى فئات أو مجالات كائنات جديدة عن طريق استبدال مسوحات الخلفية أو الكائنات. بالنسبة لممارسي التعلم الآلي العاملين في الروبوتات، المركبات المستقلة، أو أنظمة الإدراك الحرجة للسلامة، يسلط Paved2Paradise الضوء على مسار عملي نحو توسيع بيانات التدريب دون زيادة التكاليف. ويُغلق الفجوة بين المحاكاة والأداء في العالم الحقيقي، ما يتيح التكرار الأسرع والنشر الأكثر موثوقية لنماذج الإدراك. *عن المتحدث* [مايكل أ. ألورن](https://www.linkedin.com/in/michaelaalcorn/) هو مهندس رئيسي للتعلم الآلي في شركة جون دير، حيث يطور نماذج التعلم العميق للإدراك باستخدام بيانات الليدار والصور RGB لأنظمة تتطلب السلامة وتُشغل في الوقت الفعلي. حصل على درجة الدكتوراه في علوم الحاسوب من جامعة أوبرن، مع أطروحة حول تحسين الرؤية الحاسوبية والشبكات العصبية العميقة المكانية-الزمنية، كما يمتلك تخصصًا فرعيًا في الرياضيات. تم الاستشهاد بأبحاث مايكل من قبل باحثين في DeepMind وGoogle وMeta وMicrosoft وOpenAI وغيرهم، وكانت ورقة \(batter\|pitcher\)2vec الخاصة به فائزة بجائزة في مؤتمر MIT Sloan Sports Analytics Conference عام 2018. كما ساهم برمجيًا في scikit\-learn وApache Solr، وقد تلقى مستودعاته على GitHub أكثر من 2\,100 نجمة، وتم استخدامها كنقاط بداية لأبحاث وأكواد إنتاجية في العديد من المؤسسات. **MothBox: جهاز رصد آفات منخفض التكلفة ومفتوح المصدر** سيتحدث الدكتور آندي كوتميير عن تصميم أداة علمية مفتوحة المصدر جديدة ومثيرة، Mothbox. يعد مشروع Mothbox مشروعًا فائزًا بجائزة لمراقبة واسعة النطاق للحشرات من حيث التنوع البيولوجي. إنه جهاز منخفض التكلفة تم تطويره في غابات بنما القاسية، يقوم بالتقاط صور عالية الدقة جدًا ثم يقوم تلقائيًا بتحديد مستويات التنوع البيولوجي في الغابات والزراعة. بعد آلاف الملاحظات على الحشرات ومئات النشرات في بنما، بيرو، المكسيك، الإكوادور، والولايات المتحدة، نحن الآن نعمل على تطوير إصدار جديد يمكن تصنيعه لتوزيع هذه الأداة المهمة في جميع أنحاء العالم. سنناقش تطوير هذا الجهاز في غابات بنما وأهميته لدراسة التنوع البيولوجي عالميًا. *عن المتحدث* يصمم الدكتور آندي كوتميير طرقًا جديدة للتفاعل مع العالم الطبيعي. عمل مع منظمات كبيرة مثل Cartoon Network وIDEO وSmithsonian، ودرّس كأستاذ مساعد في جامعة سنغافورة الوطنية، وحتى تم تحويل بحثه إلى سلسلة تلفزيونية (طرافة) بعنوان "Hacking the Wild"، تم توزيعها بواسطة Discovery Networks. حاليًا، يقضي معظم وقته في التطوع مع منظمات صغيرة، وقام مؤخرًا بتأسيس ورشة عمل مختبرات Digital Naturalism. في غابة الأمطار في جامبوا ببنما، تدمج Dinalab العمل الميداني البيولوجي مع الصنع التكنولوجي ضمن مجتمع من العلماء والفنانين والمهندسين ومتعافي الحيوانات المحليين والدوليين. وهو حاليًا يستشار أيضًا كأستاذ مشارك في جامعة واشنطن. **النماذج الأساسية للذكاء الاصطناعي البصري في الزراعة** لقد مكّنت النماذج الأساسية من طريقة جديدة لمعالجة المهام، وذلك بالاستفادة من القدرات الناشئة بطريقة بدون تدريب (zero-shot). في هذا الحديث سأناقش أحدث الأبحاث المتعلقة بتمكين الذكاء الاصطناعي البصري بطريقة بدون تدريب أو عبر التعديل الدقيق (fine-tuning). على وجه التحديد، سأتناول العمل المشترك حول RELOCATE، وهو معيار بسيط لا يتطلب تدريبًا مخصصًا ويُصمم لأداء مهمة صعبة وهي تحديد موقع الاستعلام البصري في مقاطع فيديو طويلة. للتخلص من الحاجة إلى تدريب مخصص للمهمة والتعامل بكفاءة مع مقاطع الفيديو الطويلة، يستفيد RELOCATE من تمثيل قائم على المناطق مستمد من نماذج بصرية مُدرّبة مسبقًا. كما سأناقش العمل المشترك حول تمكين نماذج اللغة الكبيرة متعددة الوسائط (MLLMs) من الإجابة الصحيحة على الطلبات التي تتطلب فهمًا شاملاً مكانيًا-زمانيًا: إذ تجد النماذج الصعوبة في الإجابة على طلبات تشير إلى 1) البيئة بأكملها التي يمكن لوكيل مزود بنموذج MLLM العمل فيها؛ وفي نفس الوقت تشير أيضًا إلى 2) الإجراءات الأخيرة التي حدثت للتو والتي تم ترميزها في مقطع فيديو. ومع ذلك، فإن هذا الفهم الشامل المكاني-الزماني مهم للوكلاء الذين يعملون في العالم الحقيقي. يتمثل حلنا في تطوير خط أنابيب مخصص لجمع البيانات وتعديل نموذج MLLM مجهز بمشعات لتحسين كل من الفهم المكاني للبيئة والفهم الزمني للملاحظات الأخيرة. *عن المتحدث* [ألكس شوينغ](https://www.linkedin.com/in/alexander-s-0a049258/) هو أستاذ مشارك في جامعة إلينوي في أوربانا-شامبين، يعمل مع طلاب موهوبين في مجالات الذكاء الاصطناعي والذكاء الاصطناعي التوليدي والرؤية الحاسوبية. حصل على بكالوريوس الهندسة الكهربائية وهندسة المعلومات من الجامعة التقنية في ميونيخ عام 2006 و2008 على التوالي، وحصل على درجة الدكتوراه في علوم الحاسوب من ETH زيورخ عام 2014. وبعد ذلك انضم إلى جامعة تورونتو كزميل باحث حتى عام 2016. تتركز اهتماماته البحثية في مجالات الذكاء الاصطناعي والذكاء الاصطناعي التوليدي والرؤية الحاسوبية، حيث شارك في تأليف العديد من الأوراق البحثية حول فهم السيناريو، وخوارزميات الاستنتاج والتعلم، والتعلم العميق، ومعالجة الصور واللغة، والنماذج التوليدية. تم منح أطروحته للدكتوراه ميدالية ETH، وفاز بحث فريقه بجائزة NSF CAREER. **خارج المختبر: كشف الشذوذ في العالم الحقيقي للرؤية الحاسوبية الزراعية** يُحدث كشف الشذوذ تغييرًا في التصنيع والمراقبة، ولكن ماذا عن الزراعة؟ هل يمكن للذكاء الاصطناعي أن يكتشف أمراض النباتات وأضرار الآفات مبكرًا بما يكفي لصنع فرق حقيقي؟ يوضح هذا الحديث كيف يحدد كشف الشذوذ ويحلل مشكلات المحاصيل باستخدام صحة أوراق القهوة كمثال رئيسي. سنبدأ بالنظرية الأساسية، ثم ندرس كيف تكشف هذه النماذج عن أضرار الصدأ والحفر في صور الأوراق. تشمل الجلسة سير عمل شاملًا عمليًا باستخدام أدوات FiftyOne المفتوحة المصدر للرؤية الحاسوبية، وتشمل تنقيح مجموعة البيانات، واستخراج القطع، وتدريب النموذج، وتصور النتائج. ستحصل على فهم نظري لكشف الشذوذ في الرؤية الحاسوبية، بالإضافة إلى خبرة عملية في تطبيق هذه التقنيات على التحديات الزراعية وغيرها من المجالات. *عن المتحدث* [باولا راموس](https://www.linkedin.com/in/paula-ramos-phd/) تحمل درجة الدكتوراه في الرؤية الحاسوبية والتعلم الآلي، ولديها أكثر من 20 عامًا من الخبرة في المجال التكنولوجي. تعمل منذ أوائل العقد الأول من القرن الحادي والعشرين في كولومبيا على تطوير تقنيات هندسية متكاملة جديدة، تركز أساسًا على الرؤية الحاسوبية، والروبوتات، والتعلم الآلي المطبقة في الزراعة.