انضم إلينا في اليوم الأول من سلسلة الفعاليات الافتراضية للاستماع إلى خبراء حول أحدث التطورات في مجال التقاء الذكاء الاصطناعي البصري مع الزراعة. **التاريخ والوقت** 15 أكتوبر الساعة 9 صباحًا بالتوقيت الهادئ **المكان** فعالية افتراضية. [سجّل حضورك عبر Zoom.](https://voxel51.com/events/visual-ai-in-agriculture-october-15-2025) **Paved2Paradise: محاكاة ليدار قابلة للتوسيع من أجل الإدراك في العالم الحقيقي** غالبًا ما يتطلب تدريب نماذج الإدراك القوية للروبوتات والاستقلالية وجود مجموعات بيانات ثلاثية الأبعاد ضخمة ومتنوعة. ولكن جمع وتصنيف سحب نقاط الليدار من العالم الحقيقي بكميات كبيرة أمر مكلف وجهد يستغرق وقتًا طويلاً، خاصة عندما تكون العلامات عالية الجودة ضرورية. يقدم مشروع Paved2Paradise بديلاً اقتصاديًا: وهو خط أنابيب محاكاة ليدار قابل للتوسيع لإنشاء مجموعات بيانات واقعية ومصنفة بالكامل بحد أدنى من الجهد البشري في التصنيف. الفكرة الأساسية هي "تحليل العالم الحقيقي" من خلال التقاط فحوصات الخلفية (مثل الحقول والطرق ومواقع البناء) وفحوصات الكائنات (مثل المركبات والأشخاص والآلات) بشكل منفصل. ومن خلال دمج هذين المصدرَين بذكاء، يمكن لـ Paved2Paradise توليد عدد كبير من مشاهد التدريب المتنوعة. يتضمن خط الأنابيب أربع خطوات: (1) جمع فحوصات ليدار واسعة النطاق للخلفية، (2) تسجيل فحوصات عالية الدقة لكائنات الهدف في ظروف خاضعة للتحكم، (3) إدخال الكائنات في الخلفيات مع وضع وحجب يتماشيان مع القوانين الفيزيائية، و(4) محاكاة هندسة الليدار لضمان الواقعية. أظهرت التجارب أن النماذج المدرّبة باستخدام بيانات تم توليدها بواسطة Paved2Paradise تنتقل بكفاءة إلى العالم الحقيقي، وتُحقق أداءً قويًا في الكشف مع الحاجة إلى تصنيف يدوي أقل بكثير مقارنةً بجمع مجموعة البيانات التقليدية. هذه الطريقة ليست فقط فعالة من حيث التكلفة، بل مرنة أيضًا — مما يسمح للممارسين بسهولة التوسع إلى فئات أو نطاقات كائنات جديدة عن طريق استبدال فحوصات الخلفية أو الكائنات بغيرها جديدة. بالنسبة لممارسي التعلّم الآلي الذين يعملون في مجالات الروبوتات أو المركبات ذاتية القيادة أو أنظمة الإدراك الحرجة للسلامة، فإن Paved2Paradise يسلط الضوء على مسار عملي نحو توسيع بيانات التدريب دون زيادة التكاليف. كما يسد الفجوة بين الأداء في المحاكاة والأداء في العالم الحقيقي، ويتيح التكرار الأسرع والنشر الأكثر موثوقية لنماذج الإدراك. *عن المتحدث* [مايكل أ. ألْكرون](https://www.linkedin.com/in/michaelaalcorn/) هو مهندس رئيسي للتعلم الآلي في شركة John Deere\، حيث يطور نماذج التعلم العميق للإدراك باستخدام الليدار والصور الملونة (RGB) في أنظمة حرجة للسلامة وتعمل في الزمن الحقيقي\. حصل على درجة الدكتوراه في علوم الحاسوب من جامعة أوبرن\، وكان موضوع أطروحته تحسين الرؤية الحاسوبية والشبكات العصبية العميقة المكانية-الزمنية\، كما يمتلك تخصصًا فرعيًا دراسيًا في الرياضيات\. تم الاستشهاد بأبحاث مايكل من قبل باحثين في DeepMind\، Google\، Meta\، Microsoft\، وOpenAI\، من بين آخرين\، وكانت ورقته \(batter\|pitcher\)2vec فائزة بجائزة في مؤتمر MIT Sloan Sports Analytics Conference عام 2018\. كما ساهم برمجيًا في scikit\-learn وApache Solr\، وقد تم استخدام مستودعاته على GitHub—التي حصلت مجتمعة على أكثر من 2\,100 نجمة—كنقاط بداية لأبحاث وأكواد إنتاجية في العديد من المؤسسات المختلفة\. **MothBox: جهاز رصد حشرات منخفض التكلفة، مفتوح المصدر، وآلي** سيتحدث الدكتور آندي كويتميير عن تصميم أداة علمية مفتوحة المصدر جديدة ومثيرة، Mothbox. يعد Mothbox مشروعًا فائزًا بالجوائز لمراقبة واسعة النطاق للحشرات من أجل التنوع البيولوجي. إنه جهاز منخفض التكلفة تم تطويره في غابات بنما القاسية، ويقوم بالتقاط صور عالية الدقة جدًا ثم يقوم تلقائيًا بتحديد مستويات التنوع البيولوجي في الغابات والزراعة. بعد آلاف الملاحظات الحشرية ومئات النشرات في بنما، بيرو، المكسيك، الإكوادور، والولايات المتحدة، نحن الآن نعمل على تطوير نسخة جديدة قابلة للتصنيع لتوزيع هذه الأداة المهمة في جميع أنحاء العالم. سنناقش تطوير هذا الجهاز في غابات بنما وأهميته لدراسة التنوع البيولوجي عالميًا. *عن المتحدث* يصمم الدكتور آندي كويتميير طرقًا جديدة للتفاعل مع العالم الطبيعي. عمل مع منظمات كبيرة مثل شبكة كرتون نتورك وIDEO ومعهد سميثسونيان، ودرّس كأستاذ متفرغ في جامعة سنغافورة الوطنية، وحتى تم تحويل بحثه إلى سلسلة تلفزيونية (مضحكة) بعنوان "Hacking the Wild"، تم توزيعها بواسطة Discovery Networks. في الوقت الحالي، يقضي معظم وقته في العمل التطوعي مع منظمات صغيرة، ومؤخرًا أسس ورشة عمل مختبرات Digital Naturalism Laboratories. في غابة الأمطار في جامبوا ببنما، يدمج Dinalab العمل الميداني البيولوجي مع الصناعة التكنولوجية ضمن مجتمع من العلماء والفنانين والمهندسين ومحسنّي الحيوانات المحليين والدوليين. كما يُقدّم حاليًا المشورة للطلاب بصفته أستاذًا مشاركًا في جامعة واشنطن. **النماذج الأساسية للذكاء الاصطناعي البصري في الزراعة** لقد مكّنت النماذج الأساسية من أسلوب جديد لمعالجة المهام، وذلك بالاستفادة من القدرات الناشئة بطريقة بدون تدريب (zero-shot). في هذا الحديث، سأناقش أبحاثًا حديثة حول تمكين الذكاء الاصطناعي البصري بطريقة بدون تدريب (zero-shot) أو من خلال التعديل الدقيق (fine-tuning). على وجه التحديد، سأناقش عملًا مشتركًا حول RELOCATE، وهي معيار بسيط لا يتطلب تدريبًا مصممًا لأداء مهمة صعبة تتمثل في تحديد موقع السؤال البصري في مقاطع فيديو طويلة. للتخلص من الحاجة إلى تدريب خاص بالمهمة وللتعامل بكفاءة مع مقاطع الفيديو الطويلة، يستفيد RELOCATE من تمثيل قائم على المناطق مستمد من نماذج الرؤية المسبقة التدريب. كما سأناقش عملًا مشتركًا حول تمكين نماذج اللغات الكبيرة متعددة الوسائط (MLLMs) من الإجابة الصحيحة على الأوامر التي تتطلب فهمًا شاملاً مكانيًا-زمانيًا: إذ تعاني النماذج الكبيرة متعددة الوسائط من صعوبة في الإجابة على أوامر تشير إلى 1) بيئة كاملة يمكن لوكيل مزوّد بنموذج MLLM العمل فيها؛ وفي نفس الوقت تشير أيضًا إلى 2) إجراءات حديثة حدثت للتو وتم ترميزها في مقطع فيديو. ومع ذلك، فإن هذا الفهم الشامل المكاني-الزماني مهم للوكلاء العاملين في العالم الحقيقي. يشمل حلنا تطوير خط أنابيب مخصص لجمع البيانات والتعديل الدقيق لنموذج MLLM مجهز بمشعّات لتحسين كل من الفهم المكاني للبيئة والفهم الزمني للملاحظات الحديثة. *عن المتحدث* [أليكس شوينغ](https://www.linkedin.com/in/alexander-s-0a049258/) هو أستاذ مشارك في جامعة إلينوي في أوربانا-شامبين، يعمل مع طلاب موهوبين في مجالات الذكاء الاصطناعي، والذكاء الاصطناعي التوليدي، والرؤية الحاسوبية. حصل على بكالوريوس ودبلوم في الهندسة الكهربائية وتكنولوجيا المعلومات من الجامعة التقنية بميونيخ عامي 2006 و2008 على التوالي، وحصل على درجة الدكتوراه في علوم الحاسوب من ETH زيورخ عام 2014. وبعد ذلك انضم إلى جامعة تورونتو كزميل باحث حتى عام 2016. تشمل اهتماماته البحثية مجالات الذكاء الاصطناعي، والذكاء الاصطناعي التوليدي، والرؤية الحاسوبية، حيث شارك في تأليف العديد من الأوراق البحثية حول فهم المشهد، وخوارزميات الاستدلال والتعلّم، والتعلم العميق، ومعالجة الصور واللغة، والنماذج التوليدية. تم منح أطروحته للدكتوراه ميدالية ETH، وفاز بحث فريقه بجائزة NSF CAREER. **خارج المختبر: كشف الشذوذ في العالم الحقيقي للرؤية الحاسوبية الزراعية** يُحدث كشف الشذوذ ثورة في التصنيع والمراقبة، لكن ماذا عن الزراعة؟ هل يمكن للذكاء الاصطناعي بالفعل اكتشاف أمراض النباتات وأضرار الآفات في وقت مبكر بما يكفي لصنع فرق؟ يوضح هذا الحديث كيف يحدد كشف الشذوذ مشكلات المحاصيل ويحلل مواقعها، مستخدمًا صحة أوراق البن كمثال رئيسي. سنبدأ بالنظرية الأساسية، ثم ندرس كيف تكتشف هذه النماذج صدأ الأوراق وأضرار المنشار في صور الأوراق. تشمل الجلسة سير عمل عمليًا شاملًا باستخدام أدوات FiftyOne المفتوحة المصدر للرؤية الحاسوبية، ويغطي تنقيح مجموعة البيانات، واستخراج القطع، وتدريب النموذج، وعرض النتائج. ستحصل على فهم نظري لكشف الشذوذ في الرؤية الحاسوبية وعلى خبرة عملية في تطبيق هذه التقنيات على التحديات الزراعية وغيرها من المجالات. *عن المتحدث* [باولا راموس](https://www.linkedin.com/in/paula-ramos-phd/) تحمل درجة الدكتوراه في الرؤية الحاسوبية والتعلم الآلي، ولديها أكثر من 20 عامًا من الخبرة في المجال التكنولوجي. وهي تعمل على تطوير تقنيات هندسية متكاملة جديدة، خاصة في مجالات الرؤية الحاسوبية، والروبوتات، والتعلم الآلي المطبّق على الزراعة، منذ أوائل العقد الأول من القرن الحادي والعشرين في كولومبيا.