انضم إلينا في اليوم الأول من سلسلة الفعاليات الافتراضية للاستماع إلى خبراء يناقشون آخر التطورات في مجال التقاطع بين الذكاء الاصطناعي البصري والزراعة. **التاريخ والوقت** 15 أكتوبر الساعة 9 صباحًا بالتوقيت الهادئ **المكان** افتراضي. [سجّل الدخول عبر Zoom.](https://voxel51.com/events/visual-ai-in-agriculture-october-15-2025) **Paved2Paradise: محاكاة ليدار قابلة للتوسيع لإدراك العالم الحقيقي** غالبًا ما يتطلب تدريب نماذج الإدراك القوية للروبوتات والاستقلالية بيانات ثلاثية الأبعاد ضخمة ومتنوعة. ولكن جمع وترميز سحب ليدار من العالم الحقيقي على نطاق واسع أمر مكلف وجهد كبير، خاصة عند الحاجة إلى تسميات عالية الجودة. يقدم Paved2Paradise بديلاً اقتصاديًا: خط أنابيب محاكاة ليدار قابل للتوسيع يُنتج بيانات واقعية ومُعلَّمة بالكامل مع الحد الأدنى من الجهد البشري في التسمية. الفكرة الأساسية هي "تحليل العالم الحقيقي" من خلال التقاط مسح الخلفية بشكل منفصل (مثل الحقول، الطرق، مواقع البناء) ومسح الكائنات (مثل المركبات، الأشخاص، الآلات). ومن خلال دمج هذين المصدرَين بذكاء، يمكن لـ Paved2Paradise تركيب عدد كبير من مشاهد التدريب المتنوعة. يتضمن خط الأنابيب أربع خطوات: (1) جمع مسح ليدار خلفي واسع النطاق، (2) تسجيل مسح عالي الدقة لكائنات مستهدفة في ظروف محكومة، (3) إدخال الكائنات ضمن الخلفيات مع وضع وحجب متسق فيزيائيًا، و(4) محاكاة هندسة الليدار لضمان الواقعية. أظهرت التجارب أن النماذج المدربة باستخدام بيانات تم إنشاؤها بواسطة Paved2Paradise تنتقل بكفاءة إلى العالم الحقيقي، وتُحقق أداءً قويًا في الكشف مع جهد ترقيمي يدوي أقل بكثير مقارنةً بجمع مجموعة البيانات التقليدية. هذه الطريقة ليست فعالة من حيث التكلفة فحسب، بل مرنة أيضًا—تمكّن الممارسين من التوسع بسهولة إلى فئات كائنات جديدة أو مجالات جديدة عن طريق استبدال مسحات الخلفية أو الكائنات بمسحات جديدة. بالنسبة لممارسي تعلم الآلة العاملين في الروبوتات أو المركبات ذاتية القيادة أو أنظمة الإدراك الحرجة للسلامة، يبرز Paved2Paradise طريقًا عمليًا نحو توسيع بيانات التدريب دون توسيع التكاليف. وهو يسد الفجوة بين المحاكاة والأداء في العالم الحقيقي، مما يتيح التكرار الأسرع والنشر الأكثر موثوقية لنماذج الإدراك. *عن المتحدث* [مايكل أ. ألْكرون](https://www.linkedin.com/in/michaelaalcorn/) هو مهندس رئيسي في تعلم الآلة في شركة John Deere\، حيث يطور نماذج التعلم العميق للإدراك باستخدام الليدار والصور الملونة في أنظمة حرجة للسلامة وتعمل في الوقت الفعلي\. حصل على درجة الدكتوراه في علوم الحاسوب من جامعة أوبرن\، وكان موضوع أطروحته تحسين الرؤية الحاسوبية والشبكات العصبية العميقة الزمكانية\، ويحمل أيضًا تخصصًا فرعيًا في الرياضيات\. تم الاستشهاد بأبحاث مايكل من قبل باحثين في DeepMind\، Google\، Meta\، Microsoft\، وOpenAI\، من بين آخرين\، وكانت ورقة \(batter\|pitcher\)2vec الخاصة به فائزة بجائزة في مؤتمر MIT Sloan Sports Analytics Conference عام 2018\. كما ساهم برمجيًا في scikit\-learn وApache Solr\، وقد تم استخدام مستودعاته على GitHub—التي حصلت مجتمعة على أكثر من 2\,100 نجمة—كنقاط بداية لأبحاث وأكواد إنتاجية في العديد من المؤسسات المختلفة\. **MothBox: جهاز رصد آفات رخيص، مفتوح المصدر، وآلي** سيتحدث الدكتور آندي كوتميير عن تصميم أداة علمية جديدة ومثيرة مفتوحة المصدر، Mothbox. مشروع Mothbox هو مشروع فائز بجائزة لمراقبة واسعة النطاق للحشرات من أجل التنوع البيولوجي. إنه جهاز منخفض التكلفة تم تطويره في الغابات الصعبة ببنما، ويقوم بتصوير صور عالية الدقة جدًا ثم يقوم تلقائيًا بتحديد مستويات التنوع البيولوجي في الغابات والزراعة. بعد آلاف الملاحظات على الحشرات ومئات النشرات في بنما، بيرو، المكسيك، الإكوادور، والولايات المتحدة، نحن الآن نعمل على تطوير إصدار جديد يمكن تصنيعه لتوزيع هذه الأداة المهمة عالميًا. سنناقش تطوير هذا الجهاز في غابات بنما وأهميته لدراسة التنوع البيولوجي عالميًا. *عن المتحدث* يصمم الدكتور آندي كوتميير طرقًا جديدة للتفاعل مع العالم الطبيعي. عمل مع منظمات كبيرة مثل Cartoon Network وIDEO وSmithsonian، ودرّس كأستاذ على المسار الوظيفي في الجامعة الوطنية السنغافورية، وحتى تم تحويل بحثه إلى برنامج تلفزيوني (مضحك) بعنوان "Hacking the Wild"، تم توزيعه عبر Discovery Networks. حاليًا، يقضي معظم وقته في العمل التطوعي مع منظمات صغيرة، وقام مؤخرًا بتأسيس مختبر الحرف الرقمية للطبيعة (Digital Naturalism Laboratories) كموقع مخبري ميداني. في غابة الأمطار في جامبوا ببنما، يدمج Dinalab العمل الميداني البيولوجي مع الصناعة التكنولوجية ضمن مجتمع من العلماء والفنيين والمهندسين ومحسنّي الحيوانات المحليين والدوليين. وهو حاليًا يستشار كأستاذ مشارك في جامعة واشنطن. **النماذج الأساسية للذكاء الاصطناعي البصري في الزراعة** لقد مكّنت النماذج الأساسية من طريقة جديدة لمعالجة المهام، وذلك بالاستفادة من القدرات الناشئة بطريقة بدون تدريب (zero-shot). في هذا الحديث، سأناقش أحدث الأبحاث حول تمكين الذكاء الاصطناعي البصري بطريقة بدون تدريب أو عبر الضبط الدقيق. على وجه التحديد، سأناقش العمل المشترك حول RELOCATE، وهو خط أساس بسيط لا يتطلب تدريبًا مصممًا لأداء مهمة صعبة وهي تحديد موقع الاستعلام البصري في مقاطع فيديو طويلة. للتخلص من الحاجة إلى تدريب مخصص للمهمة ومعالجة مقاطع الفيديو الطويلة بكفاءة، يستفيد RELOCATE من تمثيل مبني على المناطق مشتق من نماذج الرؤية المدربة مسبقًا. سأناقش أيضًا العمل المشترك المتعلق بتمكين نماذج اللغات الكبيرة متعددة الوسائط (MLLMs) من الإجابة الصحيحة على الأوامر التي تتطلب فهمًا شاملاً مكانياً وزمنياً: فالنماذج MLLMs تجد صعوبة في الإجابة على الأوامر التي تشير إلى 1) البيئة بأكملها التي يمكن لوكيل مزوّد بنموذج MLLM العمل فيها؛ وفي نفس الوقت تشير أيضًا إلى 2) الإجراءات الأخيرة التي حدثت للتو والمشفرة في مقطع فيديو. لكن مثل هذا الفهم الشامل المكاني-الزماني مهم للوكلاء العاملين في العالم الحقيقي. يتمثل حلنا في تطوير خط أنابيب مخصص لجمع البيانات والضبط الدقيق لنموذج MLLM مجهز بمشعّات لتحسين كل من الفهم المكاني للبيئة والفهم الزمني للملاحظات الحديثة. *عن المتحدث* [ألكس شوينغ](https://www.linkedin.com/in/alexander-s-0a049258/) هو أستاذ مشارك في جامعة إلينوي في أوربانا-شمباين، يعمل مع طلاب موهوبين في مجالات الذكاء الاصطناعي، والذكاء الاصطناعي التوليدي، والرؤية الحاسوبية. حصل على بكالوريوس الهندسة الكهربائية وهندسة المعلومات من الجامعة التقنية في ميونيخ عام 2006 و2008 على التوالي، وحصل على درجة الدكتوراه في علوم الحاسوب من ETH زيورخ عام 2014. وبعد ذلك انضم إلى جامعة تورونتو كزميل ما بعد الدكتوراه حتى عام 2016. تتركز اهتماماته البحثية في مجالات الذكاء الاصطناعي، والذكاء الاصطناعي التوليدي، والرؤية الحاسوبية، حيث شارك في تأليف العديد من الأوراق البحثية حول فهم المشهد، وخوارزميات الاستدلال والتعلم، والتعلم العميق، ومعالجة الصور واللغة، والنماذج التوليدية. وقد حصلت أطروحته للدكتوراه على ميدالية ETH، وفاز بحث فريقه بجائزة NSF CAREER. **خارج المختبر: كشف الشذوذ في العالم الحقيقي للرؤية الحاسوبية الزراعية** يُحدث كشف الشذوذ ثورة في التصنيع والمراقبة، ولكن ماذا عن الزراعة؟ هل يمكن للذكاء الاصطناعي اكتشاف أمراض النباتات وأضرار الآفات في وقت مبكر بما يكفي لتحقيق فرق؟ يوضح هذا الحديث كيف يحدد كشف الشذوذ مشكلات المحاصيل ويحللها باستخدام صحة أوراق البن كمثال رئيسي. سنبدأ بالنظرية الأساسية، ثم نفحص كيفية اكتشاف هذه النماذج لأضرار الصدأ والحفر في صور الأوراق. تشمل الجلسة سير عمل شاملًا عمليًا باستخدام أدوات FiftyOne المفتوحة المصدر للرؤية الحاسوبية، ويتناول تنسيق مجموعة البيانات، واستخراج القطع، وتدريب النموذج، وتصور النتائج. ستحصل على فهم نظري لكشف الشذوذ في الرؤية الحاسوبية، بالإضافة إلى خبرة عملية في تطبيق هذه التقنيات على التحديات الزراعية وغيرها من المجالات. *عن المتحدث* [باولا راموس](https://www.linkedin.com/in/paula-ramos-phd/) تحمل درجة الدكتوراه في الرؤية الحاسوبية وتعلم الآلة، ولديها أكثر من 20 سنة من الخبرة في المجال التكنولوجي. وهي تعمل على تطوير تقنيات هندسية متكاملة جديدة، بشكل أساسي في مجالات الرؤية الحاسوبية، والروبوتات، وتعلم الآلة المطبقة على الزراعة، منذ أوائل العقد الأول من القرن الحادي والعشرين في كولومبيا.