انضم إلينا في اليوم الأول من سلسلة الفعاليات الافتراضية للاستماع إلى خبراء يناقشون أحدث التطورات في مجال تقاطع الذكاء الاصطناعي البصري مع الزراعة. **التاريخ والوقت** 15 أكتوبر الساعة 9 صباحًا بالتوقيت الهادئ **المكان** افتراضي. [سجّل الدخول عبر زووم.](https://voxel51.com/events/visual-ai-in-agriculture-october-15-2025) **Paved2Paradise: محاكاة ليدار قابلة للتوسيع لإدراك العالم الحقيقي** غالبًا ما يتطلب تدريب نماذج الإدراك القوية للروبوتات والاستقلالية بيانات ضخمة ومتعددة الأبعاد ثلاثية الأبعاد. ولكن جمع وتصنيف سحب نقاط ليدار من العالم الحقيقي بكميات كبيرة أمر مكلف وجهد يستغرق وقتًا طويلاً، خاصة عند الحاجة إلى تسميات عالية الجودة. يقدم مشروع Paved2Paradise بديلاً اقتصاديًا: خط أنابيب محاكاة ليدار قابل للتوسيع يُنتج بيانات واقعية ومصنفة بالكامل بتقليل كبير في الجهد اليدوي للتصنيف. الفكرة الأساسية هي "تحليل الواقع" من خلال التقاط مسح الخلفية (مثل الحقول، الطرق، مواقع البناء) ومسح الكائنات (مثل المركبات، الأشخاص، الآلات) بشكل منفصل. ومن خلال دمج هذين المصدرَين بذكاء، يمكن لـ Paved2Paradise توليد عدد هائل من مشاهد التدريب المختلفة. يتضمن خط الأنابيب أربع خطوات: (1) جمع مسح ليدار واسع النطاق للخلفية، (2) تسجيل مسح عالي الدقة لكائنات الهدف في ظروف مضبوطة، (3) إدخال الكائنات في الخلفية مع وضع واقعي وفيزيائي وتحقيق الانحشار الطبيعي، (4) محاكاة هندسة الليدار لضمان الواقعية. أظهرت التجارب أن النماذج المدربة على البيانات التي تم إنشاؤها باستخدام Paved2Paradise تنتقل بكفاءة إلى العالم الحقيقي، وتحقق أداءً قويًا في الكشف مع حاجة أقل بكثير للتصنيف اليدوي مقارنةً بجمع البيانات التقليدي. هذه الطريقة ليست فعالة من حيث التكلفة فحسب، بل مرنة أيضًا — مما يسمح للممارسين بسهولة التوسع إلى فئات أو نطاقات كائنات جديدة عن طريق استبدال مسحات الخلفية أو الكائنات. بالنسبة لممارسي تعلم الآلة العاملين في مجالات الروبوتات، المركبات المستقلة، أو أنظمة الإدراك الحرجة للسلامة، يبرز Paved2Paradise مسارًا عمليًا نحو توسيع بيانات التدريب دون زيادة التكاليف. وهو يسد الفجوة بين المحاكاة والأداء في العالم الحقيقي، مما يتيح تكرارًا أسرع ونشرًا أكثر موثوقية لنماذج الإدراك. *عن المتحدث* [مايكل أ. ألْكورن](https://www.linkedin.com/in/michaelaalcorn/) هو مهندس متقدم في تعلم الآلة في شركة John Deere\، حيث يطور نماذج التعلم العميق للإدراك باستخدام بيانات الليدار والصور الملونة في أنظمة حرجة للسلامة وتتطلب زمنًا حقيقيًا\. حصل على درجة الدكتوراه في علوم الحاسوب من جامعة أوبرن\، مع أطروحة حول تحسين رؤية الحاسوب والشبكات العصبية العميقة المكانية-الزمنية\، ويحمل أيضًا تخصصًا فرعيًا في الرياضيات\. تم الاستشهاد بأبحاث مايكل من قبل باحثين في DeepMind\، Google\، Meta\، Microsoft\، وOpenAI\، من بين آخرين\، كما فاز ورقة البحث الخاصة به \(batter\|pitcher\)2vec بجائزة في مؤتمر MIT Sloan Sports Analytics Conference عام 2018\. كما ساهم برمجيًا في scikit\-learn وApache Solr\، وقد تلقى مستودعاته على GitHub أكثر من 2\,100 نجمة\، وكانت نقطة انطلاق لأبحاث وأكواد إنتاجية في العديد من المؤسسات\. **MothBox: جهاز رصد حشرات رخيص ومتاح مفتوح المصدر** سيتحدث الدكتور آندي كوتميير عن تصميم أداة علمية مثيرة جديدة مفتوحة المصدر، Mothbox. يُعد مشروع Mothbox مشروعًا فائزًا بجائزة لمراقبة واسعة النطاق للحشرات من أجل التنوع البيولوجي. إنه جهاز منخفض التكلفة تم تطويره في غابات بنما القاسية، يقوم بالتقاط صور عالية الدقة جدًا ثم يتم تحديد تلقائي لمستويات التنوع البيولوجي في الغابات والزراعة. بعد آلاف الملاحظات الحشرية ومئات النشرات في بنما، بيرو، المكسيك، الإكوادور، والولايات المتحدة، نحن الآن بصدد تطوير إصدار جديد قابل للإنتاج لتعميم هذه الأداة المهمة عالميًا. سنناقش تطوير هذا الجهاز في غابات بنما وأهميته لدراسة التنوع البيولوجي عالميًا. *عن المتحدث* يصمم الدكتور آندي كوتميير طرقًا جديدة للتفاعل مع العالم الطبيعي. عمل مع منظمات كبيرة مثل شبكة كرتون نتورك، IDEO، ومعهد سميثسونيان، ودرّس كأستاذ أكاديمي في جامعة سنغافورة الوطنية، وحتى تم تحويل بحثه إلى سلسلة تلفزيونية (طرائفية) بعنوان "Hacking the Wild"، تم توزيعها بواسطة Discovery Networks. في الوقت الحالي، يقضي معظم وقته في العمل التطوعي مع منظمات صغيرة، وقام مؤخرًا بتأسيس مختبر تصنيع في موقع ميداني باسم Digital Naturalism Laboratories. في غابة الأمطار في جامبوا ببنما، يدمج Dinalab العمل الميداني البيولوجي مع الصناعة التكنولوجية ضمن مجتمع من العلماء والفنانين والمهندسين ومتعافي الحيوانات المحليين والدوليين. ويشغل حاليًا منصب أستاذ مشارك يقدم الاستشارات للطلاب في جامعة واشنطن. **النماذج الأساسية للذكاء الاصطناعي البصري في الزراعة** لقد مكّنت النماذج الأساسية من طريقة جديدة لمعالجة المهام، وذلك بالاستفادة من القدرات الناشئة بطريقة بدون تدريب (zero-shot). في هذا الحديث، سأناقش أحدث الأبحاث المتعلقة بتمكين الذكاء الاصطناعي البصري بطريقة بدون تدريب أو عبر التخصيص الدقيق (fine-tuning). وعلى وجه التحديد، سأتناول بحثًا مشتركًا حول RELOCATE، وهو معيار بسيط لا يتطلب تدريبًا مصممًا لأداء مهمة صعبة وهي تحديد موقع الاستعلام البصري في مقاطع فيديو طويلة. لإزالة الحاجة إلى تدريب مخصص لكل مهمة والتعامل بكفاءة مع مقاطع الفيديو الطويلة، يستفيد RELOCATE من تمثيل قائم على المناطق مستمد من نماذج بصرية مسبقة التدريب. كما سأناقش بحثًا مشتركًا حول تمكين نماذج اللغة الكبيرة متعددة الوسائط (MLLMs) من الإجابة الصحيحة على الأوامر التي تتطلب فهمًا شاملاً مكانياً-زمنياً: فالنماذج متعددة الوسائط تجد صعوبة في الإجابة على أوامر تشير إلى 1) البيئة الكاملة التي يمكن لوكيل مزود بنموذج MLLM العمل فيها؛ وكذلك تشير في نفس الوقت إلى 2) الإجراءات الأخيرة التي حدثت للتو والتي تم ترميزها في مقطع فيديو. لكن مثل هذا الفهم الشامل مكانياً وزمنياً مهم للوكلاء الذين يعملون في العالم الحقيقي. ويتضمن حلنا تطوير خط أنابيب مخصص لجمع البيانات وتدريب نموذج MLLM مزود بمشعاعات (projectors) لتحسين كل من الفهم المكاني للبيئة والفَهم الزمني للمشاهدات الحديثة. *عن المتحدث* [أليكس شوينغ](https://www.linkedin.com/in/alexander-s-0a049258/) هو أستاذ مشارك في جامعة إلينوي في أوربانا-แชมبين، يعمل مع طلاب موهوبين في مجالات الذكاء الاصطناعي، والذكاء الاصطناعي التوليدي، ورؤية الحاسوب. حصل على درجة البكالوريوس والدبلوم في الهندسة الكهربائية وتكنولوجيا المعلومات من الجامعة التقنية في ميونيخ عامي 2006 و2008 على التوالي، وحصل على درجة الدكتوراه في علوم الحاسوب من ETH زيورخ عام 2014. بعد ذلك، انضم إلى جامعة تورونتو كزميل باحث حتى عام 2016. تتركز اهتماماته البحثية في مجالات الذكاء الاصطناعي، والذكاء الاصطناعي التوليدي، ورؤية الحاسوب، حيث شارك في تأليف العديد من الأوراق البحثية في مواضيع فهم المشهد، وخوارزميات الاستدلال والتعلم، والتعلم العميق، ومعالجة الصور واللغة، والنماذج التوليدية. ونالت أطروحته للدكتوراه ميدالية ETH، كما حصل فريقه البحثي على جائزة NSF CAREER. **خارج المختبر: كشف الشذوذ في العالم الحقيقي للرؤية الحاسوبية الزراعية** يُحدث كشف الشذوذ ثورة في التصنيع والمراقبة، لكن ماذا عن الزراعة؟ هل يمكن للذكاء الاصطناعي اكتشاف أمراض النباتات وأضرار الآفات مبكرًا بما يكفي لتحقيق فرق؟ يوضح هذا الحديث كيف يحدد كشف الشذوذ مشكلات المحاصيل ويحللها باستخدام صحة أوراق البن كمثال أساسي. سنبدأ بالنظرية الأساسية، ثم نفحص كيفية اكتشاف هذه النماذج لأضرار الصدأ والحفر في صور الأوراق. تشمل الجلسة سير عمل شاملًا عمليًا باستخدام مجموعة أدوات الرؤية الحاسوبية المفتوحة المصدر FiftyOne، تغطي تنقيح البيانات، واستخراج القطع، وتدريب النماذج، وعرض النتائج. ستكتسب فهماً نظرياً وعملياً لكشف الشذوذ في الرؤية الحاسوبية، بالإضافة إلى الخبرة التطبيقية لهذه التقنيات في التحديات الزراعية وقطاعات أخرى. *عن المتحدث* [باولا راموس](https://www.linkedin.com/in/paula-ramos-phd/) تحمل درجة الدكتوراه في الرؤية الحاسوبية وتعلم الآلة، ولديها أكثر من 20 عامًا من الخبرة في المجال التكنولوجي. تعمل منذ أوائل العقد الأول من القرن الحادي والعشرين في كولومبيا على تطوير تقنيات هندسية متكاملة مبتكرة، تركز بشكل رئيسي على الرؤية الحاسوبية، والروبوتات، وتعلم الآلة المطبقة في الزراعة.