انضم إلينا في اليوم الأول من سلسلة الفعاليات الافتراضية للاستماع إلى متحدثين خبراء حول آخر التطورات في مجال التقاطع بين الذكاء الاصطناعي البصري والزراعة. **التاريخ والوقت** 15 أكتوبر الساعة 9 صباحًا بالتوقيت الهادئ **المكان** فعالية افتراضية. [سجّل الدخول عبر Zoom.](https://voxel51.com/events/visual-ai-in-agriculture-october-15-2025) **Paved2Paradise: محاكاة ليدار قابلة للتوسيع لإدراك العالم الحقيقي** غالبًا ما يتطلب تدريب نماذج الإدراك القوية للروبوتات والاستقلالية مجموعات بيانات ثلاثية الأبعاد ضخمة ومتنوعة. ولكن جمع وتصنيف سحب نقاط ليدار من العالم الحقيقي على نطاق واسع أمر مكلف وجهد كبير، خاصة عندما تكون العلامات عالية الجودة ضرورية. يقدم مشروع Paved2Paradise بديلاً اقتصاديًا: وهو خط أنابيب محاكاة ليدار قابل للتوسيع لإنشاء مجموعات بيانات واقعية ومُصنفة بالكامل مع الحد الأدنى من الجهد اليدوي للتصنيف. الفكرة الأساسية هي "تحليل الواقع" من خلال التقاط مسح الخلفيات (مثل الحقول، الطرق، مواقع البناء) ومسح الكائنات (مثل المركبات، الأشخاص، الآلات) بشكل منفصل. ومن خلال دمج هذين المصدرَين بذكاء، يمكن لـ Paved2Paradise تركيب عدد هائل من مشاهد التدريب المتنوعة. يشمل خط الأنابيب أربع خطوات: (1) جمع مسح ليدار واسع النطاق للخلفيات، (2) تسجيل مسح عالي الدقة لكائنات الهدف في ظروف مضبوطة، (3) إدخال الكائنات داخل الخلفيات مع وضع واقعي وفيزيائي وتحديد حالات الحجب، (4) محاكاة هندسة الليدار لضمان الواقعية. أظهرت التجارب أن النماذج المدربة على بيانات تم إنشاؤها باستخدام Paved2Paradise تنتقل بكفاءة إلى العالم الحقيقي، وتُحقق أداءً قويًا في الكشف مع الحاجة إلى تصنيف يدوي أقل بكثير مقارنةً بجمع مجموعة البيانات التقليدية. هذه الطريقة ليست فعالة من حيث التكلفة فحسب، بل أيضًا مرنة – مما يسمح للممارسين بسهولة التوسع إلى فئات أو مجالات كائنات جديدة عن طريق استبدال مسح الخلفيات أو الكائنات. بالنسبة لممارسي تعلم الآلة العاملين في مجال الروبوتات، أو المركبات المستقلة، أو أنظمة الإدراك الحرجة للسلامة، يبرز Paved2Paradise مسارًا عمليًا نحو توسيع بيانات التدريب دون زيادة التكاليف. وهو يسد الفجوة بين المحاكاة والأداء في العالم الحقيقي، ويتيح التكرار الأسرع والنشر الأكثر موثوقية لنماذج الإدراك. *عن المتحدث* [مايكل أ. ألْكورن](https://www.linkedin.com/in/michaelaalcorn/) هو مهندس رئيسي في تعلم الآلة في شركة John Deere\، حيث يطور نماذج التعلّم العميق لأنظمة الاستشعار بالليدار والصور RGB في أنظمة تتطلب السلامة\، وتعمل في الزمن الحقيقي\. حصل على درجة الدكتوراه في علوم الحاسوب من جامعة أوبرن\، وكان موضوع أطروحته تحسين الرؤية الحاسوبية والشبكات العصبية العميقة المكانية-الزمنية\، كما حصل على شهادة تخصص في الرياضيات\. تم الاستشهاد بأبحاث مايكل من قبل باحثين في DeepMind\، Google\، Meta\، Microsoft\، وOpenAI\، من بين آخرين\، وكانت ورقة \(batter\|pitcher\)2vec الخاصة به فائزة بجائزة في مؤتمر MIT Sloan Sports Analytics Conference عام 2018\. كما ساهم برمجيًا في scikit\-learn وApache Solr\، وقد تلقى مستودعات GitHub الخاصة به أكثر من 2\,100 نجمة\، وشكلت نقطة انطلاق لأبحاث وبرمجيات إنتاجية في العديد من المنظمات المختلفة\. **MothBox: جهاز مراقبة حشرات رخيص، مفتوح المصدر، وآلي** سيتحدث الدكتور آندي كويتميير عن تصميم أداة علمية مفتوحة المصدر جديدة ومثيرة، Mothbox. إن Mothbox هو مشروع فائز بجائزة لمراقبة واسعة النطاق للحشرات من أجل التنوع البيولوجي. إنه جهاز منخفض التكلفة تم تطويره في غابات بنما القاسية، يقوم بالتقاط صور فائقة الدقة ثم تحديد تلقائي لمستويات التنوع البيولوجي في الغابات والزراعة. بعد آلاف الملاحظات الحشرية ومئات النشرات في بنما، بيرو، المكسيك، الإكوادور، والولايات المتحدة، نحن الآن نعمل على تطوير إصدار جديد قابل للتصنيع لتعميم هذه الأداة المهمة عالميًا. سنناقش تطوير هذا الجهاز في غابات بنما وأهميته لدراسة التنوع البيولوجي عالميًا. *عن المتحدث* يصمم الدكتور آندي كويتميير طرقًا جديدة للتفاعل مع العالم الطبيعي. عمل مع منظمات كبيرة مثل شبكة كرتون نتورك، IDEO، ومعهد سميثسونيان، ودرّس كأستاذ متفرغ في جامعة سنغافورة الوطنية، وحتى تم تحويل بحثه إلى سلسلة تلفزيونية (سخيفة) بعنوان "Hacking the Wild"، تم توزيعها بواسطة Discovery Networks. حالياً، يقضي معظم وقته في التطوع مع منظمات صغيرة، وقام مؤخرًا بتأسيس مختبر الحرف الرقمية للدراسات الميدانية (Digital Naturalism Laboratories). في غابة جامبوا المطيرة في بنما، يدمج Dinalab العمل الميداني البيولوجي مع الصناعة التكنولوجية ضمن مجتمع من العلماء والفنانين والمهندسين ومُعالجي الحيوانات المحليين والدوليين. وهو حاليًا مستشار طلابي كأستاذ مشارك في جامعة واشنطن. **النماذج الأساسية للذكاء الاصطناعي البصري في الزراعة** لقد مكّنت النماذج الأساسية من أسلوب جديد لمعالجة المهام، وذلك بالاستفادة من القدرات الناشئة بطريقة بدون تدريب (zero-shot). في هذا الحديث، سأناقش أحدث الأبحاث المتعلقة بتمكين الذكاء الاصطناعي البصري بطريقة بدون تدريب (zero-shot) أو عبر التعديل الدقيق (fine-tuning). على وجه التحديد، سأناقش العمل المشترك حول RELOCATE، وهو معيار بسيط لا يتطلب تدريبًا مصممًا لأداء مهمة صعبة تتمثل في تحديد موقع الاستعلام البصري في مقاطع فيديو طويلة. للتخلص من الحاجة إلى تدريب مخصص للمهمة وللتعامل بكفاءة مع مقاطع الفيديو الطويلة، يستفيد RELOCATE من تمثيل قائم على المناطق مستمد من نماذج رؤية تم تدريبها مسبقًا. سأناقش أيضًا العمل المشترك حول تمكين نماذج اللغة الكبيرة متعددة الوسائط (MLLMs) من الإجابة الصحيحة على الطلبات التي تتطلب فهمًا شاملاً مكانياً-زمنياً: إذ تواجه النماذج MLLMs صعوبة في الإجابة على الطلبات التي تشير إلى 1) البيئة بأكملها التي يمكن لوكيل مزوّد بنموذج MLLM العمل فيها؛ وكذلك تشير في الوقت نفسه إلى 2) الإجراءات الأخيرة التي حدثت للتو والمُشفرة في مقطع فيديو. ومع ذلك، فإن هذا الفهم الشامل المكاني-الزماني مهم للوكلاء العاملين في العالم الحقيقي. ويشمل حلنا تطوير خط أنابيب مخصص لجمع البيانات والتعديل الدقيق لنموذج MLLM مجهز بمشعّات لتحسين كل من الفهم المكاني للبيئة والفهم الزمني للملاحظات الأخيرة. *عن المتحدث* [ألكس شوينغ](https://www.linkedin.com/in/alexander-s-0a049258/) هو أستاذ مشارك في جامعة إلينوي في أوربانا-شمباين، يعمل مع طلاب موهوبين في مجالات الذكاء الاصطناعي، والذكاء الاصطناعي التوليدي، والرؤية الحاسوبية. حصل على بكالوريوس ودبلومه في الهندسة الكهربائية وتكنولوجيا المعلومات من الجامعة التقنية في ميونيخ عامي 2006 و2008 على التوالي، وحصل على درجة الدكتوراه في علوم الحاسوب من ETH زيورخ عام 2014. وبعد ذلك انضم إلى جامعة تورونتو كزميل ما بعد الدكتوراه حتى عام 2016. تتركز اهتماماته البحثية في مجالات الذكاء الاصطناعي، والذكاء الاصطناعي التوليدي، والرؤية الحاسوبية، حيث شارك في تأليف العديد من الأوراق البحثية في مواضيع تتعلق بفهم السيناريوهات، وخوارزميات الاستنتاج والتعلم، والتعلم العميق، ومعالجة الصور واللغة، والنماذج التوليدية. وقد تم تكريم أطروحته للدكتوراه بوسام ETH، وحاز بحث فريقه على جائزة NSF CAREER. **خارج المختبر: كشف الشذوذ في العالم الحقيقي للرؤية الحاسوبية الزراعية** يُحدث كشف الشذوذ ثورة في التصنيع والمراقبة، لكن ماذا عن الزراعة؟ هل يمكن للذكاء الاصطناعي أن يكتشف أمراض النباتات وأضرار الآفات مبكرًا بما يكفي لتحقيق فرق حقيقي؟ يوضح هذا الحديث كيف يحدد كشف الشذوذ ويحلل مشكلات المحاصيل باستخدام صحة أوراق البن كمثال أساسي. سنبدأ بالنظرية الأساسية، ثم نفحص كيف تكشف هذه النماذج عن الصدأ وأضرار اليرقات في صور الأوراق. تشمل الجلسة تدفق عمل شامل عمليًا باستخدام مجموعة أدوات الرؤية الحاسوبية مفتوحة المصدر FiftyOne، ويغطي تنقيح مجموعة البيانات، واستخراج القطع، وتدريب النموذج، وعرض النتائج. ستحصل على فهم نظري لكشف الشذوذ في الرؤية الحاسوبية، بالإضافة إلى خبرة عملية في تطبيق هذه التقنيات على التحديات الزراعية وقطاعات أخرى. *عن المتحدث* [بولينا راموس](https://www.linkedin.com/in/paula-ramos-phd/) تحمل درجة الدكتوراه في الرؤية الحاسوبية وتعلم الآلة، ولديها أكثر من 20 عامًا من الخبرة في المجال التكنولوجي. وهي تعمل على تطوير تقنيات هندسية متكاملة جديدة، خصوصًا في مجالات الرؤية الحاسوبية، والروبوتات، وتعلم الآلة المطبقة على الزراعة، منذ أوائل العقد الأول من القرن الحادي والعشرين في كولومبيا.