انضم إلينا في اليوم الأول من سلسلة الفعاليات الافتراضية للاستماع إلى خبراء يناقشون أحدث التطورات في مجال التقاء الذكاء الاصطناعي البصري مع الزراعة. **التاريخ والوقت** 15 أكتوبر الساعة 9 صباحًا بالتوقيت الهادئ **المكان** فعالية افتراضية. [سجّل حضورك عبر زوم.](https://voxel51.com/events/visual-ai-in-agriculture-october-15-2025) **Paved2Paradise: محاكاة ليدار قابلة للتوسيع لإدراك العالم الحقيقي** غالبًا ما يتطلب تدريب نماذج الإدراك القوية للروبوتات والأنظمة المستقلة مجموعات بيانات ضخمة ومتنوعة ثلاثية الأبعاد. لكن جمع وترميز سحب ليدار من العالم الحقيقي بحجم كبير أمر مكلفٌ ومُرهقٌ من حيث الوقت، خاصة عند الحاجة إلى تسميات عالية الجودة. يقدم مشروع Paved2Paradise بديلاً اقتصاديًا: وهو خط أنابيب محاكاة ليدار قابل للتوسيع لإنتاج مجموعات بيانات واقعية ومُوسومة بالكامل بجهد تسمية بشري ضئيل. الفكرة الأساسية هي "تحليل العالم الحقيقي" من خلال التقاط مسح خلفيات (مثل الحقول، الطرق، مواقع البناء) ومسح كائنات (مثل المركبات، الأشخاص، الآلات) بشكل منفصل. وبدمج هذين المصدرَين بذكاء، يمكن لـ Paved2Paradise تركيب عدد هائل من مشاهد التدريب المتنوعة. يتضمن خط الأنابيب أربع خطوات: (1) جمع مسح ليدار واسع للخلفيات، (2) تسجيل مسح عالي الدقة للكائنات المستهدفة في ظروف خاضعة للرقابة، (3) إدخال الكائنات في الخلفيات مع وضع وحجب يتماشى مع القوانين الفيزيائية، (4) محاكاة هندسة الليدار لضمان الواقعية. أظهرت التجارب أن النماذج المدربة على بيانات تم إنشاؤها بواسطة Paved2Paradise تنتقل بكفاءة إلى العالم الحقيقي، وتحقق أداءً قويًا في الكشف مع تقليل كبير في التسمية اليدوية مقارنةً بجمع مجموعات البيانات التقليدية. هذه الطريقة ليست فعالة من حيث التكلفة فحسب، بل أيضًا مرنة – تتيح للممارسين توسيع النموذج بسهولة إلى فئات أو مجالات كائنات جديدة من خلال استبدال مسح الخلفية أو الكائنات بآخر جديد. بالنسبة لممارسي تعلم الآلة العاملين في مجالات الروبوتات، المركبات المستقلة، أو نظم الإدراك الحرجة للسلامة، يبرز Paved2Paradise مسارًا عمليًا لتوسيع بيانات التدريب دون زيادة التكاليف. وهو يسد الفجوة بين الأداء في المحاكاة والأداء في العالم الحقيقي، ما يتيح التكرار الأسرع والنشر الأكثر موثوقية لنماذج الإدراك. *عن المتحدث* [مايكل أ. ألكورن](https://www.linkedin.com/in/michaelaalcorn/) هو مهندس كبير في تعلم الآلة في شركة John Deere، حيث يطور نماذج التعلم العميق للإدراك باستخدام بيانات الليدار والصورة (RGB) في نظم حرجة للسلامة وتعمل في الزمن الحقيقي. حصل على درجة الدكتوراه في علوم الحاسوب من جامعة أوبرن، مع أطروحة حول تحسين الرؤية الحاسوبية والشبكات العصبية العميقة المكانية-الزمنية، كما يمتلك تخصصًا فرعيًا للخريجين في الرياضيات. تم الاستشهاد بأبحاث مايكل من قبل باحثين في DeepMind وGoogle وMeta وMicrosoft وOpenAI وغيرهم، وكانت ورقة أبحاثه \(batter\|pitcher\)2vec فائزة بجائزة في مؤتمر MIT Sloan Sports Analytics لعام 2018. كما ساهم برمجيًا في scikit\-learn وApache Solr، وتم استخدام مستودعات GitHub الخاصة به – التي حصلت مجتمعة على أكثر من 2\,100 نجمة – كنقطة بداية لأبحاث وشيفرات إنتاجية في العديد من المؤسسات المختلفة. **MothBox: جهاز رصد حشرات منخفض التكلفة ومفتوح المصدر** سيتحدث الدكتور آندي كويتميير عن تصميم أداة علمية مثيرة جديدة ومفتوحة المصدر تُسمى Mothbox. يُعد مشروع Mothbox مشروعًا فائزًا بجائزة لمراقبة واسعة النطاق للحشرات بهدف قياس التنوع البيولوجي. وهو جهاز منخفض التكلفة تم تطويره في الغابات الاستوائية القاسية ببنما، ويقوم بالتقاط صور عالية الدقة جدًا لتحديد مستويات التنوع البيولوجي تلقائيًا في الغابات والزراعة. بعد آلاف الملاحظات الحشرية ومئات النشرات في بنما، بيرو، المكسيك، الإكوادور، والولايات المتحدة، نحن الآن نعمل على تطوير نسخة جديدة يمكن تصنيعها لتعميم استخدام هذه الأداة المهمة عالميًا. سنناقش تطوير هذا الجهاز في غابات بنما، وأهميته لدراسة التنوع البيولوجي عالميًا. *عن المتحدث* يصمم الدكتور آندي كويتميير طرقًا جديدة للتفاعل مع العالم الطبيعي. عمل مع منظمات كبيرة مثل شبكة كرتون نتورك وIDEO ومؤسسة سميثسونيان، ودرّس كبروفيسور بدرجة وظيفية في الجامعة الوطنية السنغافورية، وتحولت بعض أبحاثه إلى سلسلة تلفزيونية (مضحكة) بعنوان "اختراق البرية"، تم توزيعها عبر شبكة ديسكفري. حاليًا، يقضي معظم وقته في العمل التطوعي مع منظمات صغيرة، ومؤخرًا أسس مختبر صناعة المحطة الميدانية، المعروف باسم Digital Naturalism Laboratories. في غابة الأمازون بمدينة جامبوا في بنما، يدمج Dinalab العمل الميداني البيولوجي مع الحرف التكنولوجية ضمن مجتمع من العلماء والفنانين والمهندسين ومتعهدي إعادة تأهيل الحيوانات المحليين والدوليين. وحاليًا، يشرف أيضًا على طلاب كبروفيسور مشارك في جامعة واشنطن. **النماذج الأساسية للذكاء الاصطناعي البصري في الزراعة** لقد مكّنت النماذج الأساسية من أسلوب جديد لمعالجة المهام، مستفيدةً من القدرات الناشئة بطريقة بدون تدريب (zero-shot). في هذا الحديث، سأناقش أحدث الأبحاث المتعلقة بتمكين الذكاء الاصطناعي البصري بطريقة بدون تدريب أو عبر التعديل الدقيق (fine-tuning). على وجه التحديد، سأناقش بحثًا مشتركًا حول RELOCATE، وهو معيار بسيط لا يتطلب تدريبًا مصممًا لأداء المهمة الصعبة المتمثلة في تحديد موقع الاستعلامات البصرية في مقاطع فيديو طويلة. للتخلص من الحاجة إلى تدريب مخصص للمهمة والتعامل بكفاءة مع مقاطع الفيديو الطويلة، يستفيد RELOCATE من تمثيل قائم على المناطق مستمد من نماذج رؤية مسبقة التدريب. كما سأناقش عملًا مشتركًا حول تمكين النماذج الكبيرة متعددة الوسائط (MLLMs) من الإجابة الصحيحة على الاستعلامات التي تتطلب فهمًا شاملاً للمكان والزمان: فغالبًا ما تواجه النماذج الكبيرة متعددة الوسائط صعوبة في الإجابة على استعلامات تشير إلى 1) البيئة بأكملها التي يمكن لوكيل مزود بـ MLLM العمل فيها؛ وفي الوقت نفسه تشير أيضًا إلى 2) الإجراءات الحديثة التي حدثت للتو ومُرمَّزة في مقطع فيديو. لكن مثل هذا الفهم الشامل للمكان والزمان مهم للوكلاء العاملين في العالم الحقيقي. يشمل حلنا تطوير خط أنابيب مخصص لجمع البيانات وتعديل نموذج MLLM مزود بمشعاعات (projectors) لتحسين الفهم المكاني للبيئة والفهم الزمني للملاحظات الحديثة. *عن المتحدث* [ألكس شوينغ](https://www.linkedin.com/in/alexander-s-0a049258/) هو أستاذ مشارك في جامعة إلينوي في أوربانا-شامبين، يعمل مع طلاب موهوبين في مجالات الذكاء الاصطناعي، والذكاء الاصطناعي التوليدي، والرؤية الحاسوبية. حصل على درجة البكالوريوس والدبلوم في الهندسة الكهربائية وتكنولوجيا المعلومات من الجامعة التقنية في ميونخ عامي 2006 و2008 على التوالي، وحصل على درجة الدكتوراه في علوم الحاسوب من معهد إيث زيورخ عام 2014. ثم انضم إلى جامعة تورونتو كزميل ما بعد الدكتوراه حتى عام 2016. تتمحور اهتماماته البحثية حول الذكاء الاصطناعي، والذكاء الاصطناعي التوليدي، والرؤية الحاسوبية، حيث شارك في تأليف العديد من الأوراق البحثية في مجالات فهم السيناريوهات، وخوارزميات الاستدلال والتعلم، والتعلم العميق، ومعالجة الصور واللغة، والنماذج التوليدية. حصلت أطروحته للدكتوراه على ميدالية ETH، وحاز بحث فريقه على جائزة NSF CAREER. **ما وراء المختبر: كشف الشذوذ في العالم الحقيقي للرؤية الحاسوبية الزراعية** يُحدث كشف الشذوذ تحولًا في التصنيع والمراقبة، لكن ماذا عن الزراعة؟ هل يمكن للذكاء الاصطناعي اكتشاف أمراض النباتات وأضرار الآفات مبكرًا بما يكفي لصنع فرق؟ يوضح هذا الحديث كيف يحدد كشف الشذوذ ويحلل مشكلات المحاصيل باستخدام صحة أوراق القهوة كمثال رئيسي. سنبدأ بالنظرية الأساسية، ثم ندرس كيف تكتشف هذه النماذج صدأ الأوراق وأضرار المنقّابة في صور الأوراق. تشمل الجلسة سير عمل عمليًا شاملاً باستخدام مجموعة أدوات الرؤية الحاسوبية مفتوحة المصدر FiftyOne، وتغطي تنقية مجموعة البيانات، واستخراج القطع (patch extraction)، وتدريب النموذج، وتصور النتائج. ستحصل على فهم نظري لكشف الشذوذ في الرؤية الحاسوبية، بالإضافة إلى خبرة عملية في تطبيق هذه التقنيات على التحديات الزراعية وDomains أخرى. *عن المتحدث* [باولا راموس](https://www.linkedin.com/in/paula-ramos-phd/) تحمل درجة الدكتوراه في الرؤية الحاسوبية وتعلم الآلة، ولديها أكثر من 20 عامًا من الخبرة في المجال التكنولوجي. وقد عملت على تطوير تقنيات هندسية متكاملة مبتكرة، خاصة في مجالات الرؤية الحاسوبية، والروبوتات، وتعلم الآلة المطبقة على الزراعة، منذ أوائل العقد الأول من القرن الحادي والعشرين في كولومبيا.