انضم إلينا في اليوم الأول من سلسلة الفعاليات الافتراضية للاستماع إلى خبراء يناقشون أحدث التطورات في مجال التقاء الذكاء الاصطناعي البصري بالزراعة. **التاريخ والوقت** 15 أكتوبر الساعة 9 صباحًا بالتوقيت الهادئ **الموقع** افتراضي. [سجّل الدخول عبر زوم.](https://voxel51.com/events/visual-ai-in-agriculture-october-15-2025) **Paved2Paradise: محاكاة ليدار قابلة للتوسيع من أجل الإدراك في العالم الواقعي** غالبًا ما يتطلب تدريب نماذج الإدراك القوية للروبوتات والأنظمة المستقلة مجموعات بيانات ضخمة ومتنوعة ثلاثية الأبعاد. ولكن جمع وتصنيف سحب بيانات ليدار من العالم الحقيقي بحجم كبير أمر مكلف ويتطلب وقتًا طويلاً، خاصة عند الحاجة إلى تسميات عالية الجودة. يقدم Paved2Paradise بديلاً اقتصاديًا: وهو خط أنابيب محاكاة ليدار قابل للتوسيع لإنشاء مجموعات بيانات واقعية ومكتملة التسمية بجهد تصنيف بشري ضئيل. الفكرة الأساسية هي "تحليل العالم الحقيقي" من خلال التقاط مسحات خلفية (مثل الحقول والطرق ومواقع البناء) ومسحات كائنات منفصلة (مثل المركبات والأشخاص والآلات). ومن خلال دمج هذين المصدرَين بذكاء، يمكن لـ Paved2Paradise توليد عدد كبير تآزريًا من مشاهد التدريب المتنوعة. يتضمن خط الأنابيب أربع خطوات: (1) جمع مسحات ليدار خلفية واسعة النطاق، (2) تسجيل مسحات عالية الدقة للكائنات المستهدفة في ظروف خاضعة للرقابة، (3) إدخال الكائنات في الخلفيات مع وضع وحجب متسقين من الناحية الفيزيائية، و(4) محاكاة هندسة الليدار لضمان الواقعية. أظهرت التجارب أن النماذج المدربة على بيانات تم إنشاؤها باستخدام Paved2Paradise تنتقل بفعالية إلى العالم الحقيقي، وتحقق أداءً قويًا في الكشف مع حاجة أقل بكثير إلى التصنيف اليدوي مقارنةً بطرق جمع البيانات التقليدية. وليست هذه الطريقة فعالة من حيث التكلفة فحسب، بل مرنة أيضًا—مما يسمح للممارسين بسهولة التوسع إلى فئات كائنات جديدة أو مجالات جديدة من خلال استبدال مسحات الخلفية أو الكائنات. بالنسبة لممارسي التعلم الآلي العاملين في مجالات الروبوتات أو المركبات المستقلة أو أنظمة الإدراك الحساسة للسلامة، يبرز Paved2Paradise مسارًا عمليًا نحو توسيع نطاق بيانات التدريب دون زيادة التكاليف. وهو يسد الفجوة بين الأداء في المحاكاة والأداء في العالم الحقيقي، مما يتيح تكرارًا أسرع ونشرًا أكثر موثوقية لنماذج الإدراك. *عن المتحدث* [مايكل أ. ألكورن](https://www.linkedin.com/in/michaelaalcorn/) هو مهندس تعلم آلي أول في شركة جون دير، حيث يطور نماذج التعلم العميق للإدراك باستخدام بيانات الليدار والصور الملونة (RGB) في أنظمة تتطلب سلامة عالية وتُعمل في الوقت الفعلي. حصل على درجة الدكتوراه في علوم الحاسوب من جامعة أوبرن، مع أطروحة حول تحسين الرؤية الحاسوبية والشبكات العصبية العميقة الزمكانية، ويحمل أيضًا تخصصًا فرعيًا دراسيًا في الرياضيات. وقد تم الاستشهاد بأبحاث مايكل من قبل باحثين في DeepMind وGoogle وMeta وMicrosoft وOpenAI، من بين آخرين، وكانت ورقة بحثه (batter|pitcher)2vec فائزة بجائزة في مؤتمر MIT Sloan Sports Analytics Conference لعام 2018. كما ساهم برمجيًا في مكتبات scikit-learn وApache Solr، وحققت مستودعات GitHub الخاصة به—التي حصلت مجتمعة على أكثر من 2100 نجمة—أن تكون نقطة انطلاق لأبحاث وشفرات إنتاجية في العديد من المؤسسات المختلفة. **MothBox: جهاز رصد حشرات منخفض التكلفة ومفتوح المصدر** سيتحدث الدكتور آندي كويتميير عن تصميم أداة علمية مفتوحة المصدر جديدة ومثيرة، وهي Mothbox. إن Mothbox مشروع فائز بجائزة لمراقبة الحشرات على نطاق واسع من أجل التنوع البيولوجي. وهو جهاز منخفض التكلفة تم تطويره في الغابات الاستوائية القاسية ببنما، ويقوم بالتقاط صور فائقة الدقة ثم يقوم تلقائيًا بتحديد مستويات التنوع البيولوجي في الغابات والزراعة. بعد آلاف الملاحظات على الحشرات وعمليات النشر المئات في بنما وبيرو والمكسيك والإكوادور والولايات المتحدة، نحن الآن نطور إصدارًا جديدًا يمكن تصنيعه لتوزيع هذه الأداة المهمة في جميع أنحاء العالم. وسنناقش تطوير هذا الجهاز في غابات بنما و أهميته لدراسة التنوع البيولوجي عالميًا. *عن المتحدث* يصمم الدكتور آندي كويتميير طرقًا جديدة للتفاعل مع العالم الطبيعي. وقد عمل مع منظمات كبيرة مثل شبكة كرتون نتورك وIDEO وسميثسونيان، ودرّس كأستاذ على ملاك التعيين الدائم في الجامعة الوطنية السنغافورية، وتم حتى تحويل بحثه إلى سلسلة تلفزيونية (مجنونة) بعنوان "تسلل إلى البرية"، تم توزيعها بواسطة Discovery Networks. حاليًا، يقضي معظم وقته في العمل التطوعي مع منظمات أصغر، وقام مؤخرًا بتأسيس مختبر الحرف الرقمية (Digital Naturalism Laboratories)، وهو مساحة صانعين مرتبطة بمحطة ميدانية. في غابة جامبوا المطيرة في بنما، يدمج Dinalab العمل الميداني البيولوجي مع الصناعة التكنولوجية ضمن مجتمع من العلماء والفنانين والمهندسين ومحسنّي الحيوانات المحليين والدوليين. وحاليًا، يُقدّم الاستشارات للطلاب كبروفيسور متعاون في جامعة واشنطن. **النماذج الأساسية للذكاء الاصطناعي البصري في الزراعة** لقد مكّنت النماذج الأساسية من أسلوب جديد لمعالجة المهام، وذلك بالاستفادة من القدرات الناشئة بطريقة بدون تدريب (zero-shot). في هذا الحديث، سأناقش الأبحاث الحديثة حول تمكين الذكاء الاصطناعي البصري بطريقة بدون تدريب أو عبر التخصيص الدقيق (fine-tuning). على وجه التحديد، سأناقش عملًا مشتركًا حول RELOCATE، وهو معيار بسيط لا يتطلب تدريبًا مصممًا لأداء المهمة الصعبة المتمثلة في تحديد موقع الاستعلام البصري في مقاطع فيديو طويلة. من أجل التخلص من الحاجة إلى تدريب خاص بالمهمة والتعامل بكفاءة مع مقاطع الفيديو الطويلة، يستفيد RELOCATE من تمثيل قائم على المناطق مشتق من نماذج رؤية مسبقة التدريب. كما سأناقش أيضًا عملًا مشتركًا حول تمكين نماذج اللغات الكبيرة متعددة الوسائط (MLLMs) من الإجابة الصحيحة على الاستعلامات التي تتطلب فهمًا شاملاً مكانيًا-زمانيًا: فالنماذج متعددة الوسائط تواجه صعوبة في الإجابة على استعلامات تشير إلى 1) البيئة بأكملها التي يمكن لوكيل مزود بنموذج MLLM العمل فيها؛ وتشير في الوقت نفسه أيضًا إلى 2) الإجراءات الأخيرة التي حدثت للتو والمسجلة في مقطع فيديو. ومع ذلك، فإن هذا الفهم الشامل المكاني-الزماني مهم للوكلاء الذين يعملون في العالم الحقيقي. ويتضمن حلنا تطوير خط أنابيب مخصص لجمع البيانات وتخصيص نموذج MLLM مزود بمشعاعات (projectors) لتحسين كل من الفهم المكاني للبيئة والفهم الزمني للملاحظات الأخيرة. *عن المتحدث* [ألكس شوينغ](https://www.linkedin.com/in/alexander-s-0a049258/) هو أستاذ مشارك في جامعة إلينوي في أوربانا-شامبين، يعمل مع طلاب موهوبين في مجالات الذكاء الاصطناعي والذكاء الاصطناعي التوليدي والرؤية الحاسوبية. حصل على بكالوريوس الهندسة الكهربائية وهندسة المعلومات من الجامعة التقنية في ميونخ عام 2006 و2008 على التوالي، وحصل على درجة الدكتوراه في علوم الحاسوب من معهد زيورخ الفدرالي للتكنولوجيا (ETH Zurich) عام 2014. وبعد ذلك انضم إلى جامعة تورونتو كزميل باحث ما بعد الدكتوراه حتى عام 2016. تتمحور اهتماماته البحثية حول الذكاء الاصطناعي والذكاء الاصطناعي التوليدي والرؤية الحاسوبية، حيث شارك في تأليف العديد من الأوراق البحثية حول فهم المشهد وخوارزميات الاستنتاج والتعلم والتعلم العميق ومعالجة الصور واللغة والنماذج التوليدية. ونالت أطروحته للدكتوراه ميدالية ETH، وحاز بحث فريقه على جائزة NSF CAREER. **ما وراء المختبر: كشف الشذوذ في العالم الواقعي للرؤية الحاسوبية في الزراعة** يُحدث كشف الشذوذ تغييرات جذرية في التصنيع والمراقبة، ولكن ماذا عن الزراعة؟ هل يمكن للذكاء الاصطناعي أن يكتشف أمراض النباتات وأضرار الآفات في وقت مبكر بما يكفي لصنع فرق؟ يُظهر هذا الحديث كيف يحدد كشف الشذوذ مشكلات المحاصيل ويحلل مواقعها، مستخدمًا صحة أوراق القهوة كمثالنا الأساسي. سنبدأ بالنظرية الأساسية، ثم نحلل كيف تكتشف هذه النماذج صدأ الأوراق وأضرار المنقّاب في الصور. تشمل الجلسة سير عمل عمليًا شاملاً باستخدام مجموعة أدوات الرؤية الحاسوبية مفتوحة المصدر FiftyOne، وتغطي إدارة مجموعة البيانات، واستخراج القطع (patches)، وتدريب النموذج، وتصور النتائج. ستحصل على فهم نظري لكشف الشذوذ في الرؤية الحاسوبية، بالإضافة إلى تجربة عملية في تطبيق هذه التقنيات على التحديات الزراعية وDomains أخرى. *عن المتحدث* [باولا راموس](https://www.linkedin.com/in/paula-ramos-phd/) تحمل درجة الدكتوراه في الرؤية الحاسوبية والتعلم الآلي، ولديها أكثر من 20 سنة من الخبرة في المجال التكنولوجي. وقد كانت تطور تقنيات هندسية متكاملة جديدة، خصوصًا في مجالات الرؤية الحاسوبية والروبوتات والتعلم الآلي المطبقة على الزراعة، منذ أوائل العقد الأول من القرن الحادي والعشرين في كولومبيا.