انضم إلينا في اليوم الأول من سلسلة الفعاليات الافتراضية للاستماع إلى متحدثين خبراء حول أحدث التطورات في مجال التقاطع بين الذكاء الاصطناعي البصري والزراعة. **التاريخ والوقت** 15 أكتوبر الساعة 9 صباحًا بالتوقيت الباسيفيكي **المكان** افتراضي. [سجّل الدخول عبر زوم.](https://voxel51.com/events/visual-ai-in-agriculture-october-15-2025) **Paved2Paradise: محاكاة ليدار قابلة للتوسيع للإدراك في العالم الواقعي** غالبًا ما يتطلب تدريب نماذج الإدراك القوية للروبوتات والقيادة الذاتية مجموعات بيانات ضخمة ومتنوعة ثلاثية الأبعاد. لكن جمع وترميز سحب ليدار من العالم الحقيقي بحجم كبير أمر مكلف ويتطلب وقتًا طويلاً، خاصة عند الحاجة إلى تسميات عالية الجودة. يقدم Paved2Paradise بديلاً اقتصاديًا: وهو خط أنابيب محاكاة ليدار قابل للتوسيع يُنتج مجموعات بيانات واقعية ومُوسومة بالكامل بجهد تسمية بشري ضئيل. الفكرة الأساسية هي "تحليل العالم الحقيقي" من خلال التقاط مسح خلفي منفصل (مثل الحقول، الطرق، مواقع البناء) ومسح كائنات منفصل (مثل المركبات، الأشخاص، الآلات). من خلال دمج هذين المصدرَين بذكاء، يمكن لـ Paved2Paradise توليد مجموعة كبيرة جدًا ومتنوعة من مشاهد التدريب. يتضمن خط الأنابيب أربع خطوات: (1) جمع مسح ليدار خلفي واسع النطاق، (2) تسجيل مسح عالي الدقة لكائنات الهدف في ظروف مضبوطة، (3) إدخال الكائنات في الخلفيات مع وضع وحجب متسق فيزيائيًا، (4) محاكاة هندسة الليدار لضمان الواقعية. أظهرت التجارب أن النماذج المدربة على بيانات تم إنشاؤها بواسطة Paved2Paradise تنتقل بكفاءة إلى العالم الحقيقي، وتُحقق أداءً قويًا في الكشف مع تقليل كبير في الترميز اليدوي مقارنةً بطرق جمع مجموعات البيانات التقليدية. هذه الطريقة ليست فعالة من حيث التكلفة فحسب، بل مرنة أيضًا—تمكّن الممارسين من التوسع بسهولة إلى فئات أو مجالات كائنات جديدة من خلال استبدال مسحات الخلفية أو الكائنات. بالنسبة لممارسي التعلم الآلي العاملين في مجالات الروبوتات، المركبات المستقلة، أو أنظمة الإدراك الحرجة للسلامة، يُبرز Paved2Paradise طريقًا عمليًا نحو توسيع بيانات التدريب دون توسيع التكاليف. وهو يسد الفجوة بين الأداء في المحاكاة والأداء في العالم الحقيقي، مما يمكّن من التكرار الأسرع والنشر الأكثر موثوقية لنماذج الإدراك. *عن المتحدث* [مايكل أ. ألكورن](https://www.linkedin.com/in/michaelaalcorn/) هو مهندس تعلم آلي أول في شركة John Deere\، حيث يطور نماذج تعلم عميق للإدراك باستخدام الليدار والصورة الملونة في أنظمة حرجة للسلامة\، وتعمل في الزمن الحقيقي\. حصل على درجة الدكتوراه في علوم الحاسوب من جامعة أوبرن\، مع أطروحة حول تحسين الرؤية الحاسوبية والشبكات العصبية العميقة المكانية-الزمنية\، ويحمل أيضًا تخصصًا فرعيًا في الرياضيات\. تم الاستشهاد بأبحاث مايكل من قبل باحثين في DeepMind\، Google\، Meta\، Microsoft\، وOpenAI\، من بين آخرين\، وكانت ورقة \(batter\|pitcher\)2vec الخاصة به فائزة بجائزة في مؤتمر MIT Sloan Sports Analytics Conference 2018\. كما ساهم برمجيًا في scikit\-learn وApache Solr\، وحظيت مستودرات GitHub الخاصة به—التي حصلت مجتمعة على أكثر من 2\,100 نجمة—بأن تكون نقطة انطلاق لأبحاث وشفرات إنتاجية في العديد من المؤسسات المختلفة\. **MothBox: جهاز رصد حشرات منخفض التكلفة ومفتوح المصدر** سيتحدث الدكتور آندي كوتميير عن تصميم أداة علمية جديدة ومثيرة مفتوحة المصدر، تُعرف باسم Mothbox. يُعد Mothbox مشروعًا فائزًا بجائزة لمراقبة واسعة النطاق للحشرات بهدف قياس التنوع البيولوجي. وهو جهاز منخفض التكلفة تم تطويره في الغابات القاسية ببنما، ويقوم بالتقاط صور فائقة الدقة ثم يقوم تلقائيًا بتحديد مستويات التنوع البيولوجي في الغابات والزراعة. بعد آلاف الملاحظات على الحشرات ومئات النشرات في بنما، بيرو، المكسيك، الإكوادور، والولايات المتحدة، نحن الآن نعمل على تطوير نسخة جديدة قابلة للتصنيع لنشر هذه الأداة المهمة في جميع أنحاء العالم. سنناقش تطور هذا الجهاز في غابات بنما وأهميته لدراسة التنوع البيولوجي عالميًا. *عن المتحدث* يُصمم الدكتور آندي كوتميير طرقًا جديدة للتفاعل مع العالم الطبيعي. عمل مع مؤسسات كبيرة مثل شبكة كرتون نتورك، IDEO، ومعهد سميثسونيان، ودرّس كأستاذ أكاديمي في جامعة سنغافورة الوطنية، وتم حتى تحويل بحثه إلى سلسلة تلفزيونية (مضحكة) بعنوان "Hacking the Wild"، تم توزيعها عبر Discovery Networks. حاليًا، يقضي معظم وقته في العمل التطوعي مع منظمات صغيرة، وقام مؤخرًا بتأسيس ورشة عمل مختبرات الطبيعة الرقمية (Digital Naturalism Laboratories). في غابة جامبوا الاستوائية ببنما، تدمج Dinalab العمل الميداني البيولوجي مع الحرف التكنولوجية ضمن مجتمع من العلماء والفنانين والمهندسين ومتخصصي إعادة تأهيل الحيوانات المحليين والدوليين. كما يُقدم حاليًا الاستشارات للطلاب بصفته أستاذًا مشاركًا في جامعة واشنطن. **النماذج الأساسية للذكاء الاصطناعي البصري في الزراعة** لقد مكّنت النماذج الأساسية من أسلوب جديد لمعالجة المهام، من خلال الاستفادة من القدرات الناشئة بطريقة بدون تدريب (zero-shot). في هذا الحديث، سأناقش أبحاثًا حديثة حول تمكين الذكاء الاصطناعي البصري بطريقة بدون تدريب أو من خلال التخصيص الدقيق (fine-tuning). على وجه التحديد، سأتناول بحثًا مشتركًا حول RELOCATE، وهو معيار بسيط لا يتطلب تدريبًا مصممًا لأداء المهمة الصعبة المتمثلة في تحديد موقع الاستعلام البصري في مقاطع فيديو طويلة. لإزالة الحاجة إلى تدريب مخصص للمهمة والتعامل بكفاءة مع مقاطع الفيديو الطويلة، يستفيد RELOCATE من تمثيل قائم على المناطق مستمد من نماذج رؤية مسبقة التدريب. سأناقش أيضًا بحثًا مشتركًا حول تمكين نماذج اللغات الكبيرة متعددة الوسائط (MLLMs) من الإجابة الصحيحة على الاستعلامات التي تتطلب فهمًا شاملاً مكانيًا-زمانيًا: فغالبًا ما تواجه النماذج متعددة الوسائط صعوبة في الإجابة على استعلامات تشير إلى 1) بيئة كاملة يمكن لوكيل مزود بـ MLLM العمل فيها، وتشير في الوقت نفسه إلى 2) أفعال حديثة حدثت للتو وتم ترميزها في مقطع فيديو. ومع ذلك، فإن هذا الفهم الشامل المكاني-الزماني مهم للوكلاء العاملين في العالم الحقيقي. يشمل حلنا تطوير خط أنابيب مخصص لجمع البيانات وتخصيص نموذج MLLM مزود بمشعاعات (projectors) لتحسين كل من الفهم المكاني للبيئة والفهم الزمني للملاحظات الحديثة. *عن المتحدث* [ألكس شوينغ](https://www.linkedin.com/in/alexander-s-0a049258/) هو أستاذ مشارك في جامعة إلينوي في أوربانا-شامبين، يعمل مع طلاب موهوبين في مجالات الذكاء الاصطناعي، والذكاء الاصطناعي التوليدي، والرؤية الحاسوبية. حصل على بكالوريوس ودبلومه في الهندسة الكهربائية وتكنولوجيا المعلومات من الجامعة التقنية في ميونخ عام 2006 و2008 على التوالي، وحصل على درجة الدكتوراه في علوم الحاسوب من ETH زيورخ عام 2014. بعد ذلك، انضم إلى جامعة تورونتو كزميل ما بعد الدكتوراه حتى عام 2016. تتمحور اهتماماته البحثية حول الذكاء الاصطناعي، والذكاء الاصطناعي التوليدي، والرؤية الحاسوبية، حيث شارك في تأليف العديد من الأوراق البحثية في مواضيع فهم المشهد، وخوارزميات الاستنتاج والتعلم، والتعلم العميق، ومعالجة الصور واللغة، والنماذج التوليدية. حصلت أطروحته للدكتوراه على ميدالية ETH، وتم منح بحث فريقه جائزة NSF CAREER. **خارج المختبر: كشف الشذوذ في العالم الواقعي للرؤية الحاسوبية في الزراعة** يُحدث كشف الشذوذ تغييرًا جذريًا في التصنيع والمراقبة، ولكن ماذا عن الزراعة؟ هل يمكن للذكاء الاصطناعي أن يكتشف أمراض النباتات وأضرار الآفات في وقت مبكر بما يكفي لصنع فرق؟ يُظهر هذا الحديث كيف يحدد كشف الشذوذ مشكلات المحاصيل ويحلل موقعها، باستخدام صحة أوراق القهوة كمثال رئيسي. سنبدأ بالنظرية الأساسية، ثم ندرس كيف تكتشف هذه النماذج صدأ الأوراق وأضرار المنقّاب في صور الأوراق. تشمل الجلسة سير عمل عمليًا شاملاً باستخدام أداة FiftyOne مفتوحة المصدر للرؤية الحاسوبية، وتشمل تنسيق مجموعة البيانات، واستخراج القطع، وتدريب النموذج، وعرض النتائج. ستحصل على فهم نظري لكشف الشذوذ في الرؤية الحاسوبية، بالإضافة إلى خبرة عملية في تطبيق هذه التقنيات على التحديات الزراعية ومجالات أخرى. *عن المتحدث* [باولا راموس](https://www.linkedin.com/in/paula-ramos-phd/) تحمل درجة الدكتوراه في الرؤية الحاسوبية والتعلم الآلي، ولديها أكثر من 20 عامًا من الخبرة في المجال التكنولوجي. وهي تعمل على تطوير تقنيات هندسية متكاملة جديدة، خصوصًا في مجالات الرؤية الحاسوبية، والروبوتات، والتعلم الآلي المطبّق على الزراعة، منذ أوائل العقد الأول من القرن الحادي والعشرين في كولومبيا.