انضم إلينا في اليوم الأول من سلسلة الفعاليات الافتراضية للاستماع إلى محاضرات من خبراء حول أحدث التطورات في مجال التقاطع بين الذكاء الاصطناعي البصري والزراعة. **التاريخ والوقت** 15 أكتوبر الساعة 9 صباحًا بالتوقيت الهادئ **المكان** افتراضي. [سجّل الدخول عبر Zoom.](https://voxel51.com/events/visual-ai-in-agriculture-october-15-2025) **Paved2Paradise: محاكاة ليدار قابلة للتوسيع لإدراك العالم الحقيقي** غالبًا ما يتطلب تدريب نماذج إدراك قوية للروبوتات والاستقلالية وجود مجموعات بيانات ثلاثية الأبعاد ضخمة ومتنوعة. لكن جمع وتصنيف سحب النقاط الليدارية من العالم الحقيقي بحجم كبير أمر مكلف وجهد مستهلك للوقت، خاصة عند الحاجة إلى تسميات عالية الجودة. يقدم مشروع Paved2Paradise بديلاً اقتصاديًا: وهو خط أنابيب محاكاة ليدار قابل للتوسيع يُنتج مجموعات بيانات واقعية ومصنفة بالكامل مع الحد الأدنى من الجهد البشري في التسمية. الفكرة الأساسية هي "تحليل العالم الحقيقي" من خلال التقاط مسح الخلفية (مثل الحقول، الطرق، مواقع البناء) ومسح الكائنات (مثل المركبات، الأشخاص، الآلات) بشكل منفصل. ومن خلال الجمع الذكي بين هذين المصدرَين، يمكن لـ Paved2Paradise توليد عدد كبير توفيقيًا من مشاهد التدريب المتنوعة. يتضمن الخط الأنابيبي أربع خطوات: (1) جمع مسح ليدار واسع النطاق للخلفية، (2) تسجيل مسح عالي الدقة لكائنات الهدف في ظروف مضبوطة، (3) إدخال الكائنات في الخلفيات مع وضع واخفاء يتماشيان مع القوانين الفيزيائية، (4) محاكاة هندسة الليدار لضمان الواقعية. أظهرت التجارب أن النماذج المدربة على بيانات تم إنشاؤها باستخدام Paved2Paradise تنتقل بكفاءة إلى العالم الحقيقي، وتُحقق أداءً قويًا في الكشف مع حاجة أقل بكثير للتسمية اليدوية مقارنةً بجمع مجموعة البيانات التقليدية. هذه الطريقة ليست فعالة من حيث التكلفة فحسب، بل أيضًا مرنة—تمكّن الممارسين من التوسع بسهولة إلى فئات كائنات جديدة أو مجالات جديدة عن طريق استبدال مسح الخلفية أو الكائنات بآخر جديد. بالنسبة لممارسي التعلم الآلي العاملين في الروبوتات، المركبات المستقلة، أو أنظمة الإدراك الحرجة للسلامة، يبرز مشروع Paved2Paradise طريقًا عمليًا نحو توسيع بيانات التدريب دون زيادة التكاليف. وهو يسد الفجوة بين المحاكاة والأداء في العالم الحقيقي، مما يتيح التكرار الأسرع والنشر الأكثر موثوقية لنماذج الإدراك. *عن المتحدث* [مايكل أ. ألكورن](https://www.linkedin.com/in/michaelaalcorn/) هو مهندس رئيسي للتعلم الآلي في شركة جون دير، حيث يطور نماذج التعلم العميق للإدراك باستخدام الليدار والصور الملونة (RGB) في أنظمة حرجة للسلامة وتُعمل في الزمن الحقيقي. حصل على درجة الدكتوراه في علوم الحاسوب من جامعة أوبرن، وكان موضوع أطروحته تحسين الرؤية الحاسوبية والشبكات العصبية العميقة الزمكانية، كما يمتلك تخصصًا فرعيًا في الرياضيات. تم الاستشهاد بأبحاث مايكل من قبل باحثين في DeepMind، Google، Meta، Microsoft، وOpenAI، من بين آخرين، وكانت ورقة \(batter\|pitcher\)2vec الخاصة به فائزة بجائزة في مؤتمر MIT Sloan Sports Analytics Conference عام 2018. كما ساهم برمجيًا في scikit\-learn وApache Solr، وقد استُخدم مستودعات GitHub الخاصة به — التي حصلت مجتمعة على أكثر من 2\,100 نجمة — كنقاط بداية لأكواد بحثية وإنتاجية في العديد من المنظمات المختلفة. **MothBox: جهاز رصد حشرات منخفض التكلفة ومفتوح المصدر** سيتحدث الدكتور آندي كوتميير عن تصميم أداة علمية جديدة ومثيرة مفتوحة المصدر، Mothbox. إن Mothbox هو مشروع فائز بجوائز لمراقبة الحشرات على نطاق واسع من أجل التنوع البيولوجي. وهو جهاز منخفض التكلفة تم تطويره في الغابات الاستوائية القاسية ببنما، ويُجري صورًا فائقة الدقة ثم يقوم تلقائيًا بتحديد مستويات التنوع البيولوجي في الغابات والزراعة. بعد آلاف الملاحظات على الحشرات ومئات النشرات في بنما، بيرو، المكسيك، الإكوادور، والولايات المتحدة، نحن الآن نطور إصدارًا جديدًا قابلاً للتصنيع لنشارك هذه الأداة المهمة في جميع أنحاء العالم. سنناقش تطوير هذا الجهاز في غابات بنما وأهميته لدراسة التنوع البيولوجي عالميًا. *عن المتحدث* يصمم الدكتور آندي كوتميير طرقًا جديدة للتفاعل مع العالم الطبيعي. عمل مع منظمات كبيرة مثل Cartoon Network وIDEO وSmithsonian، ودرّس كأستاذ على مستوى وظيفة دائمة في الجامعة الوطنية السنغافورية، وحتى تحولت أبحاثه إلى برنامج تلفزيوني (مضحك) بعنوان "Hacking the Wild"، تم توزيعه بواسطة Discovery Networks. في الوقت الحالي، يقضي معظم وقته في العمل التطوعي مع منظمات صغيرة، ومؤخرًا أسس مختبر صناعة المحطة الميدانية، Digital Naturalism Laboratories. في غابة الأمطار في جامبوا ببنما، يدمج Dinalab العمل الميداني البيولوجي مع الصياغة التكنولوجية ضمن مجتمع من العلماء والفنانين والمهندسين ومتخصصي إعادة تأهيل الحيوانات المحليين والدوليين. وهو حاليًا يستشار كأستاذ مشارك في جامعة واشنطن. **النماذج الأساسية للذكاء الاصطناعي البصري في الزراعة** لقد مكّنت النماذج الأساسية من طريقة جديدة لمعالجة المهام، وذلك بالاستفادة من القدرات الناشئة بطريقة بدون تدريب (zero-shot). في هذه المحاضرة، سأناقش أحدث الأبحاث المتعلقة بتمكين الذكاء الاصطناعي البصري بطريقة بدون تدريب أو من خلال الضبط الدقيق (fine-tuning). على وجه التحديد، سأتناول العمل المشترك حول RELOCATE، وهو معيار بسيط لا يتطلب تدريبًا مصممًا لأداء مهمة صعبة وهي تحديد موقع الاستعلام البصري في مقاطع فيديو طويلة. لإزالة الحاجة إلى تدريب مخصص للمهمة ومعالجة مقاطع الفيديو الطويلة بكفاءة، يستفيد RELOCATE من تمثيل قائم على المناطق مستمد من نماذج الرؤية المدربة مسبقًا. كما سأناقش العمل المشترك حول تمكين نماذج اللغات الكبيرة متعددة الوسائط (MLLMs) من الإجابة الصحيحة على الطلبات التي تتطلب فهمًا شاملاً مكانياً وزمنياً: فالنماذج MLLMs تجد صعوبة في الإجابة على طلبات تشير إلى 1) بيئة كاملة يمكن لوكيل مزود بـ MLLM العمل فيها؛ وفي نفس الوقت تشير أيضًا إلى 2) إجراءات حديثة حدثت للتو وتم ترميزها في مقطع فيديو. ومع ذلك، فإن هذا الفهم الشامل المكاني-الزماني مهم للوكلاء الذين يعملون في العالم الحقيقي. حلنا يتضمن تطوير خط أنابيب مخصص لجمع البيانات وضبط نموذج MLLM مجهز بمشغلات (projectors) لتحسين كل من الفهم المكاني للبيئة والفهم الزمني للمشاهدات الحديثة. *عن المتحدث* [أليكس شوينغ](https://www.linkedin.com/in/alexander-s-0a049258/) هو أستاذ مشارك في جامعة إلينوي في أوربانا-แชมبين، يعمل مع طلاب موهوبين في مجالات الذكاء الاصطناعي، والذكاء الاصطناعي التوليدي، والرؤية الحاسوبية. حصل على بكالوريوس ودبلومه في الهندسة الكهربائية وتكنولوجيا المعلومات من الجامعة التقنية بميونيخ عامي 2006 و2008 على التوالي، وحصل على درجة الدكتوراه في علوم الحاسوب من ETH زيورخ عام 2014. بعد ذلك انضم إلى جامعة تورونتو كزميل ما بعد الدكتوراه حتى عام 2016. تتركز اهتماماته البحثية في مجالات الذكاء الاصطناعي، والذكاء الاصطناعي التوليدي، والرؤية الحاسوبية، حيث شارك في تأليف العديد من الأوراق البحثية حول فهم المشهد، وخوارزميات الاستنتاج والتعلم، والتعلم العميق، ومعالجة الصور واللغة، والنماذج التوليدية. حصلت أطروحته للدكتوراه على ميدالية ETH، وتم تكريم بحث فريقه بجائزة NSF CAREER. **خارج المختبر: كشف الشذوذ في العالم الحقيقي للرؤية الحاسوبية الزراعية** إن كشف الشذوذ يُحدث تحوّلًا في التصنيع والمراقبة، ولكن ماذا عن الزراعة؟ هل يمكن للذكاء الاصطناعي اكتشاف أمراض النباتات وأضرار الآفات في وقت مبكر بما يكفي لصنع فرق؟ توضح هذه المحاضرة كيف يحدد كشف الشذوذ ويحلل مشكلات المحاصيل باستخدام صحة أوراق القهوة كمثال رئيسي. سنبدأ بالنظرية الأساسية، ثم نفحص كيف تكتشف هذه النماذج صدأ الأوراق وأضرار العاملين (miner damage) في صور الأوراق. تشمل الجلسة سير عمل شاملًا عمليًا باستخدام أدوات FiftyOne المفتوحة المصدر للرؤية الحاسوبية، ويتناول تنسيق مجموعة البيانات، واستخراج القطع (patch extraction)، وتدريب النموذج، وعرض النتائج. ستحصل على فهم نظري لكشف الشذوذ في الرؤية الحاسوبية وعلى خبرة عملية في تطبيق هذه الأساليب على التحديات الزراعية وغيرها من المجالات. *عن المتحدث* [بولينا راموس](https://www.linkedin.com/in/paula-ramos-phd/) تحمل درجة الدكتوراه في الرؤية الحاسوبية والتعلم الآلي، ولديها أكثر من 20 سنة من الخبرة في المجال التكنولوجي. تعمل منذ أوائل العقد الأول من القرن الحادي والعشرين على تطوير تقنيات هندسية متكاملة جديدة، تركز أساسًا على الرؤية الحاسوبية، والروبوتات، والتعلم الآلي المطبّق على الزراعة في كولومبيا.