انضم إلينا في اليوم الأول من سلسلة فعاليات افتراضية للاستماع إلى خبراء حول آخر التطورات في مجال التقاطع بين الذكاء الاصطناعي البصري والزراعة. **التاريخ والوقت** 15 أكتوبر الساعة 9 صباحًا بالتوقيت الهادئ **المكان** افتراضي. [سجّل الدخول عبر Zoom.](https://voxel51.com/events/visual-ai-in-agriculture-october-15-2025) **Paved2Paradise: محاكاة ليدار قابلة للتوسيع للإدراك في العالم الحقيقي** غالبًا ما يتطلب تدريب نماذج الإدراك القوية للروبوتات والاستقلالية وجود مجموعات بيانات ضخمة ومتنوعة ثلاثية الأبعاد. ولكن جمع وترميز سحب ليدار من العالم الحقيقي بحجم كبير أمرٌ مكلفٌ للغاية ويتطلب وقتًا طويلاً، خاصة عند الحاجة إلى تسميات عالية الجودة. يقدم مشروع Paved2Paradise بديلًا اقتصاديًا: وهو خط أنابيب محاكاة ليدار قابل للتوسيع يُنتج مجموعات بيانات واقعية ومُعلَّمة بالكامل مع أقل حد ممكن من الجهد البشري في الترميز. الفكرة الأساسية هي "تحليل الواقع" من خلال التقاط مسح خلفية (مثل الحقول، الطرق، مواقع البناء) ومسح كائنات منفصلة (مثل المركبات، الأشخاص، الآلات). من خلال دمج هذين المصدرَين بشكل ذكي، يمكن لـ Paved2Paradise توليد عدد كبير توفيقيًا من مشاهد التدريب المتنوعة. يتضمن الخط الأنابيبي أربع خطوات: (1) جمع مسح ليدار خلفي واسع النطاق، (2) تسجيل مسح عالي الدقة لكائنات مستهدفة في ظروف مضبوطة، (3) إدخال الكائنات داخل الخلفيات مع وضع وحجب يتماشيان مع القوانين الفيزيائية، و(4) محاكاة هندسة الليدار لضمان الواقعية. أظهرت التجارب أن النماذج المدربة على بيانات تم إنشاؤها بواسطة Paved2Paradise تنتقل بكفاءة إلى العالم الحقيقي، وتُحقق أداءً قويًا في الكشف مع تقليل كبير في الترميز اليدوي مقارنةً بجمع مجموعة البيانات التقليدية. هذه الطريقة ليست فعالة من حيث التكلفة فحسب، بل مرنة أيضًا – مما يسمح للممارسين بسهولة التوسع إلى فئات أو مجالات كائنات جديدة عن طريق استبدال مسحات الخلفية أو الكائنات. بالنسبة لممارسي تعلم الآلة العاملين في مجالات الروبوتات، المركبات المستقلة، أو نظم الإدراك الحرجة للسلامة، فإن Paved2Paradise يسلط الضوء على مسار عملي نحو توسيع بيانات التدريب دون زيادة التكاليف. كما يسد الفجوة بين المحاكاة والأداء في العالم الحقيقي، مما يتيح التكرار الأسرع والنشر الأكثر موثوقية لنماذج الإدراك. *عن المتحدث* [مايكل أ. ألكورن](https://www.linkedin.com/in/michaelaalcorn/) هو مهندس متقدم في تعلم الآلة في شركة John Deere\، حيث يطور نماذج التعلم العميق لإدراك الليدار والصور الملونة في أنظمة تتطلب السلامة\، وتعمل في الوقت الفعلي\. حصل على درجة الدكتوراه في علوم الحاسوب من جامعة أوبرن\، مع أطروحة حول تحسين رؤية الحاسوب والشبكات العصبية العميقة المكانية-الزمنية\، وله أيضًا تخصص فرعي في الرياضيات\. تم الاستشهاد بأبحاث مايكل من قبل باحثين في DeepMind\، Google\، Meta\، Microsoft\، وOpenAI\، من بين آخرين\، كما فاز ورقة \(batter\|pitcher\)2vec الخاصة به بجائزة في مؤتمر MIT Sloan Sports Analytics Conference عام 2018\. كما ساهم في كتابة شفرات تعلم الآلة لـ scikit\-learn وApache Solr\، وقد تلقى مستودعات GitHub الخاصة به — التي تراكمت عليها أكثر من 2\,100 نجمة — استخدامات كنقاط بداية لأبحاث وأكواد إنتاجية في العديد من المؤسسات المختلفة\. **MothBox: جهاز رصد حشرات منخفض التكلفة ومفتوح المصدر** سيتحدث الدكتور آندي كوتميير عن تصميم أداة علمية مفتوحة المصدر جديدة ومثيرة، Mothbox. يُعد Mothbox مشروعًا فائزًا بجائزة لمراقبة واسعة النطاق للحشرات من أجل التنوع البيولوجي. إنه جهاز منخفض التكلفة تم تطويره في الغابات الاستوائية القاسية ببنما، ويقوم بالتقاط صور فائقة الدقة ثم يقوم تلقائيًا بتحديد مستويات التنوع البيولوجي في الغابات والزراعة. بعد آلاف الملاحظات على الحشرات ومئات النشرات في بنما، بيرو، المكسيك، الإكوادور، والولايات المتحدة، نحن الآن بصدد تطوير نسخة جديدة قابلة للتصنيع لتعميم هذه الأداة المهمة على مستوى العالم. سنناقش تطوير هذا الجهاز في غابات بنما ودوره المهم في دراسة التنوع البيولوجي عالميًا. *عن المتحدث* يصمم الدكتور آندي كوتميير طرقًا جديدة للتفاعل مع العالم الطبيعي. عمل مع منظمات كبيرة مثل Cartoon Network وIDEO وSmithsonian، ودرّس كأستاذ على مسار الترقي الوظيفي في الجامعة الوطنية السنغافورية، وحتى تحولت إحدى أبحاثه إلى برنامج تلفزيوني (طرifo) بعنوان “Hacking the Wild” تم توزيعه عبر Discovery Networks. حالياً، يقضي معظم وقته في العمل التطوعي مع منظمات صغيرة، وقام مؤخرًا بتأسيس مختبر الحرف الرقمية (Digital Naturalism Laboratories)، وهو مساحة مخصصة للصناع في محطة ميدانية. في غابة جامبوا الاستوائية في بنما، يدمج Dinalab بين العمل الميداني البيولوجي والصناعة التكنولوجية ضمن مجتمع من العلماء والفنانين والمهندسين ومُنقذي الحيوانات المحليين والدوليين. كما يعمل حاليًا كأستاذ مشارك في جامعة واشنطن حيث يقدم الإرشاد للطلاب. **النماذج الأساسية للذكاء الاصطناعي البصري في الزراعة** لقد مكّنت النماذج الأساسية من طريقة جديدة لمعالجة المهام، وذلك بالاستفادة من القدرات الناشئة بطريقة بدون تدريب (zero-shot). في هذا الحديث، سأناقش أحدث الأبحاث المتعلقة بتمكين الذكاء الاصطناعي البصري بطريقة بدون تدريب أو عبر التعديل الدقيق (fine-tuning). وعلى وجه التحديد، سأتناول بحثًا مشتركًا حول RELOCATE، وهو معيار بسيط لا يتطلب تدريبًا مصممًا لأداء مهمة صعبة تتمثل في تحديد موقع الاستعلام البصري في مقاطع فيديو طويلة. للتخلص من الحاجة إلى تدريب مخصص للمهمة ومعالجة مقاطع الفيديو الطويلة بكفاءة، يستفيد RELOCATE من تمثيل قائم على المناطق مشتق من نماذج بصرية مسبقة التدريب. كما سأناقش أيضًا عملًا مشتركًا يهدف إلى تمكين نماذج اللغات الكبيرة متعددة الوسائط (MLLMs) من الإجابة الصحيحة على المطالب التي تتطلب فهمًا شاملاً مكانياً-زمنياً: فالنماذج متعددة الوسائط تجد صعوبة في الإجابة على المطالب التي تشير إلى 1) البيئة بأكملها التي يمكن لوكيل مزود بنموذج MLLM العمل فيها؛ وفي نفس الوقت تشير أيضاً إلى 2) الإجراءات الأخيرة التي حدثت للتو والمُشفرة في مقطع فيديو. لكن مثل هذا الفهم الشامل المكاني-الزماني مهم للوكلاء الذين يعملون في العالم الحقيقي. يشمل حلنا تطوير خط أنابيب مخصص لجمع البيانات وتعديل نموذج MLLM مزود بمشعات لتحسين كل من الفهم المكاني للبيئة والفهم الزمني للملاحظات الحديثة. *عن المتحدث* [ألكس شوينغ](https://www.linkedin.com/in/alexander-s-0a049258/) هو أستاذ مشارك في جامعة إلينوي في أوربانا-شمباين، يعمل مع طلاب موهوبين في مجالات الذكاء الاصطناعي، والذكاء الاصطناعي التوليدي، ورؤية الحاسوب. حصل على درجة البكالوريوس والدبلوم في الهندسة الكهربائية وتكنولوجيا المعلومات من الجامعة التقنية في ميونيخ عامي 2006 و2008 على التوالي، وحصل على درجة الدكتوراه في علوم الحاسوب من ETH زيورخ عام 2014. وبعد ذلك انضم إلى جامعة تورونتو كزميل باحث حتى عام 2016. تشمل اهتماماته البحثية مجالات الذكاء الاصطناعي، والذكاء الاصطناعي التوليدي، ورؤية الحاسوب، حيث شارك في تأليف العديد من الأوراق البحثية حول مواضيع في فهم المشهد، وخوارزميات الاستنتاج والتعلم، والتعلم العميق، ومعالجة الصور واللغة، والنماذج التوليدية. حصلت أطروحته للدكتوراه على ميدالية ETH، كما حصل بحث فريقه على جائزة NSF CAREER. **خارج المختبر: كشف الشذوذ في العالم الحقيقي للرؤية الحاسوبية الزراعية** إن كشف الشذوذ يُحدث تغييرًا في التصنيع والمراقبة، لكن ماذا عن الزراعة؟ هل يمكن للذكاء الاصطناعي أن يكتشف أمراض النباتات وأضرار الآفات في وقت مبكر بما يكفي لصنع فرق؟ يوضح هذا الحديث كيف يحدد كشف الشذوذ ويحلل مشكلات المحاصيل باستخدام صحة أوراق البن كمثال أساسي. سنبدأ بالنظرية الأساسية، ثم نفحص كيف تكتشف هذه النماذج صدأ الورقة وأضرار المنشار في الصور. تتضمن الجلسة سير عمل عملي شامل باستخدام أدوات الرؤية الحاسوبية المفتوحة المصدر FiftyOne، وتشمل تنقية مجموعة البيانات، واستخراج القطع، وتدريب النموذج، وعرض النتائج. ستحصل على فهم نظري لكشف الشذوذ في الرؤية الحاسوبية، وكذلك تجربة عملية في تطبيق هذه التقنيات على التحديات الزراعية وغيرها من المجالات. *عن المتحدث* [بولينا راموس](https://www.linkedin.com/in/paula-ramos-phd/) تحمل درجة الدكتوراه في الرؤية الحاسوبية وتعلم الآلة، ولديها أكثر من 20 عامًا من الخبرة في المجال التكنولوجي. وهي تعمل على تطوير تقنيات هندسية متكاملة جديدة، أساسًا في مجالات الرؤية الحاسوبية، والروبوتات، وتعلم الآلة المطبقة على الزراعة، منذ أوائل العقد الأول من القرن الحادي والعشرين في كولومبيا.