انضم إلينا في اليوم الأول من سلسلة الفعاليات الافتراضية للاستماع إلى متحدثين خبراء حول آخر التطورات في مجال التقاطع بين الذكاء الاصطناعي البصري والزراعة. **التاريخ والوقت** 15 أكتوبر الساعة 9 صباحًا بالتوقيت الهادئ **المكان** افتراضي. [سجّل حضورك عبر Zoom.](https://voxel51.com/events/visual-ai-in-agriculture-october-15-2025) **Paved2Paradise: محاكاة ليدار قابلة للتوسيع من أجل الإدراك في العالم الحقيقي** غالبًا ما يتطلب تدريب نماذج إدراك قوية للروبوتات والاستقلالية توفر كميات ضخمة ومتنوعة من بيانات ثلاثية الأبعاد. ولكن جمع وتصنيف سحب نقاط ليدار من العالم الحقيقي بكميات كبيرة أمرٌ مكلفٌ للغاية ويستغرق وقتًا طويلاً، خاصة عند الحاجة إلى تسميات عالية الجودة. يقدم مشروع Paved2Paradise بديلاً اقتصاديًا: وهو خط أنابيب محاكاة ليدار قابل للتوسيع لإنتاج بيانات واقعية ومُصنفة بالكامل مع الحد الأدنى من الجهد البشري في التصنيف. الفكرة الأساسية هي "تفكيك العالم الحقيقي" من خلال جمع مسح خلفية (مثل الحقول، الطرق، مواقع البناء) ومسح كائنات منفصلة (مثل المركبات، الأشخاص، الآلات). ومن خلال دمج هذين المصدرَين بذكاء، يمكن لـ Paved2Paradise توليد عدد كبير جدًا من مشاهد التدريب المتنوعة. ويتضمن خط الأنابيب أربع خطوات: (1) جمع مسح ليدار واسع النطاق للخلفية، (2) تسجيل مسح عالي الدقة لكائنات مستهدفة في ظروف مضبوطة، (3) إدخال الكائنات في الخلفيات مع وضع وحجب يتماشيان مع القوانين الفيزيائية، (4) محاكاة هندسة الليدار لضمان الواقعية. أظهرت التجارب أن النماذج المدربة على بيانات تم توليدها باستخدام Paved2Paradise تنتقل بكفاءة إلى العالم الحقيقي، وتحقق أداءً قويًا في الكشف مع حاجة أقل بكثير للتسمية اليدوية مقارنةً بجمع البيانات التقليدي. ولا يقتصر هذا النهج على كونه فعالًا من حيث التكلفة، بل إنه أيضًا مرن — مما يتيح للممارسين التوسع بسهولة إلى فئات أو نطاقات كائنات جديدة من خلال استبدال مسحات الخلفية أو الكائنات بمسحات جديدة. بالنسبة لممارسي تعلم الآلة العاملين في مجالات الروبوتات أو المركبات المستقلة أو أنظمة الإدراك الحرجة للسلامة، يبرز Paved2Paradise طريقًا عمليًا نحو توسيع بيانات التدريب دون زيادة التكاليف. كما يسد الفجوة بين المحاكاة والأداء في العالم الحقيقي، ما يتيح تكرارًا أسرع ونشرًا أكثر موثوقية لنماذج الإدراك. *عن المتحدث* [مايكل أ. ألكورن](https://www.linkedin.com/in/michaelaalcorn/) هو مهندس رئيسي في تعلم الآلة في شركة John Deere\، حيث يطور نماذج تعلّم عميق لأنظمة إدراك الليدار والألوان (RGB) في أنظمة حرجة للسلامة وتُعمل في الزمن الحقيقي\. حصل على درجة الدكتوراه في علوم الحاسوب من جامعة أوبرن\، مع أطروحة حول تحسين الرؤية الحاسوبية والشبكات العصبية العميقة المكانية-الزمنية\، وحصل أيضًا على تخصص ثانوي في الرياضيات\. تم الاستشهاد بأبحاث مايكل من قبل باحثين في DeepMind\، Google\، Meta\، Microsoft\، وOpenAI\، من بين آخرين\، وكانت ورقة \(batter\|pitcher\)2vec الخاصة به فائزة بجائزة في مؤتمر MIT Sloan Sports Analytics Conference لعام 2018\. كما ساهم برمجيًا في scikit\-learn وApache Solr\، وقد استُخدمت مستودرات GitHub الخاصة به—التي حصلت مجتمعة على أكثر من 2\,100 نجمة—كمحطات انطلاق لأغراض البحث والبرمجيات التشغيلية في العديد من المنظمات المختلفة\. **MothBox: جهاز رصد حشرات منخفض التكلفة، مفتوح المصدر، وآلي** سيتحدث الدكتور آندي كويتميير عن تصميم أداة علمية جديدة ومثيرة مفتوحة المصدر، وهي Mothbox. يعد مشروع Mothbox مشروعًا فائزًا بجائزة لمراقبة واسعة النطاق للحشرات من أجل التنوع البيولوجي. وهو جهاز منخفض التكلفة تم تطويره في الغابات الاستوائية الصعبة ببنما، ويقوم بالتقاط صور فائقة الدقة ثم يقوم تلقائيًا بتحديد مستويات التنوع البيولوجي في الغابات والزراعة. وبعد آلاف الملاحظات على الحشرات ومئات النشرات في بنما، بيرو، المكسيك، الإكوادور، والولايات المتحدة، نحن الآن بصدد تطوير نسخة جديدة قابلة للإنتاج لتعميم هذه الأداة المهمة عالميًا. سنناقش تطوير هذا الجهاز في غابات بنما وأهميته لدراسة التنوع البيولوجي عالميًا. *عن المتحدث* يصمم الدكتور آندي كويتميير طرقًا جديدة للتفاعل مع العالم الطبيعي. عمل مع منظمات كبيرة مثل شبكة كرتون نتورك، IDEO، ومعهد سميثسونيان، ودرّس كأستاذ محاضر في جامعة سنغافورة الوطنية، وحتى تم تحويل بحثه إلى سلسلة تلفزيونية (طرافة) بعنوان "Hacking the Wild"، تم توزيعها بواسطة Discovery Networks. في الوقت الحالي، يقضي معظم وقته في العمل التطوعي مع منظمات صغيرة، وقام مؤخرًا بتأسيس ورشة العمل الميدانية Digital Naturalism Laboratories. في غابة جامبوا الاستوائية في بنما، تدمج Dinalab بين العمل الميداني البيولوجي والابتكار التكنولوجي ضمن مجتمع من العلماء والفنيين والمهندسين والفنانين المحليين والدوليين، بالإضافة إلى متخصصين في إعادة تأهيل الحيوانات. ويشغل حاليًا منصب أستاذ مشارك في جامعة واشنطن حيث يقدم الاستشارات للطلاب. **النماذج الأساسية للذكاء الاصطناعي البصري في الزراعة** لقد مكّنت النماذج الأساسية من طريقة جديدة لمعالجة المهام، وذلك بالاستفادة من القدرات الناشئة بطريقة بدون تدريب (zero-shot). في هذا الحديث، سأناقش أحدث الأبحاث المتعلقة بتمكين الذكاء الاصطناعي البصري بطريقة بدون تدريب أو من خلال التخصيص الدقيق (fine-tuning). على وجه التحديد، سأتناول العمل المشترك حول RELOCATE، وهو معيار بسيط لا يتطلب تدريبًا مصممًا لأداء مهمة صعبة تتمثل في تحديد موقع الاستعلام البصري في مقاطع فيديو طويلة. للتخلص من الحاجة إلى تدريب مخصص للمهمة وللتعامل بكفاءة مع مقاطع الفيديو الطويلة، يستفيد RELOCATE من تمثيل قائم على المناطق مستمد من نماذج رؤية مسبقة التدريب. سأناقش أيضًا العمل المشترك المتعلق بتمكين النماذج الكبيرة متعددة الوسائط (MLLMs) من الإجابة الصحيحة على الأوامر التي تتطلب فهمًا شاملاً مكانياً-زمنياً: إذ تعاني النماذج الكبيرة متعددة الوسائط من صعوبة في الإجابة على أوامر تشير إلى 1) بيئة كاملة يمكن لوكيل مزوّد بنموذج MLLM العمل فيها؛ وفي نفس الوقت تشير أيضًا إلى 2) أفعال حدثت حديثًا وتم ترميزها في مقطع فيديو. ومع ذلك، فإن هذا الفهم الشامل المكاني-الزماني مهم للوكلاء الذين يعملون في العالم الحقيقي. ويتضمن حلنا تطوير خط أنابيب مخصص لجمع البيانات وتخصيص نموذج MLLM مجهز بمشعّات لتحسين كل من الفهم المكاني للبيئة والفهم الزمني للملاحظات الأخيرة. *عن المتحدث* [ألكس شوينغ](https://www.linkedin.com/in/alexander-s-0a049258/) هو أستاذ مشارك في جامعة إلينوي في أوربانا-شمباين، يعمل مع طلاب موهوبين في مجالات الذكاء الاصطناعي، والذكاء الاصطناعي التوليدي، والرؤية الحاسوبية. حصل على بكالوريوس الهندسة الكهربائية وهندسة المعلومات من الجامعة التقنية بميونيخ عام 2006 و2008 على التوالي، ونال درجة الدكتوراه في علوم الحاسوب من ETH زيورخ عام 2014. بعد ذلك انضم إلى جامعة تورونتو كزميل باحث حتى عام 2016. تشمل اهتماماته البحثية مجالات الذكاء الاصطناعي، والذكاء الاصطناعي التوليدي، والرؤية الحاسوبية، حيث شارك في تأليف العديد من الأوراق العلمية حول فهم المشهد، وخوارزميات الاستدلال والتعلم، والتعلم العميق، ومعالجة الصور واللغة، والنماذج التوليدية. وقد تم منح أطروحته للدكتوراه ميدالية ETH، وحاز بحث فريقه على جائزة NSF CAREER. **خارج المختبر: كشف الشذوذ في العالم الحقيقي للرؤية الحاسوبية الزراعية** إن كشف الشذوذ يُحدث تغييرًا في التصنيع والمراقبة، لكن ماذا عن الزراعة؟ هل يمكن للذكاء الاصطناعي اكتشاف أمراض النباتات وأضرار الآفات مبكرًا بما يكفي لصنع فرق؟ يوضح هذا الحديث كيف يحدد كشف الشذوذ ويكوّن مواقع مشكلات المحاصيل باستخدام صحة أوراق البن كمثال أساسي. سنبدأ بالنظرية الأساسية، ثم ندرس كيف تكتشف هذه النماذج أضرار الصدأ والحفر في صور الأوراق. تشمل الجلسة سير عمل شاملًا عمليًا باستخدام مجموعة أدوات الرؤية الحاسوبية المفتوحة المصدر FiftyOne، وتغطي تنقيح مجموعة البيانات، واستخراج القطع، وتدريب النموذج، وتصوير النتائج. ستحصل على فهم نظري لكشف الشذوذ في الرؤية الحاسوبية وعلى خبرة عملية في تطبيق هذه التقنيات على التحديات الزراعية وغيرها من المجالات. *عن المتحدث* [بولينا راموس](https://www.linkedin.com/in/paula-ramos-phd/) حاصلة على درجة الدكتوراه في الرؤية الحاسوبية وتعلّم الآلة، ولديها أكثر من 20 عامًا من الخبرة في المجال التكنولوجي. وهي تعمل على تطوير تقنيات هندسية متكاملة جديدة، وبشكل أساسي في مجالات الرؤية الحاسوبية، والروبوتات، وتعلّم الآلة المطبقة على الزراعة، منذ أوائل العقد الأول من القرن الحادي والعشرين في كولومبيا.