انضم إلينا في اليوم الأول من سلسلة فعاليات افتراضية للاستماع إلى خبراء حول آخر التطورات في مجال التقاطع بين الذكاء الاصطناعي البصري والزراعة. **التاريخ والوقت** 15 أكتوبر الساعة 9 صباحًا بالتوقيت الهادئ **الموقع** افتراضي. [سجّل الدخول عبر زووم.](https://voxel51.com/events/visual-ai-in-agriculture-october-15-2025) **Paved2Paradise: محاكاة ليدار قابلة للتوسيع لإدراك العالم الحقيقي** غالبًا ما يتطلب تدريب نماذج إدراك قوية للروبوتات والاستقلالية بيانات ضخمة ومتنوعة ثلاثية الأبعاد. ولكن جمع وتصنيف سحب نقاط ليدار من العالم الحقيقي بحجم كبير أمرٌ مكلفٌ ويتطلب وقتًا طويلاً، خاصة عندما تكون العلامات عالية الجودة ضرورية. يقدم Paved2Paradise بديلاً اقتصاديًا: خط أنابيب محاكاة ليدار قابل للتوسيع يُنتج بيانات واقعية ومصنفة بالكامل مع أقل جهد بشري في التصنيف. الفكرة الأساسية هي "تحليل الواقع" من خلال التقاط عمليات مسح الخلفية (مثل الحقول، الطرق، مواقع البناء) ومسح الكائنات (مثل المركبات، الأشخاص، الآلات) بشكل منفصل. ومن خلال الجمع الذكي بين هذين المصدرَين، يمكن لـ Paved2Paradise تركيب مجموعة كبيرة جدًا من مشاهد التدريب المتنوعة. يتضمن الخط الأنابيب أربع خطوات: (1) جمع عمليات مسح ليدار واسعة النطاق للخلفية، (2) تسجيل عمليات مسح عالية الدقة لكائنات مستهدفة في ظروف خاضعة للرقابة، (3) إدخال الكائنات ضمن الخلفيات مع وضع وتغطية متسقة من حيث الفيزياء، (4) محاكاة هندسة الليدار لضمان الواقعية. أظهرت التجارب أن النماذج المدربة على بيانات تم إنشاؤها بواسطة Paved2Paradise تنتقل بكفاءة إلى العالم الحقيقي، وتحقق أداءً قويًا في الكشف مع حاجة أقل بكثير للتصنيف اليدوي مقارنةً بجمع البيانات التقليدي. هذه الطريقة ليست فعالة من حيث التكلفة فحسب، بل مرنة أيضًا — مما يسمح للممارسين بسهولة التوسع إلى فئات كائنات جديدة أو مجالات جديدة عن طريق استبدال مسحات الخلفية أو الكائنات بمسحات جديدة. بالنسبة لممارسي التعلم الآلي العاملين في الروبوتات، أو المركبات ذاتية القيادة، أو أنظمة الإدراك الحرجة للسلامة، يبرز Paved2Paradise مسارًا عمليًا نحو توسيع بيانات التدريب دون زيادة التكاليف. وهو يسد الفجوة بين المحاكاة والأداء في العالم الحقيقي، ما يتيح تكرارًا أسرع ونشرًا أكثر موثوقية لنماذج الإدراك. *عن المتحدث* [مايكل أ. ألكورن](https://www.linkedin.com/in/michaelaalcorn/) هو مهندس رئيسي للتعلم الآلي في شركة جون دير، حيث يعمل على تطوير نماذج التعلّم العميق للإدراك باستخدام بيانات الليدار وRGB في أنظمة حرجة للسلامة وتعمل في الزمن الحقيقي. حصل على درجة الدكتوراه في علوم الحاسوب من جامعة أوبرن، مع أطروحة حول تحسين الرؤية الحاسوبية والشبكات العصبية العميقة المكانية-الزمنية، ويحمل أيضًا تخصصًا فرعيًا في الرياضيات. تم الاستشهاد بأبحاث مايكل من قبل باحثين في DeepMind، Google، Meta، Microsoft، وOpenAI، من بين آخرين، وكانت ورقة \(batter\|pitcher\)2vec الخاصة به فائزة بجائزة في مؤتمر MIT Sloan Sports Analytics Conference عام 2018. كما ساهم برمجيًا في scikit\-learn وApache Solr، وقد استخدمت مستودرات GitHub الخاصة به—التي حصلت مجتمعة على أكثر من 2\,100 نجمة—كمحطات انطلاق لأبحاث وأكواد إنتاجية في العديد من المؤسسات المختلفة. **MothBox: جهاز رصد حشرات منخفض التكلفة ومفتوح المصدر** سيتحدث الدكتور آندي كويتميير عن تصميم أداة علمية مثيرة جديدة مفتوحة المصدر، Mothbox. إن Mothbox مشروع فائز بجائزة لمراقبة الحشرات على نطاق واسع لأغراض التنوع البيولوجي. إنه جهاز منخفض التكلفة تم تطويره في غابات بنما القاسية، ويقوم بتصوير صور عالية الدقة جدًا ثم يقوم تلقائيًا بتحديد مستويات التنوع البيولوجي في الغابات والزراعة. بعد آلاف الملاحظات على الحشرات ومئات النشرات في بنما، بيرو، المكسيك، الإكوادور، والولايات المتحدة، نحن الآن نعمل على تطوير نسخة جديدة قابلة للإنتاج لتعميم هذه الأداة المهمة عالميًا. سنناقش تطوير هذا الجهاز في غابات بنما وأهميته لدراسة التنوع البيولوجي عالميًا. *عن المتحدث* يصمم الدكتور آندي كويتميير طرقًا جديدة للتفاعل مع العالم الطبيعي. عمل مع منظمات كبيرة مثل Cartoon Network وIDEO وSmithsonian، ودرّس كأستاذ محاضر في جامعة سنغافورة الوطنية، وحتى تحول بحثه إلى برنامج تلفزيوني (طرifo) باسم "Hacking the Wild" تم توزيعه عبر Discovery Networks. حاليًا، يقضي معظم وقته في العمل التطوعي مع منظمات صغيرة، وقام مؤخرًا بتأسيس مختبر للحرف اليدوية في موقع ميداني يُدعى Digital Naturalism Laboratories. في غابة الأمطار في جامبوا ببنما، يدمج Dinalab العمل الميداني البيولوجي مع الصناعة التكنولوجية ضمن مجتمع من العلماء والفنانين والمهندسين ومُنقذي الحيوانات المحليين والدوليين. وحاليًا، يُقدّم الاستشارات للطلاب كبروفيسور مشارك في جامعة واشنطن. **النماذج الأساسية للذكاء الاصطناعي البصري في الزراعة** لقد مكّنت النماذج الأساسية من طريقة جديدة لمعالجة المهام، وذلك بالاستفادة من القدرات الناشئة بطريقة بدون تدريب (zero-shot). في هذا الحديث، سأناقش أحدث الأبحاث المتعلقة بتمكين الذكاء الاصطناعي البصري بطريقة بدون تدريب أو من خلال الضبط الدقيق. على وجه التحديد، سأتناول عملًا مشتركًا حول RELOCATE، وهو خط أساسي بسيط لا يتطلب تدريبًا مصممًا لأداء مهمة صعبة وهي تحديد موقع الاستعلام البصري في مقاطع فيديو طويلة. للتخلص من الحاجة إلى تدريب خاص بالمهمة ومعالجة مقاطع الفيديو الطويلة بكفاءة، يستفيد RELOCATE من تمثيل قائم على المناطق مستمد من نماذج بصرية مُدرّبة مسبقًا. كما سأناقش عملًا مشتركًا حول تمكين نماذج اللغات الكبيرة متعددة الوسائط (MLLMs) من الإجابة الصحيحة على الأوامر التي تتطلب فهمًا شاملاً مكانيًا-زمانيًا: تواجه النماذج متعددة الوسائط صعوبة في الإجابة على أوامر تشير إلى 1) بيئة كاملة يمكن لوكيل مزود بـ MLLM العمل فيها؛ وفي الوقت نفسه تشير أيضًا إلى 2) إجراءات حدثت حديثًا وتم ترميزها في مقطع فيديو. لكن مثل هذا الفهم الشامل المكاني-الزماني مهم للوكلاء العاملين في العالم الحقيقي. يشمل حلنا تطوير خط أنابيب مخصص لجمع البيانات والضبط الدقيق لنموذج MLLM مجهز بمشعّات لتحسين كل من الفهم المكاني للبيئة والفهم الزمني للملاحظات الحديثة. *عن المتحدث* [أليكس شوينغ](https://www.linkedin.com/in/alexander-s-0a049258/) هو أستاذ مشارك في جامعة إلينوي في أوربانا-شامبين، يعمل مع طلاب موهوبين في مجالات الذكاء الاصطناعي، والذكاء الاصطناعي التوليدي، والرؤية الحاسوبية. حصل على بكالوريوس الهندسة الكهربائية وهندسة المعلومات والتكنولوجيا من الجامعة التقنية بميونيخ عام 2006 و2008 على التوالي، وحصل على درجة الدكتوراه في علوم الحاسوب من ETH زيورخ عام 2014. بعد ذلك انضم إلى جامعة تورونتو كزميل باحث حتى عام 2016. تتركز اهتماماته البحثية في مجالات الذكاء الاصطناعي، والذكاء الاصطناعي التوليدي، والرؤية الحاسوبية، حيث شارك في تأليف العديد من الأوراق البحثية في مواضيع تشمل فهم السيناريو، وخوارزميات الاستنتاج والتعلم، والتعلم العميق، وتجهيز الصور واللغة، والنماذج التوليدية. تم منح أطروحته للدكتوراه ميدالية ETH، وحاز بحث فريقه على جائزة NSF CAREER. **خارج المختبر: كشف الشذوذ في العالم الحقيقي للرؤية الحاسوبية الزراعية** يُحدث كشف الشذوذ ثورة في التصنيع والمراقبة، ولكن ماذا عن الزراعة؟ هل يمكن للذكاء الاصطناعي اكتشاف أمراض النباتات وأضرار الآفات مبكرًا بما يكفي لتحقيق فرق؟ يوضح هذا الحديث كيف يحدد كشف الشذوذ ويحلل مشكلات المحاصيل باستخدام صحة أوراق البن كمثال رئيسي. سنبدأ بالنظرية الأساسية، ثم ندرس كيف تكتشف هذه النماذج الصدأ وأضرار المنّ في صور الأوراق. تشمل الجلسة سير عمل شاملًا عمليًا باستخدام أدوات FiftyOne مفتوحة المصدر للرؤية الحاسوبية، وتشمل إدارة مجموعة البيانات، واستخراج القطع، وتدريب النموذج، وعرض النتائج. ستحصل على فهم نظري لكشف الشذوذ في الرؤية الحاسوبية، بالإضافة إلى تجربة عملية في تطبيق هذه التقنيات على التحديات الزراعية وغيرها من المجالات. *عن المتحدث* [باولا راموس](https://www.linkedin.com/in/paula-ramos-phd/) تحمل درجة الدكتوراه في الرؤية الحاسوبية والتعلم الآلي، ولديها أكثر من 20 سنة من الخبرة في المجال التكنولوجي. تعمل منذ أوائل العقد الأول من القرن الحادي والعشرين في كولومبيا على تطوير تقنيات هندسية متكاملة جديدة، تركز أساسًا على الرؤية الحاسوبية، والروبوتات، والتعلم الآلي المطبقة في الزراعة.