انضم إلينا في اليوم الأول من سلسلة الفعاليات الافتراضية للاستماع إلى متحدثين خبراء حول آخر التطورات في مجال التقاطع بين الذكاء الاصطناعي البصري والزراعة. **التاريخ والوقت** 15 أكتوبر الساعة 9 صباحًا بالتوقيت الهادئ **الموقع** افتراضي. [سجّل الدخول عبر Zoom.](https://voxel51.com/events/visual-ai-in-agriculture-october-15-2025) **Paved2Paradise: محاكاة ليدار قابلة للتوسيع لإدراك العالم الحقيقي** غالبًا ما يتطلب تدريب نماذج الإدراك القوية للروبوتات والاستقلالية بيانات ثلاثية الأبعاد ضخمة ومتنوعة. لكن جمع وترميز سحب الليدار من العالم الحقيقي بحجم كبير أمر مكلف وجهد، خاصة عند الحاجة إلى تسميات عالية الجودة. يقدم Paved2Paradise بديلاً اقتصاديًا: خط أنابيب محاكاة ليدار قابل للتوسيع يولد مجموعات بيانات واقعية ومُعلَّمة بالكامل مع الحد الأدنى من الجهد البشري في التسمية. الفكرة الأساسية هي "تحليل العالم الحقيقي" من خلال التقاط مسح الخلفية (مثل الحقول، الطرق، مواقع البناء) ومسح الكائنات (مثل المركبات، الناس، الآلات) بشكل منفصل. من خلال الجمع الذكي بين هذين المصدرَين، يمكن لـ Paved2Paradise تركيب عدد كبير تآزريًا من مشاهد التدريب المتنوعة. يتضمن الخط أنابيب أربع خطوات: (1) جمع مسح ليدار خلفي واسع النطاق، (2) تسجيل مسح عالي الدقة لكائنات الهدف في ظروف خاضعة للرقابة، (3) إدخال الكائنات في الخلفيات مع وضع وحجب يتماشيان مع القوانين الفيزيائية، و(4) محاكاة هندسة الليدار لضمان الواقعية. أظهرت التجارب أن النماذج المدربة على بيانات تم إنشاؤها باستخدام Paved2Paradise تنتقل بكفاءة إلى العالم الحقيقي، وتصل إلى أداء كشف قوي مع جهد ترميز يدوي أقل بكثير مقارنةً بجمع مجموعة البيانات التقليدية. هذه الطريقة ليست فعالة من حيث التكلفة فحسب، بل مرنة أيضًا — مما يسمح للممارسين بسهولة التوسع إلى فئات أو مجالات كائنات جديدة عن طريق استبدال مسحات الخلفية أو الكائنات الجديدة. بالنسبة لممارسي تعلم الآلات العاملين في مجالات الروبوتات، والمركبات المستقلة، أو إدراك الأنظمة الحرجة للسلامة، يبرز Paved2Paradise مسارًا عمليًا نحو توسيع بيانات التدريب دون زيادة التكاليف. وهو يسد الفجوة بين المحاكاة والأداء في العالم الحقيقي، ويتيح التكرار الأسرع والنشر الأكثر موثوقية لنماذج الإدراك. *عن المتحدث* [مايكل أ. ألكورن](https://www.linkedin.com/in/michaelaalcorn/) هو مهندس تعلم آلة أول في شركة John Deere\، حيث يطور نماذج تعلم عميق للإدراك باستخدام الليدار والصور ذات الألوان الثلاثة (RGB) في أنظمة حرجة للسلامة وتعمل في الزمن الحقيقي\. حصل على درجة الدكتوراه في علوم الحاسوب من جامعة أوبرن\، مع أطروحة حول تحسين الرؤية الحاسوبية والشبكات العصبية العميقة الزمكانية\، كما يمتلك تخصصًا فرعيًا للدراسات العليا في الرياضيات\. تم الاستشهاد بأبحاث مايكل من قبل باحثين في DeepMind\، Google\، Meta\، Microsoft\، وOpenAI\، من بين آخرين\، وكانت ورقة \(batter\|pitcher\)2vec الخاصة به فائزة بجائزة في مؤتمر MIT Sloan Sports Analytics Conference عام 2018\. كما ساهم برمجيًا في scikit\-learn وApache Solr\، وقد تم استخدام مستودعات GitHub الخاصة به—التي حصلت مجتمعة على أكثر من 2\,100 نجمة—كمواقع بداية لأكواد بحثية وإنتاجية في العديد من المؤسسات المختلفة\. **MothBox: جهاز رصد حشرات منخفض التكلفة، مفتوح المصدر، وآلي** سيتحدث د. آندي كويتمير عن تصميم أداة علمية جديدة ومثيرة مفتوحة المصدر، وهي Mothbox. إن Mothbox مشروع فائز بجائزة لمراقبة الحشرات على نطاق واسع لأغراض التنوع البيولوجي. إنه جهاز منخفض التكلفة تم تطويره في غابات بنما القاسية، يقوم بتصوير صور عالية الدقة جدًا ثم يقوم تلقائيًا بتحديد مستويات التنوع البيولوجي في الغابات والزراعة. بعد آلاف الملاحظات على الحشرات ومئات النشرات في بنما، بيرو، المكسيك، الإكوادور، والولايات المتحدة، نحن الآن نعمل على تطوير إصدار جديد يمكن تصنيعه لتوزيع هذه الأداة المهمة عالميًا. سنناقش تطوير هذا الجهاز في غابات بنما وأهميته لدراسة التنوع البيولوجي عالميًا. *عن المتحدث* يصمم د. آندي كويتمير طرقًا جديدة للتفاعل مع العالم الطبيعي. عمل مع منظمات كبيرة مثل Cartoon Network، IDEO، وال Smithsonian، ودرّس كأستاذ متفرغ في جامعة سنغافورة الوطنية، وحتى تم تحويل بحثه إلى برنامج تلفزيوني (طرifo) يحمل اسم "Hacking the Wild"، تم توزيعه بواسطة Discovery Networks. حالياً، يقضي معظم وقته في التطوع مع منظمات صغيرة، وقام مؤخرًا بتأسيس مختبر الحرف الرقمية (Digital Naturalism Laboratories)، وهو مكان صناعي في موقع ميداني. في غابة الأمطار في جامبو، بنما، يدمج Dinalab العمل الميداني البيولوجي مع الصناعة التكنولوجية ضمن مجتمع من العلماء والفنانين والمهندسين ومتخصصي إعادة تأهيل الحيوانات المحليين والدوليين. ويشغل حاليًا منصب مستشار طلابي كأستاذ متعاون في جامعة واشنطن. **نماذج الأساس للذكاء الاصطناعي البصري في الزراعة** لقد مكّنت نماذج الأساس من طريقة جديدة لمعالجة المهام، وذلك بالاستفادة من القدرات الناشئة بطريقة بدون تدريب (zero-shot). في هذا الحديث، سأناقش الأبحاث الحديثة حول تمكين الذكاء الاصطناعي البصري بطريقة بدون تدريب، وكذلك عبر عملية ضبط دقيق (fine-tuning). على وجه التحديد، سأناقش العمل المشترك حول RELOCATE، وهو معيار بسيط لا يتطلب تدريبًا مصممًا لأداء مهمة صعبة تتمثل في تحديد موقع الاستعلام البصري في مقاطع فيديو طويلة. للتخلص من الحاجة إلى تدريب خاص بالمهمة ومعالجة مقاطع الفيديو الطويلة بكفاءة، يستفيد RELOCATE من تمثيل قائم على المناطق مستمد من نماذج رؤية مسبقة التدريب. سأناقش أيضًا العمل المشترك حول تمكين نماذج اللغات الكبيرة متعددة الوسائط (MLLMs) من الإجابة الصحيحة على الأوامر التي تتطلب فهمًا شاملاً مكانياً وزمنياً: تعاني النماذج متعددة الوسائط من صعوبة في الإجابة على الأوامر التي تشير إلى 1) بيئة كاملة يمكن لوكيل مزود بـ MLLM العمل فيها؛ وفي نفس الوقت تشير أيضًا إلى 2) أفعال حديثة حدثت للتو ومشفرة في مقطع فيديو. ومع ذلك، فإن هذا الفهم الشامل المكاني والزماني مهم للوكلاء الذين يعملون في العالم الحقيقي. يشمل حلنا تطوير خط أنابيب مخصص لجمع البيانات وضبط دقيق لنموذج MLLM مجهز بمشعاعات لتحسين كل من الفهم المكاني للبيئة والفهم الزمني للملاحظات الحديثة. *عن المتحدث* [ألكس شوينغ](https://www.linkedin.com/in/alexander-s-0a049258/) هو أستاذ مشارك في جامعة إلينوي في أوربانا-شامبين، يعمل مع طلاب موهوبين في مجالات الذكاء الاصطناعي، والذكاء الاصطناعي التوليدي، والرؤية الحاسوبية. حصل على بكالوريوس ودبلومه في الهندسة الكهربائية وتكنولوجيا المعلومات من الجامعة التقنية في ميونيخ عامي 2006 و2008 على التوالي، وحصل على درجة الدكتوراه في علوم الحاسوب من ETH زيورخ عام 2014. وبعد ذلك انضم إلى جامعة تورونتو كزميل باحث حتى عام 2016. تتركز اهتماماته البحثية في مجالات الذكاء الاصطناعي، والذكاء الاصطناعي التوليدي، والرؤية الحاسوبية، حيث شارك في تأليف العديد من الأوراق البحثية في مواضيع فهم المشهد، وخوارزميات الاستدلال والتعلم، والتعلم العميق، ومعالجة الصور واللغة، والنماذج التوليدية. حصلت أطروحته للدكتوراه على ميدالية ETH، وتم منح بحث فريقه جائزة NSF CAREER. **خارج المختبر: كشف الشذوذ في العالم الحقيقي للرؤية الحاسوبية الزراعية** يُحدث كشف الشذوذ تغييرًا في التصنيع والمراقبة، ولكن ماذا عن الزراعة؟ هل يمكن للذكاء الاصطناعي بالفعل اكتشاف أمراض النباتات وأضرار الآفات مبكرًا بما يكفي لتحقيق فرق؟ يوضح هذا الحديث كيف يحدد كشف الشذوذ ويشخص مشكلات المحاصيل باستخدام صحة أوراق القهوة كمثال رئيسي. سنبدأ بالنظرية الأساسية، ثم نفحص كيف تكتشف هذه النماذج صدأ الورقة وأضرار المنجر في صور الأوراق. تشمل الجلسة سير عمل شاملًا عمليًا باستخدام مجموعة أدوات الرؤية الحاسوبية المفتوحة المصدر FiftyOne، وتشمل تنقيح مجموعة البيانات، واستخراج القطع، وتدريب النموذج، وعرض النتائج. ستحصل على فهم نظري لكشف الشذوذ في الرؤية الحاسوبية، بالإضافة إلى خبرة عملية في تطبيق هذه الأساليب على التحديات الزراعية وغيرها من المجالات. *عن المتحدث* [بولينا راموس](https://www.linkedin.com/in/paula-ramos-phd/) تحمل درجة الدكتوراه في الرؤية الحاسوبية وتعلم الآلة، ولديها أكثر من 20 سنة من الخبرة في المجال التكنولوجي. تعمل على تطوير تقنيات هندسية متكاملة مبتكرة، خصوصًا في مجالات الرؤية الحاسوبية، والروبوتات، وتعلم الآلة المطبقة على الزراعة، منذ أوائل العقد الأول من القرن الحادي والعشرين في كولومبيا.