انضم إلينا في اليوم الأول من سلسلة الفعاليات الافتراضية للاستماع إلى متحدثين خبراء حول أحدث التطورات في مجال التقاطع بين الذكاء الاصطناعي البصري والزراعة. **التاريخ والوقت** 15 أكتوبر الساعة 9 صباحًا بالتوقيت الهادئ **المكان** افتراضي. [سجّل الدخول إلى Zoom.](https://voxel51.com/events/visual-ai-in-agriculture-october-15-2025) **Paved2Paradise: محاكاة ليدار قابلة للتوسيع من أجل الإدراك في العالم الحقيقي** غالبًا ما يتطلب تدريب نماذج إدراك قوية للروبوتات والقيادة الذاتية بيانات ضخمة ومتنوعة ثلاثية الأبعاد. لكن جمع وتصنيف سحب بيانات ليدار من العالم الحقيقي بحجم كبير أمر مكلف وطويل جدًا، خاصة عند الحاجة إلى تسميات عالية الجودة. يقدم Paved2Paradise بديلًا اقتصاديًا: وهو خط أنابيب محاكاة ليدار قابل للتوسيع لإنتاج بيانات واقعية ومُصنَّفة بالكامل مع الحد الأدنى من الجهد البشري في التصنيف. الفكرة الأساسية هي "تحليل العالم الحقيقي" من خلال التقاط مسح خلفيات منفصلة (مثل الحقول، الطرق، مواقع البناء) ومسح كائنات منفصلة (مثل المركبات، الأشخاص، الآلات). من خلال دمج هذين المصدرَين بذكاء، يمكن لـ Paved2Paradise توليد عدد كبير من مشاهد التدريب المتنوعة. يتضمن خط الأنابيب أربع خطوات: (1) جمع مسح ليدار خلفي واسع النطاق، (2) تسجيل مسح عالي الدقة للكائنات المستهدفة في ظروف خاضعة للتحكم، (3) إدخال الكائنات في الخلفيات مع وضع وحجب يتماشى مع القوانين الفيزيائية، و(4) محاكاة هندسة الليدار لضمان الواقعية. أظهرت التجارب أن النماذج المدربة على بيانات تم إنشاؤها باستخدام Paved2Paradise تنتقل بفعالية إلى العالم الحقيقي، وتحقق أداءً قويًا في الكشف مع جهد أقل بكثير في التصنيف اليدوي مقارنةً بطرق جمع البيانات التقليدية. هذه الطريقة ليست فعالة من حيث التكلفة فحسب، بل مرنة أيضًا—مما يسمح للممارسين بسهولة التوسع إلى فئات أو مجالات كائنات جديدة من خلال استبدال مسح الخلفية أو الكائنات بمسوحات جديدة. بالنسبة لممارسي التعلم الآلي العاملين في مجالات الروبوتات، المركبات الذاتية القيادة، أو أنظمة الإدراك الحساسة للسلامة، يبرز Paved2Paradise مسارًا عمليًا نحو توسيع بيانات التدريب دون توسيع التكاليف. وهو يُقلِّص الفجوة بين الأداء في المحاكاة والأداء في العالم الحقيقي، مما يمكّن من التكرار الأسرع والنشر الأكثر موثوقية لنماذج الإدراك. *عن المتحدث* [مايكل أ. ألكورن](https://www.linkedin.com/in/michaelaalcorn/) هو مهندس رئيسي للتعلم الآلي في شركة John Deere\، حيث يطور نماذج تعلّم عميق للإدراك باستخدام الليدار والصورة الملونة (RGB) في أنظمة تتطلب السلامة وتكون في الزمن الحقيقي\. حصل على درجة الدكتوراه في علوم الحاسوب من جامعة أوبرن\، مع أطروحة حول تحسين رؤية الحاسوب والشبكات العصبية العميقة الزمانية-المكانية\، ويحمل أيضًا تخصصًا فرعيًا في الرياضيات\. تم الاستشهاد بأبحاث مايكل من قبل باحثين في DeepMind\، Google\، Meta\، Microsoft\، وOpenAI\، من بين آخرين\، وكانت ورقة \(batter\|pitcher\)2vec الخاصة به فائزة بجائزة في مؤتمر MIT Sloan Sports Analytics Conference 2018\. كما ساهم برمجيًا في scikit\-learn وApache Solr\، وتم استخدام مستودعات GitHub الخاصة به—التي حصلت مجتمعة على أكثر من 2\,100 نجمة—كمصدر أولي لأبحاث ورموز إنتاجية في العديد من المؤسسات المختلفة\. **MothBox: جهاز رصد حشرات منخفض التكلفة، مفتوح المصدر، وآلي** سيتحدث الدكتور آندي كويتميير عن تصميم أداة علمية مفتوحة المصدر جديدة ومثيرة، تُسمى Mothbox. يعد Mothbox مشروعًا فائزًا بالجوائز لمراقبة الحشرات على نطاق واسع من أجل التنوع البيولوجي. وهو جهاز منخفض التكلفة تم تطويره في الغابات القاسية ببنما، ويُجري صورًا عالية الدقة جدًا ثم يقوم تلقائيًا بتحديد مستويات التنوع البيولوجي في الغابات والزراعة. بعد آلاف الملاحظات على الحشرات ومئات عمليات النشر في بنما، بيرو، المكسيك، الإكوادور، والولايات المتحدة، نحن الآن نُطوّر إصدارًا جديدًا قابلاً للتصنيع لنشارك هذه الأداة المهمة في جميع أنحاء العالم. سنناقش تطوير هذا الجهاز في غابات بنما وأهميته في دراسة التنوع البيولوجي عالميًا. *عن المتحدث* يصمم الدكتور آندي كويتميير طرقًا جديدة للتفاعل مع العالم الطبيعي. عمل مع منظمات كبيرة مثل شبكة كرتون نتورك، وIDEO، ومعهد سميثسونيان، ودرّس كأستاذ أكاديمي في جامعة سنغافورة الوطنية، وتحولت أبحاثه حتى إلى سلسلة تلفزيونية (طرافة) بعنوان "اختراق البرية"، تم توزيعها عبر شبكة ديسكفري. حاليًا، يقضي معظم وقته في التطوع مع منظمات صغيرة، ومؤخرًا أسس مختبر الحرف الرقمية للطبيعة (Digital Naturalism Laboratories)، وهو فضاء لصنع الأدوات في موقع بحثي. في غابة مطر غامبوا ببنما، يدمج Dinalab العمل الميداني البيولوجي مع الصناعة التكنولوجية ضمن مجتمع من العلماء والفنانين والمهندسين ومتخصصي إعادة تأهيل الحيوانات المحليين والدوليين. كما يُقدّم حاليًا الاستشارات للطلاب بصفته أستاذًا مرتبطًا في جامعة واشنطن. **النماذج الأساسية للذكاء الاصطناعي البصري في الزراعة** لقد مكّنت النماذج الأساسية من طريقة جديدة لمعالجة المهام، وذلك بالاستفادة من القدرات الناشئة بطريقة بدون تدريب (zero-shot). في هذا الحديث، سأناقش أبحاثًا حديثة حول تمكين الذكاء الاصطناعي البصري بطريقة بدون تدريب (zero-shot) أو عبر التعديل الدقيق (fine-tuning). على وجه التحديد، سأتناول عملًا مشتركًا حول RELOCATE، وهو معيار بسيط لا يتطلب تدريبًا مصممًا لأداء مهمة صعبة تتمثل في تحديد موقع الاستعلامات البصرية في مقاطع فيديو طويلة. للتخلص من الحاجة إلى تدريب خاص بالمهمة ومعالجة مقاطع الفيديو الطويلة بكفاءة، يستفيد RELOCATE من تمثيل مبني على المناطق مستمدًا من نماذج بصرية مُدرّبة مسبقًا. سأناقش أيضًا عملًا مشتركًا حول تمكين نماذج اللغة الكبيرة متعددة الوسائط (MLLMs) من الإجابة الصحيحة على المطالبات التي تتطلب فهمًا شموليًا مكانزمنيًا: فنماذج MLLMs تجد صعوبة في الإجابة على مطالبات تشير إلى 1) البيئة بأكملها التي يمكن لوكيل مزوّد بنموذج MLLM العمل فيها؛ وتشير في الوقت نفسه إلى 2) الإجراءات الأخيرة التي حدثت للتو وتم ترميزها في مقطع فيديو. ومع ذلك، فإن هذا الفهم الشامل المكانزمني مهم للوكلاء العاملين في العالم الحقيقي. يشمل حلنا تطوير خط أنابيب مخصص لجمع البيانات وتعديل نموذج MLLM مزوّد بمشعّات لتحسين الفهم المكاني للبيئة والفهم الزمني للملاحظات الحديثة. *عن المتحدث* [أليكس شوينغ](https://www.linkedin.com/in/alexander-s-0a049258/) هو أستاذ مشارك في جامعة إلينوي في أوربانا-شامبين، يعمل مع طلاب موهوبين في مجالات الذكاء الاصطناعي، والذكاء الاصطناعي التوليدي، ورؤية الحاسوب. حصل على درجة البكالوريوس والدبلوم في الهندسة الكهربائية وتكنولوجيا المعلومات من الجامعة التقنية في ميونيخ عامي 2006 و2008 على التوالي، وحصل على درجة الدكتوراه في علوم الحاسوب من معهد إيث زوريخ عام 2014. بعد ذلك، انضم إلى جامعة تورونتو كزميل ما بعد الدكتوراه حتى عام 2016. تتمحور اهتماماته البحثية في مجالات الذكاء الاصطناعي، والذكاء الاصطناعي التوليدي، ورؤية الحاسوب، حيث شارك في تأليف العديد من الأوراق البحثية حول مواضيع في فهم السيناريو، وخوارزميات الاستدلال والتعلم، والتعلم العميق، ومعالجة الصور واللغة، والنماذج التوليدية. حصلت أطروحته للدكتوراه على ميدالية ETH، وحاز بحث فريقه على جائزة NSF CAREER. **ما وراء المختبر: كشف الشذوذ في العالم الحقيقي للرؤية الحاسوبية الزراعية** يُحدث كشف الشذوذ تحولًا في التصنيع والمراقبة، ولكن ماذا عن الزراعة؟ هل يمكن للذكاء الاصطناعي اكتشاف أمراض النباتات وأضرار الآفات مبكرًا بما يكفي لصنع فرق؟ يُظهر هذا الحديث كيف يُمكن لكشف الشذوذ تحديد مشكلات المحاصيل وتحديدها المكاني باستخدام صحة أوراق القهوة كمثالنا الرئيسي. سنبدأ بنظرية أساسية، ثم نفحص كيف تكتشف هذه النماذج صدأ الورقة وأضرار العامل في الصور. تتضمن الجلسة سير عمل عمليًا شاملاً باستخدام مجموعة أدوات الرؤية الحاسوبية المفتوحة المصدر FiftyOne، تغطي إدارة مجموعة البيانات، واستخراج القطع، وتدريب النموذج، وتصور النتائج. ستحصل على فهم نظري لكشف الشذوذ في الرؤية الحاسوبية، بالإضافة إلى خبرة عملية في تطبيق هذه التقنيات على التحديات الزراعية وحقول أخرى. *عن المتحدث* [بوليتا راموس](https://www.linkedin.com/in/paula-ramos-phd/) حاصلة على درجة الدكتوراه في الرؤية الحاسوبية والتعلم الآلي، ولديها أكثر من 20 عامًا من الخبرة في المجال التكنولوجي. وهي تعمل على تطوير تقنيات هندسية متكاملة جديدة، خاصة في مجالات الرؤية الحاسوبية، والروبوتات، والتعلم الآلي المطبّق على الزراعة، منذ أوائل العقد الأول من القرن الحادي والعشرين في كولومبيا.