انضم إلينا في اليوم الأول من سلسلة الفعاليات الافتراضية للاستماع إلى خبراء حول آخر التطورات في مجال التقاطع بين الذكاء الاصطناعي البصري والزراعة. **التاريخ والوقت** 15 أكتوبر الساعة 9 صباحًا بالتوقيت الهادئ **المكان** افتراضي. [سجّل الدخول عبر زووم.](https://voxel51.com/events/visual-ai-in-agriculture-october-15-2025) **Paved2Paradise: محاكاة ليدار قابلة للتوسيع لإدراك العالم الحقيقي** غالبًا ما يتطلب تدريب نماذج الإدراك القوية للروبوتات والاستقلالية مجموعات بيانات ضخمة ومتنوعة ثلاثية الأبعاد. ولكن جمع وتصنيف سحب نقاط ليدار من العالم الحقيقي على نطاق واسع أمر مكلفٌ للغاية ويستغرق وقتًا طويلاً، خاصة عند الحاجة إلى تسميات عالية الجودة. يقدم مشروع Paved2Paradise بديلاً اقتصاديًا: وهو خط أنابيب محاكاة ليدار قابل للتوسيع يُنتج مجموعات بيانات واقعية ومصنفة بالكامل مع أقل حد ممكن من الجهد اليدوي في التسمية. الفكرة الأساسية هي "تحليل الواقع" من خلال فصل عمليات التقاط مسح الخلفية (مثل الحقول والطرق ومواقع البناء) عن مسح الكائنات (مثل المركبات والأشخاص والآلات). وبدمج هذين المصدرَين بشكل ذكي، يمكن لـ Paved2Paradise توليد عدد كبير توفيقيًا من مشاهد التدريب المتنوعة. يتضمن خط الأنابيب أربع خطوات: (1) جمع مسح ليدار واسع النطاق للخلفية، (2) تسجيل مسح عالي الدقة لكائنات الهدف في ظروف مضبوطة، (3) إدخال الكائنات في الخلفيات مع وضع وتحجيم يتماشى مع القوانين الفيزيائية، و(4) محاكاة هندسة الليدار لضمان الواقعية. أظهرت التجارب أن النماذج المدربة على بيانات تم إنشاؤها باستخدام Paved2Paradise تنتقل بكفاءة إلى العالم الحقيقي، وتُحقق أداءً قويًا في الكشف مع حاجة أقل بكثير للتسمية اليدوية مقارنةً بطرق جمع البيانات التقليدية. هذه الطريقة ليست فقط فعالة من حيث التكلفة، بل أيضًا مرنة – مما يتيح للممارسين توسيعها بسهولة إلى فئات أو مجالات كائنات جديدة من خلال استبدال مسحات الخلفية أو الكائنات. بالنسبة لممارسي التعلم الآلي العاملين في الروبوتات أو المركبات ذاتية القيادة أو أنظمة الإدراك الحرجة للسلامة، يسلط Paved2Paradise الضوء على طريق عملي نحو توسيع بيانات التدريب دون زيادة التكاليف. كما أنه يسد الفجوة بين الأداء في المحاكاة والأداء في العالم الحقيقي، مما يتيح تكرارًا أسرع ونشرًا أكثر موثوقية لنماذج الإدراك. *عن المتحدث* [مايكل أ. ألْكورن](https://www.linkedin.com/in/michaelaalcorn/) هو مهندس رئيسي للتعلم الآلي في شركة John Deere\، حيث يعمل على تطوير نماذج التعلّم العميق لأنظمة الاستشعار باستخدام ليدار والصور بالألوان الكاملة RGB ضمن أنظمة حرجة للسلامة وتُعمل في الزمن الحقيقي\. حصل على درجة الدكتوراه في علوم الحاسوب من جامعة أوبرن\، وكان موضوع أطروحته تحسين الرؤية الحاسوبية والشبكات العصبية العميقة المكانية-الزمنية\، كما يمتلك تخصصًا فرعيًا دراسيًا في الرياضيات\. وقد استشهد ببحثه باحثون في DeepMind\، Google\، Meta\، Microsoft\، وOpenAI\، من بين آخرين\، كما حاز ورقته البحثية \(batter\|pitcher\)2vec على جائزة في مؤتمر MIT Sloan Sports Analytics Conference عام 2018\. كما ساهم برمجيًا في مكتبتَي scikit\-learn وApache Solr\، وحظيت مستودرات GitHub الخاصة به — التي حصلت مجتمعة على أكثر من 2\,100 نجمة — بأن تكون نقطة انطلاق لأبحاث وأكواد تشغيلية في العديد من المؤسسات المختلفة\. **MothBox: جهاز رصد حشرات منخفض التكلفة ومفتوح المصدر** سيتحدث د. آندي كويتميير عن تصميم أداة علمية مفتوحة المصدر ومثيرة جديدة، Mothbox. يعد Mothbox مشروعًا فائزًا بجائزة لمراقبة الحشرات على نطاق واسع من أجل التنوع البيولوجي. إنه جهاز منخفض التكلفة تم تطويره في الغابات الاستوائية القاسية ببنما، ويقوم بالتقاط صور فائقة الدقة ثم يقوم تلقائيًا بتحديد مستويات التنوع البيولوجي في الغابات والزراعة. بعد آلاف الملاحظات على الحشرات ومئات النشرات في بنما، بيرو، المكسيك، الإكوادور، والولايات المتحدة، نحن الآن نعمل على تطوير نسخة جديدة قابلة للتصنيع لتعميم هذه الأداة المهمة في جميع أنحاء العالم. سنناقش تطوير هذا الجهاز في غابات بنما ودوره المهم في دراسة التنوع البيولوجي عالميًا. *عن المتحدث* يصمم د. آندي كويتميير طرقًا جديدة للتفاعل مع العالم الطبيعي. عمل مع منظمات كبيرة مثل شبكة كرتون نتورك، IDEO، ومعهد سميثسونيان، ودرّس كبروفيسور متفرغ في الجامعة الوطنية السنغافورية، وحتى تم تحويل بحثه إلى برنامج تلفزيوني (ساخر) بعنوان "اختراق البرية"، تم توزيعه عبر شبكات ديسكفري. حاليًا، يقضي معظم وقته في العمل التطوعي مع منظمات صغيرة، وقام مؤخرًا بتأسيس ورشة عمل المختبرات الميدانية، Digital Naturalism Laboratories. في غابة جامبوا الاستوائية ببنما، تجمع Dinalab بين العمل الميداني البيولوجي والتصميم التكنولوجي ضمن مجتمع من العلماء والفنانين والمهندسين ومحسنّي الحيوانات المحليين والدوليين. وحاليًا، يُقدّم الاستشارات للطلاب كبروفيسور متعاون في جامعة واشنطن. **النماذج الأساسية للذكاء الاصطناعي البصري في الزراعة** لقد مكّنت النماذج الأساسية من طريقة جديدة لمعالجة المهام، وذلك بالاستفادة من القدرات الناشئة بطريقة بدون تدريب (zero-shot). في هذا الحديث، سأناقش أحدث الأبحاث المتعلقة بتمكين الذكاء الاصطناعي البصري بطريقة بدون تدريب ومن خلال التعديل الدقيق (fine-tuning). على وجه التحديد، سأتناول بحثًا مشتركًا حول نظام RELOCATE، وهو معيار بسيط لا يتطلب تدريبًا مخصصًا للمهمة، مصمم لأداء مهمة صعبة وهي تحديد موقع الاستعلام البصري في مقاطع فيديو طويلة. من أجل التخلص من الحاجة إلى تدريب خاص بكل مهمة والتعامل بكفاءة مع مقاطع الفيديو الطويلة، يستفيد RELOCATE من تمثيل قائم على المناطق مستمد من نماذج بصرية مُدرّبة مسبقًا. كما سأناقش بحثًا مشتركًا حول تمكين النماذج الكبيرة متعددة الوسائط (MLLMs) من الإجابة الصحيحة على الأوامر التي تتطلب فهمًا شاملاً مكانياً-زمنياً: فالنماذج الكبيرة متعددة الوسائط تعاني من صعوبة في الإجابة على أوامر تشير إلى 1) البيئة بأكملها التي يمكن لوكيل مزوّد بنموذج MLLM العمل فيها؛ وفي نفس الوقت تشير أيضًا إلى 2) الإجراءات الأخيرة التي حدثت للتو والمُشفّرة في مقطع فيديو. ومع ذلك، فإن هذا الفهم الشامل المكاني-الزماني مهم للوكلاء الذين يعملون في العالم الحقيقي. وتشمل حلولنا تطوير خط أنابيب مخصص لجمع البيانات وتعديل نموذج MLLM مجهز بمشعّات لتحسين كل من الفهم المكاني للبيئة والفَهم الزمني للمشاهدات الأخيرة. *عن المتحدث* [ألكس شوينغ](https://www.linkedin.com/in/alexander-s-0a049258/) هو أستاذ مشارك في جامعة إلينوي في أوربانا-شامبين، يعمل مع طلاب موهوبين في مجالات الذكاء الاصطناعي، والذكاء الاصطناعي التوليدي، والرؤية الحاسوبية. حصل على بكالوريوس ودبلومه في الهندسة الكهربائية وتكنولوجيا المعلومات من الجامعة التقنية في ميونيخ عامي 2006 و2008 على التوالي، وحصل على درجة الدكتوراه في علوم الحاسوب من ETH زيورخ في عام 2014. بعد ذلك، انضم إلى جامعة تورونتو كزميل ما بعد الدكتوراه حتى عام 2016. تتمحور اهتماماته البحثية حول الذكاء الاصطناعي، والذكاء الاصطناعي التوليدي، والرؤية الحاسوبية، حيث شارك في تأليف العديد من الأوراق البحثية في مجالات فهم المشهد، وخوارزميات الاستدلال والتعلم، والتعلم العميق، ومعالجة الصور واللغة، والنماذج التوليدية. وحازت أطروحته للدكتوراه على ميدالية ETH، وتم تكريم بحث فريقه بجائزة NSF CAREER. **خارج المختبر: كشف الشذوذ في العالم الحقيقي للرؤية الحاسوبية الزراعية** يُحدث كشف الشذوذ ثورة في التصنيع والمراقبة، ولكن ماذا عن الزراعة؟ هل يمكن للذكاء الاصطناعي اكتشاف أمراض النباتات وأضرار الآفات مبكرًا بما يكفي لتحقيق فرق؟ يوضح هذا الحديث كيف يحدد كشف الشذوذ مشكلات المحاصيل ويعزلها، باستخدام صحة أوراق البن كمثال أساسي. سنبدأ بالنظرية الأساسية، ثم ندرس كيف تكتشف هذه النماذج صدأ الورقة وأضرار المنجل في صور الأوراق. تتضمن الجلسة سير عمل شاملًا عمليًا باستخدام مجموعة أدوات الرؤية الحاسوبية مفتوحة المصدر FiftyOne، تشمل تنظيم مجموعة البيانات، واستخراج القطع، وتدريب النموذج، وعرض النتائج. ستحصل على فهم نظري لكشف الشذوذ في الرؤية الحاسوبية، بالإضافة إلى خبرة عملية في تطبيق هذه التقنيات على التحديات الزراعية وغيرها من المجالات. *عن المتحدث* [باولا راموس](https://www.linkedin.com/in/paula-ramos-phd/) تحمل درجة الدكتوراه في الرؤية الحاسوبية والتعلم الآلي، ولديها أكثر من 20 عامًا من الخبرة في المجال التكنولوجي. تعمل على تطوير تقنيات هندسية متكاملة جديدة، بشكل رئيسي في مجالات الرؤية الحاسوبية، والروبوتات، والتعلم الآلي المطبّق على الزراعة، منذ أوائل العقد الأول من القرن الحادي والعشرين في كولومبيا.