انضم إلينا في اليوم الأول من سلسلة الفعاليات الافتراضية للاستماع إلى خبراء حول أحدث التطورات في مجال التقاء الذكاء الاصطناعي البصري بالزراعة. **التاريخ والوقت** 15 أكتوبر الساعة 9 صباحًا بالتوقيت الهادئ **المكان** افتراضي. [سجّل الدخول عبر زووم.](https://voxel51.com/events/visual-ai-in-agriculture-october-15-2025) **Paved2Paradise: محاكاة ليدار قابلة للتوسيع لإدراك العالم الحقيقي** غالبًا ما يتطلب تدريب نماذج الإدراك القوية للروبوتات والاستقلالية بيانات ضخمة ومتنوعة ثلاثية الأبعاد. ولكن جمع وتصنيف سحب نقاط ليدار من العالم الحقيقي على نطاق واسع أمر مكلف وجهد كبير، خاصة عند الحاجة إلى تسميات عالية الجودة. يقدم مشروع Paved2Paradise بديلاً اقتصاديًا: وهو خط أنابيب محاكاة ليدار قابل للتوسيع يُنتج بيانات واقعية ومصنفة تمامًا مع الحد الأدنى من الجهد البشري في التسمية. الفكرة الأساسية هي "تحليل الواقع" من خلال التقاط مسح الخلفيات (مثل الحقول، الطرق، مواقع البناء) ومسح الكائنات (مثل المركبات، الأشخاص، الآلات) بشكل منفصل. وبدمج هذين المصدرَين بذكاء، يمكن لـ Paved2Paradise توليد مجموعة كبيرة جدًا من مشاهد التدريب المتنوعة. يتضمن خط الأنابيب أربع خطوات: (1) جمع مسح ليدار واسع النطاق للخلفيات، (2) تسجيل مسح عالي الدقة لكائنات مستهدفة في ظروف خاضعة للتحكم، (3) إدخال الكائنات داخل الخلفيات مع وضع وحجب يتماشيان مع القوانين الفيزيائية، و(4) محاكاة هندسة الليدار لضمان الواقعية. أظهرت التجارب أن النماذج المدربة على بيانات تم إنشاؤها بواسطة Paved2Paradise تنتقل بكفاءة إلى العالم الحقيقي، وتُحقق أداءً قويًا في الكشف مع حاجة أقل بكثير للتصنيف اليدوي مقارنةً بجمع البيانات التقليدي. هذه الطريقة ليست فقط فعالة من حيث التكلفة، بل مرنة أيضًا — مما يتيح للممارسين توسيعها بسهولة إلى فئات كائنات جديدة أو مجالات جديدة عن طريق استبدال مسحات الخلفية أو الكائنات. بالنسبة لممارسي تعلم الآلة العاملين في الروبوتات، المركبات المستقلة، أو نظم الإدراك الحرجة للسلامة، يبرز Paved2Paradise مسارًا عمليًا نحو توسيع بيانات التدريب دون زيادة التكاليف. كما يسد الفجوة بين المحاكاة والأداء في العالم الحقيقي، ويتيح تكرارًا أسرع ونشرًا أكثر موثوقية لنماذج الإدراك. *عن المتحدث* [مايكل أ. ألكورن](https://www.linkedin.com/in/michaelaalcorn/) هو مهندس رئيسي في تعلم الآلة في شركة جون دير، حيث يطور نماذج التعلم العميق للإدراك باستخدام ليدار وRGB لأنظمة حرجة للسلامة وتعمل في الزمن الحقيقي. حصل على درجة الدكتوراه في علوم الحاسوب من جامعة أوبرن، مع أطروحة حول تحسين الرؤية الحاسوبية والشبكات العصبية العميقة المكانية-الزمنية، ويحمل أيضًا تخصصًا فرعيًا في الرياضيات. تم الاستشهاد بأبحاث مايكل من قبل باحثين في DeepMind وGoogle وMeta وMicrosoft وOpenAI وغيرهم، وكانت ورقة \(batter\|pitcher\)2vec الخاصة به فائزة بجائزة في مؤتمر MIT Sloan Sports Analytics 2018. كما ساهم برمجيًا في scikit\-learn وApache Solr، وحظيت مستودرات GitHub الخاصة به—التي حصلت مجتمعة على أكثر من 2100 نجمة—بأن تكون نقطة انطلاق لأبحاث وأكواد إنتاجية في العديد من المؤسسات المختلفة. **MothBox: جهاز رصد آفات منخفض التكلفة ومفتوح المصدر** سيتحدث الدكتور أندي كويتميير عن تصميم أداة علمية مفتوحة المصدر جديدة ومثيرة، Mothbox. إن Mothbox هو مشروع فائز بجائزة لمراقبة واسعة النطاق للحشرات من أجل التنوع البيولوجي. إنه جهاز منخفض التكلفة تم تطويره في غابات بنما القاسية، ويأخذ صورًا فائقة الدقة ثم يقوم تلقائيًا بتحديد مستويات التنوع البيولوجي في الغابات والزراعة. بعد آلاف الملاحظات الحشرية ومئات النشرات في بنما، بيرو، المكسيك، الإكوادور، والولايات المتحدة، نحن الآن نعمل على تطوير نسخة جديدة قابلة للتصنيع لنشارك هذه الأداة المهمة عالميًا. سنناقش تطوير هذا الجهاز في غابات بنما وأهميته لدراسة التنوع البيولوجي عالميًا. *عن المتحدث* يصمم الدكتور أندي كويتميير طرقًا جديدة للتفاعل مع العالم الطبيعي. عمل مع منظمات كبيرة مثل شبكة كرتون نتورك وIDEO وسميثسونيان، ودرّس كأستاذ أكاديمي في جامعة سنغافورة الوطنية، وحتى تم تحويل بحثه إلى سلسلة تلفزيونية (مضحكة) بعنوان "Hacking the Wild"، تم توزيعها بواسطة Discovery Networks. حالياً، يقضي معظم وقته في العمل التطوعي مع منظمات صغيرة، وقام مؤخرًا بتأسيس مختبر الحرف الرقمية (Digital Naturalism Laboratories)، وهو فضاء لصناع الأجهزة العلمية في المواقع الميدانية. في غابة جامبوا المطيرة في بنما، يدمج Dinalab العمل الميداني البيولوجي مع الصناعة التكنولوجية ضمن مجتمع من العلماء والفنيين والمهندسين والفنانين المحليين والدوليين، بالإضافة إلى متخصصين في إعادة تأهيل الحيوانات. ويشغل حاليًا منصب أستاذ متعاون في جامعة واشنطن، حيث يقدم الاستشارات للطلاب. **النماذج الأساسية للذكاء الاصطناعي البصري في الزراعة** لقد مكّنت النماذج الأساسية من طريقة جديدة لمعالجة المهام، وذلك بالاستفادة من القدرات الناشئة بطريقة بدون تدريب (zero-shot). في هذا الحديث، سأناقش الأبحاث الحديثة المتعلقة بتمكين الذكاء الاصطناعي البصري بطريقة بدون تدريب (zero-shot) أو عبر التخصيص الدقيق (fine-tuning). على وجه التحديد، سأتناول بحثًا مشتركًا حول RELOCATE، وهو معيار بسيط لا يتطلب تدريبًا مصممًا لأداء مهمة صعبة وهي تحديد موقع الاستعلام البصري في مقاطع فيديو طويلة. للحد من الحاجة إلى تدريب مخصص لكل مهمة ومعالجة مقاطع الفيديو الطويلة بكفاءة، يستفيد RELOCATE من تمثيل قائم على المناطق مشتق من نماذج بصرية مُدرّبة مسبقًا. كما سأناقش بحثًا مشتركًا حول تمكين النماذج الكبيرة متعددة الوسائط (MLLMs) من الإجابة الصحيحة على المطالبات التي تتطلب فهمًا شاملاً مكانيًا-زمانيًا: فالنماذج MLLMs تواجه صعوبة في الإجابة على المطالبات التي تشير إلى 1) بيئة كاملة يمكن لوكيل مزود بنموذج MLLM العمل فيها؛ وفي الوقت نفسه تشير أيضًا إلى 2) إجراءات حديثة حدثت للتو ومُشفرة في مقطع فيديو. ومع ذلك، فإن هذا الفهم الشامل المكاني-الزماني مهم للوكلاء العاملين في العالم الحقيقي. وحلنا يتضمن تطوير خط أنابيب مخصص لجمع البيانات وتخصيص نموذج MLLM مزود بمشعات لتحسين كل من الفهم المكاني للبيئة والفهم الزمني للملاحظات الحديثة. *عن المتحدث* [ألكس شوينغ](https://www.linkedin.com/in/alexander-s-0a049258/) هو أستاذ مشارك في جامعة إلينوي في أوربانا-شامبين، يعمل مع طلاب موهوبين في موضوعات الذكاء الاصطناعي، والذكاء الاصطناعي التوليدي، والرؤية الحاسوبية. حصل على درجة البكالوريوس والدبلوم في الهندسة الكهربائية وتكنولوجيا المعلومات من الجامعة التقنية في ميونيخ عامي 2006 و2008 على التوالي، وحصل على درجة الدكتوراه في علوم الحاسوب من ETH زيورخ في عام 2014. بعد ذلك انضم إلى جامعة تورونتو كزميل ما بعد الدكتوراه حتى عام 2016. تتركز اهتماماته البحثية في مجالات الذكاء الاصطناعي، والذكاء الاصطناعي التوليدي، والرؤية الحاسوبية، حيث شارك في تأليف العديد من الأوراق البحثية في مواضيع تشمل فهم السيناريوهات، وخوارزميات الاستنتاج والتعلم، والتعلم العميق، ومعالجة الصور واللغة، والنماذج التوليدية. وقد تم منح أطروحته للدكتوراه ميدالية ETH، كما حصل فريقه البحثي على جائزة NSF CAREER. **خارج المختبر: كشف الشذوذ في العالم الحقيقي للرؤية الحاسوبية الزراعية** يُحدث كشف الشذوذ ثورة في التصنيع والمراقبة، لكن ماذا عن الزراعة؟ هل يمكن للذكاء الاصطناعي أن يكتشف أمراض النباتات وأضرار الآفات مبكرًا بما يكفي لصنع فرق؟ يوضح هذا الحديث كيف يحدد كشف الشذوذ مشكلات المحاصيل ويضعها بدقة باستخدام صحة أوراق البن كمثال رئيسي. سنبدأ بالنظرية الأساسية، ثم ندرس كيف تكتشف هذه النماذج الصدأ وأضرار المن في صور الأوراق. تشمل الجلسة سير عمل شاملة عملية باستخدام أدوات FiftyOne المفتوحة المصدر للرؤية الحاسوبية، وتغطي تنقيح مجموعة البيانات، واستخراج القطع، وتدريب النموذج، وعرض النتائج. ستحصل على فهم نظري لكشف الشذوذ في الرؤية الحاسوبية وعلى خبرة عملية في تطبيق هذه التقنيات على التحديات الزراعية ومجالات أخرى. *عن المتحدث* [باولا راموس](https://www.linkedin.com/in/paula-ramos-phd/) تحمل درجة الدكتوراه في الرؤية الحاسوبية وتعلم الآلة، ولديها أكثر من 20 عامًا من الخبرة في المجال التكنولوجي. تعمل منذ أوائل العقد الأول من القرن الواحد والعشرين في كولومبيا على تطوير تقنيات هندسية متكاملة مبتكرة، تركز أساسًا على الرؤية الحاسوبية، والروبوتات، وتعلم الآلة المطبقة في الزراعة.