انضم إلينا في اليوم الأول من سلسلة فعاليات افتراضية للاستماع إلى خبراء يناقشون أحدث التطورات في مجال التقاء الذكاء الاصطناعي البصري والزراعة. **التاريخ والوقت** 15 أكتوبر الساعة 9 صباحًا بالتوقيت الهادئ **المكان** افتراضي. [سجّل الدخول عبر Zoom.](https://voxel51.com/events/visual-ai-in-agriculture-october-15-2025) **Paved2Paradise: محاكاة ليدار قابلة للتوسيع لإدراك العالم الحقيقي** غالبًا ما يتطلب تدريب نماذج إدراك قوية للروبوتات والأنظمة المستقلة مجموعات بيانات ثلاثية الأبعاد ضخمة ومتنوعة. لكن جمع وتصنيف سحب نقاط ليدار من العالم الحقيقي بكميات كبيرة أمر مكلف وطويل جدًا، خصوصًا عند الحاجة إلى تسميات عالية الجودة. يقدم Paved2Paradise بديلًا اقتصاديًا: خط أنابيب محاكاة ليدار قابل للتوسيع لإنتاج مجموعات بيانات واقعية ومكتملة التسمية بجهد تصنيف بشري ضئيل. الفكرة الأساسية هي "تحليل العالم الحقيقي" من خلال التقاط مسح خلفية (مثل الحقول، الطرق، مواقع البناء) ومسح كائنات (مثل المركبات، الأشخاص، الآلات) بشكل منفصل. وبدمج هذين المصدرَين بذكاء، يمكن لـ Paved2Paradise توليد عدد كبير توفيقيًا من مشاهد التدريب المتنوعة. يتضمن خط الأنابيب أربع خطوات: (1) جمع مسح ليدار خلفي واسع النطاق، (2) تسجيل مسح عالي الدقة لكائنات الهدف في ظروف خاضعة للتحكم، (3) إدخال الكائنات في الخلفيات مع وضع وحجب يتماشيان مع القوانين الفيزيائية، و(4) محاكاة هندسة الليدار لضمان الواقعية. تُظهر التجارب أن النماذج المدربة على بيانات تم إنشاؤها بواسطة Paved2Paradise تنتقل بفعالية إلى العالم الحقيقي، وتحقق أداءً قويًا في الكشف مع تقليل كبير في التسمية اليدوية مقارنةً بجمع مجموعة البيانات التقليدية. هذه الطريقة ليست فعالة من حيث التكلفة فحسب، بل مرنة أيضًا—مما يسمح للممارسين بسهولة التوسع إلى فئات أو مجالات كائنات جديدة من خلال استبدال مسح الخلفية أو الكائنات بمسوح جديدة. بالنسبة لممارسي تعلم الآلات العاملين في مجالات الروبوتات، المركبات المستقلة، أو أنظمة الإدراك الحرجة للسلامة، يبرز Paved2Paradise طريقًا عمليًا نحو توسيع بيانات التدريب دون توسيع التكاليف. وهو يُقلّص الفجوة بين المحاكاة والأداء في العالم الحقيقي، مما يتيح تكرارًا أسرع ونشرًا أكثر موثوقية لنماذج الإدراك. *عن المتحدث* [مايكل أ. ألْكُورن](https://www.linkedin.com/in/michaelaalcorn/) هو مهندس كبير في تعلم الآلات في شركة John Deere\، حيث يطور نماذج التعلم العميق للإدراك باستخدام بيانات الليدار والصورة (RGB) في أنظمة حرجة للسلامة وتعمل في الزمن الحقيقي\. حصل على درجة الدكتوراه في علوم الحاسوب من جامعة أوبرن\، مع أطروحة حول تحسين الرؤية الحاسوبية والشبكات العصبية العميقة الزمكانية\، وله أيضًا تخصص فرعي دراسي في الرياضيات\. تم الاستشهاد بأبحاث مايكل من قبل باحثين في DeepMind\، Google\، Meta\، Microsoft\، وOpenAI\، من بين آخرين\، وكانت ورقة \(batter\|pitcher\)2vec الخاصة به فائزة بجائزة في مؤتمر MIT Sloan Sports Analytics Conference لعام 2018\. كما ساهم برمجيًا في scikit\-learn وApache Solr\، وقد استُخدم مستودعات GitHub الخاصة به—التي حصلت مجتمعة على أكثر من 2\,100 نجمة—كنقاط بداية لأبحاث وأكواد إنتاجية في العديد من المنظمات المختلفة\. **MothBox: جهاز رصد حشرات منخفض التكلفة، مفتوح المصدر، وآلي** سيتحدث الدكتور آندي كويتميير عن تصميم أداة علمية مفتوحة المصدر ومثيرة جديدة، Mothbox. إن Mothbox هو مشروع فائز بجائزة لمراقبة واسعة النطاق للحشرات من حيث التنوع البيولوجي. إنه جهاز منخفض التكلفة تم تطويره في الغابات الاستوائية القاسية ببنما، ويقوم بتصوير صور عالية الدقة جدًا ثم يقوم تلقائيًا بتحديد مستويات التنوع البيولوجي في الغابات والزراعة. بعد آلاف الملاحظات الحشرية ومئات النشرات في بنما، بيرو، المكسيك، الإكوادور، والولايات المتحدة، نحن الآن نطور نسخة جديدة قابلة للتصنيع لنشارك هذه الأداة المهمة في جميع أنحاء العالم. سنناقش تطوير هذا الجهاز في غابات بنما الاستوائية وأهميته لدراسة التنوع البيولوجي عالميًا. *عن المتحدث* يصمم الدكتور آندي كويتميير طرقًا جديدة للتفاعل مع العالم الطبيعي. عمل مع منظمات كبيرة مثل Cartoon Network وIDEO وSmithsonian، ودرّس كبروفيسور في مسار الترقي الوظيفي بجامعة سنغافورة الوطنية، وحتى تم تحويل بحثه إلى سلسلة تلفزيونية (مثيرة للسخرية) بعنوان "Hacking the Wild"، تم توزيعها عبر Discovery Networks. حاليًا، يقضي معظم وقته في العمل التطوعي مع منظمات صغيرة، وقام مؤخرًا بتأسيس ورشة عمل حقلية تُدعى Digital Naturalism Laboratories. في غابة الأمطار في جامبوا ببنما، تدمج Dinalab العمل الميداني البيولوجي مع الحرف التكنولوجية ضمن مجتمع من العلماء والفنانين والمهندسين ومُنقذي الحيوانات المحليين والدوليين. وهو يُقدّم حاليًا الاستشارات للطلاب بصفته أستاذًا مرتبطًا في جامعة واشنطن. **النماذج الأساسية للذكاء الاصطناعي البصري في الزراعة** لقد مكّنت النماذج الأساسية من طريقة جديدة لمعالجة المهام، وذلك بالاستفادة من القدرات الناشئة بطريقة بدون تدريب (zero-shot). في هذا الحديث، سأناقش أبحاثًا حديثة حول تمكين الذكاء الاصطناعي البصري بطريقة بدون تدريب (zero-shot) أو من خلال التخصيص الدقيق (fine-tuning). على وجه التحديد، سأناقش عملًا مشتركًا حول RELOCATE، وهو معيار بسيط لا يتطلب تدريبًا مصممًا لأداء مهمة صعبة تتمثل في تحديد موقع الاستعلامات البصرية في مقاطع فيديو طويلة. للتخلص من الحاجة إلى تدريب مخصص للمهمة والتعامل بكفاءة مع مقاطع الفيديو الطويلة، يستفيد RELOCATE من تمثيل قائم على المناطق مستمد من نماذج بصرية مُدرّبة مسبقًا. سأناقش أيضًا عملًا مشتركًا حول تمكين النماذج الكبيرة متعددة الوسائط (MLLMs) من الإجابة بشكل صحيح على الاستعلامات التي تتطلب فهمًا شاملاً مكانيًا-زمانيًا: تجد النماذج الكبيرة متعددة الوسائط صعوبة في الإجابة على استعلامات تشير إلى 1) بيئة كاملة يمكن لوكيل مزود بـ MLLM العمل فيها؛ وتُشير في الوقت نفسه أيضًا إلى 2) إجراءات حديثة حدثت للتو ومُرمّزة في مقطع فيديو. مع ذلك، فإن هذا الفهم الشامل المكاني-الزماني مهم للوكلاء العاملين في العالم الحقيقي. يشمل حلنا تطوير خط أنابيب مخصص لجمع البيانات وتخصيص نموذج MLLM مزود بمشعّات لتحسين الفهم المكاني للبيئة والفهم الزمني للملاحظات الحديثة. *عن المتحدث* [ألكس شوينغ](https://www.linkedin.com/in/alexander-s-0a049258/) هو أستاذ مشارك في جامعة إلينوي في أوربانا-شامبين، يعمل مع طلاب موهوبين في مجالات الذكاء الاصطناعي، والذكاء الاصطناعي التوليدي، والرؤية الحاسوبية. تلقّى شهادة البكالوريوس والدبلوم في الهندسة الكهربائية وتكنولوجيا المعلومات من الجامعة التقنية في ميونخ عامي 2006 و2008 على التوالي، وحصل على درجة الدكتوراه في علوم الحاسوب من ETH زيورخ في عام 2014. بعد ذلك انضم إلى جامعة تورونتو كزميل باحث ما بعد الدكتوراه حتى عام 2016. تتمحور اهتماماته البحثية حول الذكاء الاصطناعي، والذكاء الاصطناعي التوليدي، والرؤية الحاسوبية، حيث شارك في تأليف العديد من الأوراق البحثية حول مواضيع تشمل فهم السيناريوهات، وخوارزميات الاستنتاج والتعلم، والتعلم العميق، ومعالجة الصور واللغة، والنماذج التوليدية. حصلت أطروحته للدكتوراه على ميدالية ETH، وحاز بحث فريقه على جائزة NSF CAREER. **ما وراء المختبر: كشف الشذوذ في العالم الحقيقي للرؤية الحاسوبية الزراعية** يُحدث كشف الشذوذ تحولًا في التصنيع والمراقبة، ولكن ماذا عن الزراعة؟ هل يمكن للذكاء الاصطناعي اكتشاف أمراض النباتات وأضرار الآفات مبكرًا بما يكفي لصنع فرق؟ يوضح هذا الحديث كيف يُمكن لكشف الشذوذ تحديد مشكلات المحاصيل وتحديد مواقعها باستخدام صحة أوراق القهوة كمثال رئيسي. سنبدأ بالنظرية الأساسية، ثم ندرس كيف تكتشف هذه النماذج صدأ الأوراق وأضرار اليرقات في صور الأوراق. تشمل الجلسة سير عمل شاملاً عمليًا باستخدام مجموعة أدوات الرؤية الحاسوبية المفتوحة المصدر FiftyOne، وتغطي تجميع مجموعة البيانات، واستخراج القطع، وتدريب النموذج، وعرض النتائج. ستحصل على فهم نظري لكشف الشذوذ في الرؤية الحاسوبية وخبرة عملية في تطبيق هذه التقنيات على التحديات الزراعية وغيرها من المجالات. *عن المتحدث* [باولا راموس](https://www.linkedin.com/in/paula-ramos-phd/) تحمل درجة الدكتوراه في الرؤية الحاسوبية وتعلم الآلات، ولديها أكثر من 20 عامًا من الخبرة في المجال التكنولوجي. وهي تعمل على تطوير تقنيات هندسية متكاملة جديدة، خصوصًا في مجالات الرؤية الحاسوبية، والروبوتات، وتعلم الآلات المطبقة على الزراعة، منذ أوائل العقد الأول من القرن الحادي والعشرين في كولومبيا.