15 أكتوبر - الذكاء الاصطناعي البصري في الزراعة (اليوم الأول)

F5HW+FGX, Vaiaku, Tuvalu

تمت ترجمة بعض المحتوى تلقائيًا.عرض الأصل

وصف

انضم إلينا في اليوم الأول من سلسلة فعاليات افتراضية للاستماع إلى خبراء حول أحدث التطورات في مجال التقاطع بين الذكاء الاصطناعي البصري والزراعة. **التاريخ والوقت** 15 أكتوبر الساعة 9 صباحًا بالتوقيت الهادئ **المكان** افتراضي. [سجّل الدخول عبر Zoom.](https://voxel51.com/events/visual-ai-in-agriculture-october-15-2025) **Paved2Paradise: محاكاة ليدار قابلة للتوسيع لإدراك العالم الحقيقي** غالبًا ما يتطلب تدريب نماذج الإدراك القوية للروبوتات والاستقلالية بيانات ثلاثية الأبعاد ضخمة ومتنوعة. لكن جمع وترميز سحب ليدار من العالم الحقيقي على نطاق واسع أمرٌ مكلفٌ ويتطلب وقتًا طويلاً، خاصة عند الحاجة إلى تسميات عالية الجودة. يقدم Paved2Paradise بديلًا اقتصاديًا: خط أنابيب محاكاة ليدار قابل للتوسيع يُنتج بيانات واقعية ومُعلَّمة بالكامل مع الحد الأدنى من الجهد البشري في التسمية. الفكرة الأساسية هي "تحليل العالم الحقيقي" من خلال التقاط مسح الخلفية (مثلًا: الحقول، الطرق، مواقع البناء) ومسح الكائنات (مثلًا: المركبات، الأشخاص، الآلات) بشكل منفصل. ومن خلال دمج هذين المصدرَين بذكاء، يمكن لـ Paved2Paradise تركيب عدد كبير توفيقيًا من مشاهد التدريب المتنوعة. يتضمن خط الأنابيب أربع خطوات: (1) جمع مسح ليدار واسع النطاق للخلفية، (2) تسجيل مسح عالي الدقة لكائنات الهدف في ظروف مضبوطة، (3) إدخال الكائنات ضمن الخلفيات مع وضع وحجب متسق فيزيائيًا، و(4) محاكاة هندسة الليدار لضمان الواقعية. أظهرت التجارب أن النماذج المدربة على بيانات تم إنشاؤها باستخدام Paved2Paradise تنتقل بكفاءة إلى العالم الحقيقي، وتُحقق أداءً قويًا في الكشف مع حاجة أقل بكثير للتسمية اليدوية مقارنةً بجمع مجموعة البيانات التقليدية. هذه الطريقة ليست فعالة من حيث التكلفة فحسب، بل مرنة أيضًا — مما يسمح للممارسين بسهولة التوسع نحو فئات أو نطاقات كائنات جديدة عن طريق استبدال مسحات الخلفية أو الكائنات بمسحات جديدة. بالنسبة لممارسي التعلم الآلي العاملين في الروبوتات أو المركبات المستقلة أو أنظمة الإدراك الحرجة للسلامة، يبرز Paved2Paradise مسارًا عمليًا نحو توسيع بيانات التدريب دون توسيع التكاليف. وهو يسد الفجوة بين الأداء في المحاكاة والأداء في العالم الحقيقي، مما يتيح تكرارًا أسرع ونشرًا أكثر موثوقية لنماذج الإدراك. *عن المتحدث* [مايكل أ. ألكورن](https://www.linkedin.com/in/michaelaalcorn/) هو مهندس رئيسي للتعلم الآلي في شركة John Deere\، حيث يطور نماذج التعلم العميق للإدراك باستخدام الليدار والصور ذات الألوان الثلاثة الأساسية (RGB) في أنظمة حرجة للسلامة وتعمل في الزمن الحقيقي\. حصل على درجة الدكتوراه في علوم الحاسوب من جامعة أوبرن\، وكان موضوع أطروحته تحسين الرؤية الحاسوبية والشبكات العصبية العميقة المكانية-الزمنية\، ويحمل أيضًا تخصصًا فرعيًا للدراسات العليا في الرياضيات\. تم الاستشهاد بأبحاث مايكل من قبل باحثين في DeepMind\، Google\، Meta\، Microsoft\، وOpenAI\، من بين آخرين\، وكانت ورقته \(batter\|pitcher\)2vec فائزة بجائزة في مؤتمر MIT Sloan Sports Analytics لعام 2018\. كما ساهم برمجيًا في scikit\-learn وApache Solr\، وقد تلقى مستودعاته على GitHub أكثر من 2\,100 نجمة مجتمعة—وقد شكلت نقطة انطلاق لأبحاث وأكواد إنتاجية في العديد من المنظمات المختلفة\. **MothBox: جهاز رصد حشرات منخفض التكلفة، مفتوح المصدر، وآلي** سيتحدث الدكتور آندي كوتمير عن تصميم أداة علمية جديدة ومثيرة مفتوحة المصدر، Mothbox. يُعد Mothbox مشروعًا فائزًا بالجوائز لمراقبة واسعة النطاق للحشرات بهدف التنوع البيولوجي. إنه جهاز منخفض التكلفة تم تطويره في الغابات الاستوائية القاسية ببنما، ويُجري صورًا عالية الدقة جدًا ثم يقوم تلقائيًا بتحديد مستويات التنوع البيولوجي في الغابات والزراعة. بعد آلاف الملاحظات الحشرية ومئات النشرات في بنما، بيرو، المكسيك، الإكوادور، والولايات المتحدة، نحن الآن نعمل على تطوير نسخة جديدة قابلة للتصنيع لتوزيع هذه الأداة المهمة عالميًا. سنناقش تطوير هذا الجهاز في غابات بنما ودوره المهم في دراسة التنوع البيولوجي عالميًا. *عن المتحدث* يصمم الدكتور آندي كوتمير طرقًا جديدة للتفاعل مع العالم الطبيعي. عمل مع منظمات كبيرة مثل شبكة كرتون نتورك وIDEO ومعهد سميثسونيان، ودرّس كأستاذ محاضر في جامعة سنغافورة الوطنية، وتحولت أبحاثه حتى إلى سلسلة تلفزيونية (مضحكة) بعنوان "Hacking the Wild"، تم توزيعها بواسطة Discovery Networks. في الوقت الحالي، يقضي معظم وقته في العمل التطوعي مع منظمات صغيرة، وقام مؤخرًا بتأسيس ورشة عمل حقلية تُدعى Digital Naturalism Laboratories. في غابة الأمطار في جامبوا ببنما، تدمج Dinalab العمل الميداني البيولوجي مع الصياغة التكنولوجية ضمن مجتمع من العلماء والفنيين والمهندسين وفناني والمتخصصين في إعادة تأهيل الحيوانات المحليين والدوليين. ويشغل حاليًا أيضًا منصب أستاذ متعاون في جامعة واشنطن حيث يستشير الطلاب. **النماذج الأساسية للذكاء الاصطناعي البصري في الزراعة** لقد مكّنت النماذج الأساسية من أسلوب جديد لمعالجة المهام، وذلك بالاستفادة من القدرات الناشئة بطريقة بدون تدريب (zero-shot). في هذا الحديث، سأناقش بحثًا حديثًا حول تمكين الذكاء الاصطناعي البصري بطريقة بدون تدريب أو عبر الضبط الدقيق (fine-tuning). على وجه التحديد، سأناقش عملًا مشتركًا حول RELOCATE، وهو خط أساس بسيط لا يتطلب تدريبًا مصممًا لأداء مهمة صعبة وهي تحديد موقع الاستعلام البصري في مقاطع فيديو طويلة. للتخلص من الحاجة إلى تدريب مخصص لكل مهمة والتعامل بكفاءة مع مقاطع الفيديو الطويلة، يستفيد RELOCATE من تمثيل قائم على المناطق مستمد من نماذج بصرية مُدرّبة مسبقًا. كما سأناقش عملًا مشتركًا حول تمكين نماذج اللغة الكبيرة متعددة الوسائط (MLLMs) من الإجابة الصحيحة على الطلبات التي تتطلب فهمًا شموليًا مكانًا وزمنًا: تواجه النماذج متعددة الوسائط صعوبة في الإجابة على طلبات تشير إلى 1) البيئة بأكملها التي يمكن لوكيل مزود بنموذج MLLM العمل فيها؛ وفي نفس الوقت تشير أيضًا إلى 2) أفعال حديثة حدثت للتو وتم ترميزها في مقطع فيديو. ومع ذلك، فإن هذا الفهم الشمولي المكاني-الزماني مهم للوكلاء العاملين في العالم الحقيقي. يشمل حلنا تطوير خط أنابيب مخصص لجمع البيانات والضبط الدقيق لنموذج MLLM مجهز بمشعات لتحسين كل من الفهم المكاني للبيئة والفهم الزمني للمشاهدات الأخيرة. *عن المتحدث* [ألكس شوينغ](https://www.linkedin.com/in/alexander-s-0a049258/) هو أستاذ مشارك في جامعة إلينوي في أوربانا-شامبين، يعمل مع طلاب موهوبين في مواضيع الذكاء الاصطناعي، والذكاء الاصطناعي التوليدي، والرؤية الحاسوبية. تلقى تعليمه الجامعي وحصل على دبلومه في الهندسة الكهربائية وتكنولوجيا المعلومات من الجامعة التقنية بميونيخ عام 2006 و2008 على التوالي، ونال درجة الدكتوراه في علوم الحاسوب من ETH زيورخ عام 2014. بعد ذلك انضم إلى جامعة تورونتو كزميل ما بعد الدكتوراه حتى عام 2016. تتركز اهتماماته البحثية في مجالات الذكاء الاصطناعي، والذكاء الاصطناعي التوليدي، والرؤية الحاسوبية، حيث شارك في تأليف العديد من الأوراق البحثية حول فهم المشهد، وخوارزميات الاستدلال والتعلم، والتعلم العميق، ومعالجة الصور واللغة، والنماذج التوليدية. حصلت أطروحته للدكتوراه على ميدالية ETH، وحاز بحث فريقه على جائزة NSF CAREER. **خارج المختبر: كشف الشذوذ في العالم الحقيقي للرؤية الحاسوبية الزراعية** يُحدث كشف الشذوذ ثورة في التصنيع والمراقبة، ولكن ماذا عن الزراعة؟ هل يمكن للذكاء الاصطناعي اكتشاف أمراض النباتات وأضرار الآفات مبكرًا بما يكفي لصنع فرق؟ يوضح هذا الحديث كيف يحدد كشف الشذوذ ويحلل مشكلات المحاصيل باستخدام صحة أوراق البن كمثال أساسي. سنبدأ بنظرية أساسية، ثم ندرس كيف تكتشف هذه النماذج صدأ الأوراق وأضرار المنّ في صور الأوراق. تشمل الجلسة سير عمل شاملًا عمليًا باستخدام مجموعة أدوات الرؤية الحاسوبية المفتوحة المصدر FiftyOne، وتشمل تنقية مجموعة البيانات، واستخلاص القطع، وتدريب النموذج، وعرض النتائج. ستحصل على فهم نظري لكشف الشذوذ في الرؤية الحاسوبية، بالإضافة إلى تجربة عملية في تطبيق هذه الأساليب على التحديات الزراعية وقطاعات أخرى. *عن المتحدث* [باولا راموس](https://www.linkedin.com/in/paula-ramos-phd/) حاصلة على درجة الدكتوراه في الرؤية الحاسوبية والتعلم الآلي، ولديها أكثر من 20 عامًا من الخبرة في المجال التكنولوجي. تعمل على تطوير تقنيات هندسية متكاملة جديدة، خصوصًا في مجالات الرؤية الحاسوبية، والروبوتات، والتعلم الآلي المطبّق على الزراعة، منذ أوائل العقد الأول من القرن الحادي والعشرين في كولومبيا.

المصدر: meetup عرض المنشور الأصلي

موقع

F5HW+FGX, Vaiaku, Tuvalu

عرض الخريطة

meetup

15 أكتوبر - الذكاء الاصطناعي البصري في الزراعة (اليوم الأول)

قد يعجبك أيضا