15 أكتوبر - الذكاء الاصطناعي البصري في الزراعة (اليوم الأول)

F5HW+FGX, Vaiaku, Tuvalu

تمت ترجمة بعض المحتوى تلقائيًا.عرض الأصل

وصف

انضم إلينا في اليوم الأول من سلسلة الفعاليات الافتراضية للاستماع إلى متحدثين خبراء حول آخر التطورات في مجال التقاطع بين الذكاء الاصطناعي البصري والزراعة. **التاريخ والوقت** 15 أكتوبر الساعة 9 صباحًا بالتوقيت الهادئ **المكان** افتراضي. [سجّل الدخول عبر Zoom.](https://voxel51.com/events/visual-ai-in-agriculture-october-15-2025) **Paved2Paradise: محاكاة ليدار قابلة للتوسيع لإدراك العالم الحقيقي** غالبًا ما يتطلب تدريب نماذج إدراك قوية للروبوتات والاستقلالية وجود مجموعات بيانات ضخمة ومتنوعة ثلاثية الأبعاد. ولكن جمع وتصنيف سحب نقاط ليدار من العالم الحقيقي بكميات كبيرة أمر مكلف وجهد يستغرق وقتًا طويلاً، خاصة عندما تكون العلامات عالية الجودة ضرورية. يقدم مشروع Paved2Paradise بديلاً اقتصاديًا: وهو خط أنابيب محاكاة ليدار قابل للتوسيع يُنتج مجموعات بيانات واقعية ومصنفة بالكامل مع أقل جهد بشري في التسمية. الفكرة الأساسية هي "تحليل العالم الحقيقي" من خلال التقاط مسح خلفيات (مثل الحقول، الطرق، مواقع البناء) ومسح كائنات (مثل المركبات، الأشخاص، الآلات) بشكل منفصل. ومن خلال دمج هذين المصدرَين بذكاء، يمكن لـ Paved2Paradise تركيب عدد كبير جدًا من مشاهد التدريب المختلفة. يتضمن خط الأنابيب أربع خطوات: (1) جمع مسح ليدار خلفي واسع النطاق، (2) تسجيل مسح عالي الدقة لكائنات الهدف في ظروف مضبوطة، (3) إدخال الكائنات داخل الخلفيات مع وضع وحجب يتماشى مع القوانين الفيزيائية، (4) محاكاة هندسة الليدار لضمان الواقعية. أظهرت التجارب أن النماذج المدربة على بيانات تم إنشاؤها باستخدام Paved2Paradise تنتقل بكفاءة إلى العالم الحقيقي، وتحقق أداءً قويًا في الكشف مع حاجة أقل بكثير للتسمية اليدوية مقارنة بجمع مجموعة البيانات التقليدية. هذه الطريقة ليست فقط فعالة من حيث التكلفة، بل أيضًا مرنة – تتيح للممارسين توسيع نطاقها بسهولة إلى فئات أو مجالات كائنات جديدة عن طريق استبدال مسح الخلفية أو الكائنات بآخر جديد. بالنسبة لممارسي تعلم الآلات الذين يعملون في مجالات الروبوتات، المركبات ذاتية القيادة، أو أنظمة الإدراك الحرجة للسلامة، يبرز Paved2Paradise طريقًا عمليًا نحو توسيع حجم بيانات التدريب دون زيادة التكاليف. وهو يسد الفجوة بين المحاكاة والأداء في العالم الحقيقي، مما يتيح التكرار السريع ونشر أكثر موثوقية لنماذج الإدراك. *عن المتحدث* [مايكل أ. ألكورن](https://www.linkedin.com/in/michaelaalcorn/) هو مهندس متقدم في تعلم الآلات في شركة John Deere\، حيث يطوّر نماذج تعلّم عميق للإدراك باستخدام بيانات الليدار والصور الملونة (RGB) لأنظمة تتطلب السلامة وتُعدّ في الوقت الفعلي\. حصل على درجة الدكتوراه في علوم الحاسوب من جامعة أوبرن\، مع أطروحة حول تحسين رؤية الحاسوب والشبكات العصبية العميقة المكانية-الزمنية\، ويحمل أيضًا تخصصًا فرعيًا في الرياضيات\. تم الاستشهاد بأبحاث مايكل من قبل باحثين في DeepMind\، Google\، Meta\، Microsoft\، وOpenAI\، من بين آخرين\، كما فاز بجائزة في مؤتمر MIT Sloan Sports Analytics Conference عام 2018 عن ورقته \(batter\|pitcher\)2vec\. كما ساهم برمجيًا في scikit\-learn وApache Solr\، وقد استُخدم مستودعه على GitHub—الذي حصلت مستودراته مجتمعة على أكثر من 2\,100 نجمة—كنقاط بداية لأكواد بحثية وإنتاجية في العديد من المؤسسات المختلفة\. **MothBox: جهاز رصد حشرات منخفض التكلفة، مفتوح المصدر، وآلي** سيتحدث الدكتور آندي كويتميير عن تصميم أداة علمية جديدة ومثيرة مفتوحة المصدر، Mothbox. يُعد Mothbox مشروعًا فائزًا بجائزة لمراقبة الحشرات على نطاق واسع من أجل التنوع البيولوجي. وهو جهاز منخفض التكلفة تم تطويره في غابات بنما القاسية، يقوم بالتقاط صور فائقة الدقة ثم تحديد تلقائي لمستويات التنوع البيولوجي في الغابات والزراعة. بعد آلاف الملاحظات على الحشرات ومئات النشرات في بنما، بيرو، المكسيك، الإكوادور، والولايات المتحدة، نحن الآن نعمل على تطوير نسخة جديدة قابلة للإنتاج لتعميم هذه الأداة المهمة على مستوى العالم. سنناقش تطوير هذا الجهاز في غابات بنما وأهميته لدراسة التنوع البيولوجي عالميًا. *عن المتحدث* يصمم الدكتور آندي كويتميير طرقًا جديدة للتفاعل مع العالم الطبيعي. عمل مع منظمات كبيرة مثل Cartoon Network وIDEO وSmithsonian، ودرّس كأستاذ مساعد في جامعة سنغافورة الوطنية، وحتى تم تحويل بحثه إلى سلسلة تلفزيونية (مضحكة) بعنوان "Hacking the Wild"، تم توزيعها بواسطة Discovery Networks. حاليًا، يقضي معظم وقته في العمل التطوعي مع منظمات صغيرة، وقام مؤخرًا بتأسيس ورشة العمل الميدانية Digital Naturalism Laboratories. في غابة جامبوا المطيرة في بنما، تدمج Dinalab بين العمل الميداني البيولوجي وصنع التكنولوجيا ضمن مجتمع من العلماء والفنيين والفنانين والمتعافين من الحيوانات المحليين والدوليين. كما يُقدّم حاليًا الاستشارات للطلاب بصفته أستاذًا مشاركًا في جامعة واشنطن. **النماذج الأساسية للذكاء الاصطناعي البصري في الزراعة** لقد مكّنت النماذج الأساسية من طريقة جديدة لمعالجة المهام، وذلك بالاستفادة من القدرات الناشئة بطريقة بدون تدريب (zero-shot). في هذا الحديث، سأناقش أحدث الأبحاث المتعلقة بتمكين الذكاء الاصطناعي البصري بطريقة بدون تدريب أو من خلال الضبط الدقيق (fine-tuning). وعلى وجه التحديد، سأناقش عملًا مشتركًا حول RELOCATE، وهو خط أساس بسيط لا يتطلب تدريبًا مصممًا لأداء مهمة صعبة وهي تحديد موقع الاستعلام البصري في مقاطع فيديو طويلة. للتخلص من الحاجة إلى تدريب خاص بكل مهمة وللتعامل بكفاءة مع مقاطع الفيديو الطويلة، يستفيد RELOCATE من تمثيل قائم على المناطق مستمد من نماذج رؤية مسبقة التدريب. كما سأناقش عملًا مشتركًا حول تمكين نماذج اللغات الكبيرة متعددة الوسائط (MLLMs) من الإجابة الصحيحة على المطالبات التي تتطلب فهمًا شاملاً مكانيًا-زمانيًا: فالنماذج MLLMs تجد صعوبة في الإجابة على المطالبات التي تشير إلى 1) البيئة بأكملها التي يمكن لوكيل مزوّد بنموذج MLLM العمل فيها؛ وفي نفس الوقت تشير أيضًا إلى 2) الإجراءات الأخيرة التي حدثت للتو والمشفرة في مقطع فيديو. ومع ذلك، فإن هذا الفهم الشامل المكاني-الزماني مهم للوكلاء الذين يعملون في العالم الحقيقي. وتشمل حلولنا تطوير خط أنابيب مخصص لجمع البيانات وضبط نموذج MLLM مزوّد بمشعّات لتحسين كل من الفهم المكاني للبيئة والفهم الزمني للملاحظات الأخيرة. *عن المتحدث* [أليكس شوينغ](https://www.linkedin.com/in/alexander-s-0a049258/) هو أستاذ مشارك في جامعة إلينوي في أوربانا-شامبين، يعمل مع طلاب موهوبين في مجالات الذكاء الاصطناعي، والذكاء الاصطناعي التوليدي، ورؤية الحاسوب. حصل على درجة البكالوريوس والدبلوم في الهندسة الكهربائية وتكنولوجيا المعلومات من الجامعة التقنية في ميونيخ عامي 2006 و2008 على التوالي، وحصل على درجة الدكتوراه في علوم الحاسوب من ETH زيورخ في عام 2014. وبعد ذلك انضم إلى جامعة تورونتو كزميل باحث حتى عام 2016. تتركز اهتماماته البحثية في مجالات الذكاء الاصطناعي، والذكاء الاصطناعي التوليدي، ورؤية الحاسوب، حيث شارك في تأليف العديد من الأوراق العلمية حول فهم المشهد، وخوارزميات الاستنتاج والتعلم، والتعلم العميق، ومعالجة الصور واللغة، والنماذج التوليدية. وقد تم منح أطروحته للدكتوراه ميدالية ETH، كما حصل فريقه البحثي على جائزة NSF CAREER. **خارج المختبر: كشف الشذوذ في العالم الحقيقي لرؤية الحاسوب في الزراعة** يُحدث كشف الشذوذ تغييرًا في التصنيع والمراقبة، ولكن ماذا عن الزراعة؟ هل يمكن للذكاء الاصطناعي اكتشاف أمراض النباتات وأضرار الآفات في وقت مبكر بما يكفي لصنع فرق حقيقي؟ يوضح هذا الحديث كيف يقوم كشف الشذوذ بتحديد وتحديد مواقع مشكلات المحاصيل باستخدام صحة أوراق البن كمثال أساسي. سنبدأ بالنظرية الأساسية، ثم نحلل كيفية اكتشاف هذه النماذج لأضرار الصدأ والحفر في صور الأوراق. تشمل الجلسة سير عمل عمليًا شاملاً باستخدام أدوات FiftyOne مفتوحة المصدر لرؤية الحاسوب، وتغطي تنقيح مجموعة البيانات، واستخراج القطع (patches)، وتدريب النموذج، وعرض النتائج. ستحصل على فهم نظري لكشف الشذوذ في رؤية الحاسوب، بالإضافة إلى تجربة عملية في تطبيق هذه التقنيات على التحديات الزراعية وغيرها من المجالات. *عن المتحدث* [بولينا راموس](https://www.linkedin.com/in/paula-ramos-phd/) تحمل درجة الدكتوراه في رؤية الحاسوب وتعلّم الآلات، ولديها أكثر من 20 عامًا من الخبرة في المجال التكنولوجي. وقد كانت تعمل على تطوير تقنيات هندسية متكاملة جديدة، خاصة في مجالات رؤية الحاسوب، والروبوتات، وتعليم الآلة المطبقة على الزراعة، منذ أوائل العقد الأول من القرن الحادي والعشرين في كولومبيا.

المصدر: meetup عرض المنشور الأصلي

موقع

F5HW+FGX, Vaiaku, Tuvalu

عرض الخريطة

meetup

15 أكتوبر - الذكاء الاصطناعي البصري في الزراعة (اليوم الأول)

قد يعجبك أيضا