15 أكتوبر - الذكاء الاصطناعي البصري في الزراعة (اليوم الأول)

F5HW+FGX, Vaiaku, Tuvalu

تمت ترجمة بعض المحتوى تلقائيًا.عرض الأصل

وصف

انضم إلينا في اليوم الأول من سلسلة الفعاليات الافتراضية للاستماع إلى متحدثين خبراء حول آخر التطورات في مجال التقاطع بين الذكاء الاصطناعي البصري والزراعة. **التاريخ والوقت** 15 أكتوبر الساعة 9 صباحًا بالتوقيت الهادئ **المكان** فعالية افتراضية. [سجّل حضورك عبر زووم.](https://voxel51.com/events/visual-ai-in-agriculture-october-15-2025) **Paved2Paradise: خط أنابيب قابل للتوسيع لمحاكاة ليدار لتحقيق إدراك واقعي** غالبًا ما يتطلب تدريب نماذج الإدراك القوية للروبوتات والاستقلالية وجود مجموعات بيانات ضخمة ومتنوعة ثلاثية الأبعاد. ولكن جمع وتصنيف سحب نقاط ليدار من العالم الحقيقي بحجم كبير أمر مكلف وجهد استهلاكي للوقت، خاصة عند الحاجة إلى تسميات عالية الجودة. يقدم مشروع Paved2Paradise بديلاً اقتصاديًا: وهو خط أنابيب محاكاة ليدار قابل للتوسيع لإنتاج مجموعات بيانات واقعية ومُصنفة بالكامل مع الحد الأدنى من الجهد البشري في التسمية. الفكرة الأساسية هي "تحليل الواقع" من خلال التقاط مسح الخلفية (مثلًا: الحقول، الطرق، مواقع البناء) ومسح الكائنات (مثلًا: المركبات، الأشخاص، الآلات) بشكل منفصل. ومن خلال دمج هذين المصدرَين بذكاء، يمكن لـ Paved2Paradise توليد عدد كبير من مشاهد التدريب المتنوعة. يشمل الخطوات الأربع التالية: (1) جمع مسح واسع النطاق للخلفية باستخدام ليدار، (2) تسجيل مسح عالي الدقة لكائنات مستهدفة في ظروف مضبوطة، (3) إدراج الكائنات داخل الخلفيات مع وضع واقعي فيزيائيًا واحتكاك دقيق، (4) محاكاة هندسة ليدار لضمان الواقعية. أظهرت التجارب أن النماذج المدرّبة على بيانات تم إنشاؤها بواسطة Paved2Paradise تنتقل بكفاءة إلى العالم الحقيقي، وتصل إلى أداء قوي في الكشف مع جهد أقل بكثير في التسمية اليدوية مقارنة بجمع مجموعة البيانات التقليدية. هذه الطريقة ليست فعالة من حيث التكلفة فحسب، بل أيضًا مرنة — مما يسمح للممارسين بسهولة التوسع إلى فئات كائنات جديدة أو مجالات جديدة من خلال استبدال مسح الخلفية أو الكائنات. بالنسبة لممارسي التعلّم الآلي العاملين في الروبوتات، أو المركبات المستقلة، أو أنظمة الإدراك الحرجة للسلامة، يبرز Paved2Paradise طريقًا عمليًا نحو توسيع نطاق بيانات التدريب دون زيادة التكاليف. وهو يسد الفجوة بين المحاكاة والأداء في العالم الحقيقي، ويتيح التكرار الأسرع والنشر الأكثر موثوقية لنماذج الإدراك. *عن المتحدث* [مايكل أ. ألكورن](https://www.linkedin.com/in/michaelaalcorn/) هو مهندس تعلم آلي أول في شركة John Deere\، حيث يطوّر نماذج تعلّم عميق للإدراك باستخدام ليدار والصور ذات الألوان الثلاثة (RGB) في أنظمة تتطلب السلامة وتُعمل في الزمن الحقيقي\. حصل على درجة الدكتوراه في علوم الحاسوب من جامعة أوبرن\، وكان عن أطروحته تحسين رؤية الحاسوب والشبكات العصبية العميقة المكانية-الزمنية\، كما يمتلك تخصصًا فرعيًا في الرياضيات\. تم الاستشهاد بأبحاث مايكل من قبل باحثين في DeepMind\، Google\، Meta\، Microsoft\، وOpenAI\، من بين آخرين\، وكانت ورقة \(batter\|pitcher\)2vec الخاصة به فائزة بجائزة في مؤتمر MIT Sloan Sports Analytics Conference عام 2018\. كما ساهم برمجيًا في scikit\-learn وApache Solr\، وقد استخدمت مستودرات GitHub الخاصة به—التي حصلت مجتمعة على أكثر من 2\,100 نجمة—كنقاط بداية لأبحاث وأكواد إنتاجية في العديد من المؤسسات المختلفة\. **MothBox: جهاز رصد حشرات منخفض التكلفة ومفتوح المصدر** سيتحدث الدكتور آندي كوتمير عن تصميم أداة علمية جديدة ومثيرة ومفتوحة المصدر، وهي Mothbox. يُعد مشروع Mothbox مشروعًا فائزًا بجائزة لمراقبة واسعة النطاق للحشرات بهدف دراسة التنوع البيولوجي. إنه جهاز منخفض التكلفة تم تطويره في الغابات القاسية ببنما، ويقوم بالتقاط صور عالية الدقة جدًا ثم يقوم تلقائيًا بتحديد مستويات التنوع البيولوجي في الغابات والزراعة. بعد آلاف الملاحظات على الحشرات ومئات عمليات النشر في بنما، بيرو، المكسيك، الإكوادور، والولايات المتحدة، نحن الآن نعمل على تطوير نسخة جديدة قابلة للتصنيع لتعميم هذه الأداة المهمة عالميًا. سنناقش تطوير هذا الجهاز في غابات بنما وأهميته لدراسة التنوع البيولوجي عالميًا. *عن المتحدث* يصمم الدكتور آندي كوتمير طرقًا جديدة للتفاعل مع العالم الطبيعي. عمل مع منظمات كبيرة مثل Cartoon Network و IDEO وSmithsonian، ودرّس كأستاذ على المسار الوظيفي الدائم في الجامعة الوطنية السنغافورية، وحتى تم تحويل بحثه إلى برنامج تلفزيوني (مضحك) بعنوان "Hacking the Wild"، تم توزيعه بواسطة Discovery Networks. في الوقت الحالي، يقضي معظم وقته في العمل التطوعي مع منظمات صغيرة، وقام مؤخرًا بتأسيس مختبر الحرف الرقمية (Digital Naturalism Laboratories)، وهو فضاء مخصص للمبتكرين في محطات الحقل. في غابة الأمطار بـغامبوا في بنما، يدمج Dinalab بين العمل الميداني البيولوجي وصناعة التكنولوجيا ضمن مجتمع من العلماء والفنيين والفنانين والمهندسين والمتعافين من الحيوانات المحليين والدوليين. كما يقدّم حاليًا المشورة للطلاب بصفته أستاذًا مشاركًا في جامعة واشنطن. **نماذج الأساس للذكاء الاصطناعي البصري في الزراعة** لقد مكّنت نماذج الأساس من طريقة جديدة لمعالجة المهام، وذلك من خلال الاستفادة من القدرات الناشئة بطريقة بدون تدريب (zero-shot). في هذا الحديث، سأناقش أحدث الأبحاث المتعلقة بتمكين الذكاء الاصطناعي البصري بطريقة بدون تدريب (zero-shot) أو عبر التعديل الدقيق (fine-tuning). على وجه التحديد، سأتناول بحثًا مشتركًا حول RELOCATE، وهو معيار بسيط لا يتطلب تدريبًا مصممًا لأداء مهمة صعبة وهي تحديد موقع الاستعلامات المرئية في مقاطع فيديو طويلة. للتخلص من الحاجة إلى تدريب خاص بالمهمة وللتعامل بكفاءة مع مقاطع الفيديو الطويلة، يستفيد RELOCATE من تمثيل قائم على المناطق مستمد من نماذج الرؤية المدرّبة مسبقًا. سأناقش أيضًا عملًا مشتركًا حول تمكين النماذج الكبيرة متعددة الوسائط (MLLMs) من الإجابة الصحيحة على الطلبات التي تتطلب فهمًا شاملاً مكانياً-زمنياً: فالنماذج الكبيرة متعددة الوسائط تواجه صعوبة في الإجابة على طلبات تشير إلى 1) بيئة كاملة يمكن لوكيل مزوّد بنموذج MLLM العمل فيها؛ وتشير في نفس الوقت إلى 2) إجراءات حدثت للتو ومُشفّرة في مقطع فيديو. ومع ذلك، فإن هذا الفهم الشامل المكاني-الزماني مهم للوكلاء الذين يعملون في العالم الحقيقي. يتمثل حلنا في تطوير خط أنابيب مخصص لجمع البيانات وتعديل نموذج MLLM مزوّد بمشعّات لتحسين كل من الفهم المكاني للبيئة والفهم الزمني للمشاهدات الأخيرة. *عن المتحدث* [ألكس شوينغ](https://www.linkedin.com/in/alexander-s-0a049258/) هو أستاذ مشارك في جامعة إلينوي في أوربانا-شمباين، يعمل مع طلاب موهوبين في موضوعات الذكاء الاصطناعي، والذكاء الاصطناعي التوليدي، ورؤية الحاسوب. حصل على بكالوريوس ودبلومه في الهندسة الكهربائية وتكنولوجيا المعلومات من الجامعة التقنية في ميونيخ عامي 2006 و2008 على التوالي، وحصل على درجة الدكتوراه في علوم الحاسوب من ETH زيورخ عام 2014. وبعد ذلك انضم إلى جامعة تورونتو كزميل باحث ما بعد الدكتوراه حتى عام 2016. تتمحور اهتماماته البحثية حول الذكاء الاصطناعي، والذكاء الاصطناعي التوليدي، ورؤية الحاسوب، حيث شارك في تأليف العديد من الأوراق العلمية حول فهم السيناريوهات، وخوارزميات الاستدلال والتعلم، والتعلم العميق، ومعالجة الصور واللغة، والنماذج التوليدية. حصلت أطروحته للدكتوراه على ميدالية ETH، وتم تكريم بحث فريقه بجائزة NSF CAREER. **خارج المختبر: كشف الشذوذ في العالم الحقيقي للرؤية الحاسوبية الزراعية** يُحدث كشف الشذوذ ثورة في التصنيع والمراقبة، لكن ماذا عن الزراعة؟ هل يمكن للذكاء الاصطناعي أن يكتشف أمراض النباتات وأضرار الآفات في وقت مبكر بما يكفي لصنع فرق حقيقي؟ يوضح هذا الحديث كيف يحدد كشف الشذوذ ويحلل مشكلات المحاصيل باستخدام صحة أوراق القهوة كمثال أساسي. سنبدأ بالنظرية الأساسية، ثم ندرس كيف تكشف هذه النماذج عن أضرار الصدأ والحفرة (miner damage) في صور الأوراق. تشمل الجلسة تدفق عمل شاملاً عمليًا باستخدام أدوات FiftyOne المفتوحة المصدر للرؤية الحاسوبية، ويتناول تنقيح مجموعة البيانات، واستخراج القطع، وتدريب النموذج، وعرض النتائج. ستحصل على فهم نظري لكشف الشذوذ في الرؤية الحاسوبية، بالإضافة إلى تجربة عملية تطبيق هذه التقنيات على التحديات الزراعية وغيرها من المجالات. *عن المتحدث* [بولينا راموس](https://www.linkedin.com/in/paula-ramos-phd/) حاصلة على درجة الدكتوراه في الرؤية الحاسوبية والتعلم الآلي، ولديها أكثر من 20 عامًا من الخبرة في المجال التكنولوجي. تعمل منذ أوائل العقد الأول من القرن الحادي والعشرين على تطوير تقنيات هندسية متكاملة مبتكرة، تركز أساسًا على الرؤية الحاسوبية، والروبوتات، والتعلم الآلي المطبّق في الزراعة، وذلك في كولومبيا.

المصدر: meetup عرض المنشور الأصلي

موقع

F5HW+FGX, Vaiaku, Tuvalu

عرض الخريطة

meetup