بيت سمعي لماذا قد تتطلب بعض مشاريع التعلم الآلي عددًا كبيرًا من الجهات الفاعلة؟

لماذا قد تتطلب بعض مشاريع التعلم الآلي عددًا كبيرًا من الجهات الفاعلة؟

Anonim

Q:

لماذا قد تتطلب بعض مشاريع التعلم الآلي عددًا كبيرًا من الجهات الفاعلة؟

أ:

عندما تفكر في التعلم الآلي ، فأنت تميل إلى التفكير في علماء البيانات المهرة الذين يعملون على لوحات المفاتيح في غرف الكمبيوتر. هناك تركيز شديد على التحليل الكمي والخوارزميات. لا يوجد الكثير من سياق العالم الحقيقي المباشر للعديد من هذه البرامج - على الأقل ، هذا ما يعتقده الكثيرون.

ومع ذلك ، فإن بعض برامج التعليم الآلي الرائدة اليوم تستخدم الجيوش الحقيقية للعناصر البشرية الفاعلة في الشارع وفي المتاجر وفي أي مكان يمكنهم فيه نمذجة الأنشطة البشرية الأساسية مثل المشي أو العمل أو التسوق.

تحميل مجاني: تعلم الآلة ولماذا يهم

يوضح مقال سلكي لتوم سيمونيت هذا جيدًا مع العنوان المناسب "لجعل الذكاء الاصطناعي أكثر ذكاءً ، يؤدي البشر مهام Oddball المنخفضة الأجور".

باستخدام مثال على مقاطع الفيديو القصيرة التي تم التقاطها في متجر بقالة Whole Foods ، يسلط Simonite الضوء على أنواع العمل التي ستساعد في بناء بعض المرحلة التالية من التعلم الآلي.

يؤدي هذا إلى السؤال عن سبب اشتراك كل هؤلاء الأشخاص في تصوير أنفسهم في مقاطع فيديو قصيرة وبسيطة لتوثيق الإجراءات بدائية مثل تحريك ذراع أو ساق.

تلقي الإجابة بعض الضوء على مكان تعلم الآلة وأين يتم ذلك.

"يريد الباحثون ورجال الأعمال أن يروا الذكاء الاصطناعي يتفهمون ويتصرفون في العالم المادي" ، يكتب سيمونيت ، موضحًا لماذا هو وآخرون يتجولون مع الكاميرات. ومن هنا كانت الحاجة إلى تمثيل العمال للمشاهد في محلات السوبر ماركت والمنازل. إنهم يولدون المواد التعليمية لتعليم الخوارزميات حول العالم والناس فيها ".

كما سيوضح العديد من الخبراء ، فإن بعض أكبر حدود التعلم الآلي تتضمن معالجة الصور ومعالجة اللغة الطبيعية. هذه إجراءات كمية للغاية - بمعنى آخر ، لا توجد مجموعة واسعة من المدخلات كما هو الحال في بيئات العالم الواقع "المؤدية". بدلاً من ذلك ، تستخدم برامج التعلم الآلي البيانات المرئية والمسموعة بطرق محددة جدًا لإنشاء النماذج. من خلال معالجة الصور ، يتم اختيار الميزات من مجال الرؤية (المحدود). بالنسبة لـ NLP ، يقوم بتجميع الصوتيات.

ينطوي تجاوز فئات الإدخال المحددة هذه على شيء قد تسميه "فجوة الصورة والكلام" - في تجاوز أشياء مثل معالجة الصور والتعرف على الكلام ، فأنت تنتقل إلى المناطق التي يجب أن تكون أجهزة الكمبيوتر فيها تحليلية بطرق مختلفة. مجموعات التدريب ستكون مختلفة جذريا.

أدخل جيش مصوري الفيديو. في بعض هذه المشاريع الجديدة للتعلم الآلي ، فإن أصغر أفكار الأنشطة البشرية هي مجموعات التدريب. بدلاً من التدريب على البحث عن الميزات والحواف والبيكسلات التي تشكل مهام تصنيف ، تستخدم أجهزة الكمبيوتر بدلاً من ذلك مقاطع الفيديو التدريبية لتقييم أنواع أنواع الإجراءات المختلفة.

الشيء الرئيسي هو ما يمكن أن يفعله المهندسون بهذه البيانات عندما يتم تجميعها وتحميلها ، وعندما يتم تدريب الكمبيوتر عليها. سترى قريبًا النتائج في مختلف المجالات - على سبيل المثال ، هذا سيجعل المراقبة فعالة للغاية. ستتمكن أجهزة الكمبيوتر من "رؤية" ما يفعله الأشخاص في المجال المرئي ، وتطبيقه على مجالات مثل التسويق والمبيعات ، أو ربما ، في بعض الحالات ، عمل الوكالات الحكومية أو العدالة الجنائية.

وضعت التداعيات أيضًا بعض الضوء على النقاش بين أقصى فائدة وأسئلة الخصوصية. سيؤدي جزء كبير من استخدام مقاطع الفيديو هذه إلى إنشاء نماذج للتعلم الآلي تعمل للمراقبة - ولكن ماذا عن الأشخاص الذين لا يريدون إجراء المسح؟ عندما يتم نشر هذه البرامج الجديدة للتعلم الآلي في الأماكن العامة ، ما هي حقوق الفرد وأين يتم رسم هذا الخط؟

على أي حال ، تستخدم الشركات هذه الأنواع من الموارد البشرية ومقاطع الفيديو للحفر حقًا في بعض جولات المستوى التالي من تقدم التعلم الآلي التي ستمكّن أجهزة الكمبيوتر في الواقع من التعرف على ما يحدث من حولهم ، بدلاً من مجرد تصنيف الصور أو العمل مع الصوتيات الخاصة بـ خطاب. هذا تطور مثير للجدل للغاية ومثيرة للجدل في الذكاء الاصطناعي ، ويستحق نصيبه من الاهتمام في وسائل الإعلام التقنية وخارجها.

لماذا قد تتطلب بعض مشاريع التعلم الآلي عددًا كبيرًا من الجهات الفاعلة؟