بيت اتجاهات ما هي طريقة بسيطة لوصف التحيز والتباين في التعلم الآلي؟

ما هي طريقة بسيطة لوصف التحيز والتباين في التعلم الآلي؟

Anonim

Q:

ما هي طريقة بسيطة لوصف التحيز والتباين في التعلم الآلي؟

أ:

هناك أي عدد من الطرق المعقدة لوصف التحيز والتباين في التعلم الآلي. يستخدم الكثير منها معادلات رياضية معقدة بشكل كبير ويوضح من خلال الرسوم البيانية كيف تمثل الأمثلة المحددة كميات مختلفة من كل من التحيز والتباين.

إليك طريقة بسيطة لوصف التحيز والتباين والمفاضلة بين التحيزات / التباين في التعلم الآلي.

في جوهرها ، والتحيز هو التبسيط المفرط. قد يكون من المهم أن نضيف إلى تعريف التحيز بعض الافتراضات أو الخطأ المفترض.

إذا لم تكن النتيجة المتحيزة للغاية عن طريق الخطأ - إذا كانت على المال - فستكون دقيقة للغاية. تكمن المشكلة في أن النموذج المبسط يحتوي على بعض الأخطاء ، لذا فهو ليس في عين الثور - فالخطأ المهم يتكرر أو يتضخم أثناء عمل برنامج التعلم الآلي.

التعريف البسيط للاختلاف هو أن النتائج مبعثرة للغاية. يؤدي هذا غالبًا إلى فرط البرنامج ومشاكل بين مجموعات الاختبار والتدريب.

التباين العالي يعني أن التغييرات الصغيرة تخلق تغييرات كبيرة في المخرجات أو النتائج.

هناك طريقة أخرى لوصف التباين ببساطة وهي أن هناك الكثير من الضجيج في النموذج ، وبالتالي يصبح من الصعب على برنامج التعلم الآلي عزل الإشارة الحقيقية وتحديدها.

لذا فإن أحد أبسط الطرق لمقارنة التحيز والتباين هو اقتراح أن على مهندسي التعليم الآلي أن يسيروا على خط رفيع بين الكثير من التحيز أو التبسيط المفرط ، والكثير من التباين أو فرط التفاؤل.

هناك طريقة أخرى لتمثيل هذا البئر وهي وجود مخطط رباعي المربعات يُظهر جميع مجموعات التباين العالي والمنخفض. في الربع المنخفض من التحيز / التباين المنخفض ، يتم جمع كل النتائج معًا في مجموعة دقيقة. في درجة عالية من التحيز / التباين المنخفض ، يتم تجميع كل النتائج معًا في مجموعة غير دقيقة. في النتيجة ذات التباين المنخفض / التباين العالي ، يتم توزيع النتائج حول نقطة مركزية تمثل مجموعة دقيقة ، بينما في النتائج ذات التباين العالي / التباين العالي ، تكون نقاط البيانات مبعثرة وغير دقيقة بشكل جماعي.

ما هي طريقة بسيطة لوصف التحيز والتباين في التعلم الآلي؟