بيت سمعي لماذا التعبئة في تعلم الآلة تقلل من التباين؟

لماذا التعبئة في تعلم الآلة تقلل من التباين؟

Anonim

Q:

لماذا التعبئة في تعلم الآلة تقلل من التباين؟

أ:

يقلل تجميع الإقلاع أو "التعبئة" في التعلم الآلي من التباين من خلال إنشاء نماذج أكثر تقدماً من مجموعات البيانات المعقدة. على وجه التحديد ، يُنشئ نهج التعبئة مجموعات فرعية تتداخل غالبًا لنمذجة البيانات بطريقة أكثر ارتباطًا.

أحد الأفكار المثيرة للاهتمام والمباشرة حول كيفية تطبيق التعبئة هو أخذ مجموعة من العينات العشوائية واستخراج المتوسط ​​البسيط. ثم ، باستخدام نفس مجموعة العينات ، قم بإنشاء العشرات من المجموعات الفرعية التي تم إنشاؤها كأشجار قرارات لمعالجة النتائج النهائية. يجب أن يظهر الوسط الثاني صورة حقيقية عن كيفية ارتباط تلك العينات الفردية ببعضها البعض من حيث القيمة. يمكن تطبيق نفس الفكرة على أي خاصية لأي مجموعة من نقاط البيانات.

تحميل مجاني: تعلم الآلة ولماذا يهم

نظرًا لأن هذا النهج يدمج الاكتشاف في حدود أكثر تحديدًا ، فإنه يقلل من التباين ويساعد في التجهيز الزائد. التفكير في scatterplot مع نقاط البيانات الموزعة إلى حد ما. باستخدام طريقة التعبئة ، يقوم المهندسون "بتقليص" التعقيد وتوجيه خطوط الاكتشاف لتنعيم المعلمات.

يتحدث البعض عن قيمة التعبئة على أنها "فرق تسد" أو نوع من "الاستدلال المساعد". تكمن الفكرة في أنه من خلال نمذجة المجموعات ، مثل استخدام الغابات العشوائية ، يمكن لمن يستخدمون التعبئة كطريقة الحصول على نتائج بيانات أقل في التباين. من حيث تقليل التعقيد ، يمكن أن يساعد التغليف أيضًا في التجهيز. فكر في نموذج يحتوي على الكثير من نقاط البيانات: على سبيل المثال ، نقطة اتصال تضم 100 نقطة غير محاذاة. سيكون خط البيانات المرئية الناتج خشنة وديناميكية ومتقلبة. ثم "استنفد" الفرق من خلال تجميع مجموعات من التقييمات. في التعلم التجميعي ، غالبًا ما يُعتقد أن هذا ينضم إلى العديد من "المتعلمين الضعفاء" لتقديم نتيجة تعاونية "التعلم القوي". والنتيجة هي وجود خط بيانات أكثر سلاسة وأكثر إحيطًا وأقل تباينًا في النموذج.

من السهل أن نرى كيف يمكن تطبيق فكرة التعبئة على أنظمة تكنولوجيا المعلومات الخاصة بالمؤسسات. غالبًا ما يرغب قادة الأعمال في "رؤية عين الطير" لما يحدث مع المنتجات ، والعملاء ، وما إلى ذلك. يمكن للنموذج المجهز أن يُرجع بيانات أقل هضمًا ، ونتائج أكثر "تشتتًا" ، حيث يمكن للتعبئة "تثبيت" نموذج وجعله أكثر فائدة للمستخدمين النهائيين.

لماذا التعبئة في تعلم الآلة تقلل من التباين؟