جدول المحتويات:
تعريف - ماذا يعني تجهيز البيانات؟
المعالجة المسبقة للبيانات هي تقنية لاستخراج البيانات تتضمن تحويل البيانات الخام إلى تنسيق يمكن فهمه. غالبًا ما تكون بيانات العالم الحقيقي غير مكتملة أو غير متسقة و / أو تفتقر إلى بعض السلوكيات أو الاتجاهات ، ومن المحتمل أن تحتوي على العديد من الأخطاء. تعتبر المعالجة المسبقة للبيانات طريقة مجربة لحل مثل هذه المشكلات. تجهيز البيانات قبل تجهيز البيانات الخام لمزيد من المعالجة.
يتم استخدام المعالجة المسبقة للبيانات في تطبيقات قائمة على قواعد البيانات مثل إدارة علاقات العملاء والتطبيقات المستندة إلى القواعد (مثل الشبكات العصبية).
يشرح Techopedia معالجة البيانات
تمر البيانات عبر سلسلة من الخطوات أثناء المعالجة المسبقة:
- تنظيف البيانات: يتم تنظيف البيانات من خلال عمليات مثل ملء القيم المفقودة أو تجانس البيانات المزعجة أو حل التناقضات في البيانات.
- تكامل البيانات: يتم تجميع البيانات ذات التمثيلات المختلفة معًا ويتم حل التعارضات داخل البيانات.
- تحويل البيانات: يتم تطبيع البيانات وتجميعها وتعميمها.
- تقليل البيانات: تهدف هذه الخطوة إلى تقديم تمثيل مخفض للبيانات في مستودع البيانات.
- تقديرية البيانات: تتضمن تقليل عدد قيم السمة المستمرة بتقسيم نطاق فواصل السمة.
