جدول المحتويات:
التعريف - ماذا تعني البيانات القذرة؟
تشير البيانات المتسخة إلى البيانات التي تحتوي على معلومات خاطئة. يمكن استخدامه أيضًا عند الإشارة إلى البيانات الموجودة في الذاكرة والتي لم يتم تحميلها بعد في قاعدة البيانات. الإزالة الكاملة للبيانات القذرة من مصدر غير عملية أو مستحيلة تقريبًا.
البيانات التالية يمكن اعتبارها بيانات متسخة:
- البيانات المضللة
- بيانات مكررة
- بيانات غير صحيحة
- بيانات غير دقيقة
- بيانات غير متكاملة
- البيانات التي تنتهك قواعد العمل
- البيانات دون تنسيق معمم
- علامات ترقيم أو تهجئة غير صحيحة
يشرح Techopedia البيانات القذرة
بالإضافة إلى إدخال البيانات غير الصحيح ، يمكن إنشاء بيانات متسخة بسبب الأساليب غير الصحيحة في إدارة البيانات وتخزين البيانات. بعض أنواع البيانات القذرة موضحة أدناه:
- بيانات غير صحيحة - للتأكد من صحة البيانات أو صحتها ، يجب أن تتوافق القيمة التي تم إدخالها مع القيم الصحيحة للحقل. على سبيل المثال ، يجب أن تتراوح القيمة التي تم إدخالها في حقل الشهر من 1 إلى 12 ، أو يجب أن يكون عمر الفرد أقل من 130. قد يتم تطبيق صحة قيمة البيانات برمجيًا عن طريق جداول البحث أو مع عمليات تدقيق التحرير.
- بيانات غير دقيقة - من الممكن أن تكون قيمة البيانات صحيحة ولكن غير دقيقة. في بعض الأحيان ، يكون من العملي فحص الملفات أو الحقول الأخرى لمعرفة ما إذا كانت قيمة البيانات دقيقة استنادًا إلى السياق المستخدم. ومع ذلك ، لا يمكن التحقق من الدقة غالبًا إلا عن طريق التحقق اليدوي.
- انتهاكات قواعد العمل - البيانات التي تنتهك قاعدة العمل هي نوع آخر من البيانات القذرة. على سبيل المثال ، يجب أن يأتي التاريخ الفعلي دائمًا قبل تاريخ انتهاء الصلاحية. مثال آخر على انتهاك قاعدة العمل يمكن أن يكون مطالبة بالتأمين على الرعاية الطبية للمريض حيث قد يكون المريض دون سن التقاعد ولا يحق له الحصول على الرعاية الطبية.
- بيانات غير متسقة - يؤدي التكرار غير المحدد للبيانات إلى عدم تناسق البيانات. تتأثر كل مؤسسة ببيانات غير متناسقة ومتكررة. هذا هو الحال بشكل خاص مع بيانات العملاء.
- البيانات غير المكتملة - البيانات ذات القيم المفقودة هي النوع الرئيسي من البيانات غير الكاملة.
- بيانات مكررة - قد تحدث بيانات مكررة بسبب الإرسالات المتكررة أو ربط البيانات غير الصحيح أو خطأ المستخدم.
من أجل زيادة جودة البيانات ومنع البيانات القذرة ، ينبغي للمنظمات أن تدمج منهجيات لضمان اكتمال البيانات وصحتها وتناسقها وصحتها.
