بيت ومن الأعمال ما هو التنقيب عن البيانات غير منظم؟ - تعريف من techopedia

ما هو التنقيب عن البيانات غير منظم؟ - تعريف من techopedia

جدول المحتويات:

Anonim

التعريف - ماذا يعني تعدين البيانات غير المهيكلة؟

استخراج البيانات غير المهيكلة هو ممارسة النظر إلى البيانات غير المهيكلة نسبيًا ومحاولة الحصول على مزيد من مجموعات البيانات المكررة منها. وغالبًا ما يتكون من استخراج البيانات من المصادر غير المستخدمة تقليديًا في أنشطة استخراج البيانات.


يشرح Techopedia تعدين البيانات غير المهيكلة

بشكل عام ، يعد التنقيب عن البيانات ممارسة تمشيط عبر مجموعات البيانات ومحاولة الحصول على بتات المعلومات الأكثر قيمة في تنسيق محدد. هذا هو عادة أكثر صعوبة مع البيانات غير منظم نسبيا. يعرّف خبراء تقنية المعلومات البيانات غير المهيكلة بأنها بيانات ليست بتنسيق معين أو بيانات "ثقيلة بالنص" أو بيانات "مخفية" في مستندات غير دقيقة لا يُطلب منها رسميًا تقديم معلومات تقنية.


مثال على مستند غير منظم سيكون خطاب أو مراسلات بين طرفين أو أكثر. في التنقيب غير المنظم للبيانات ، ستقوم التقنيات بتفكيك تلك الرسالة ، وتبحث عن محددات محددة وبتات من المعلومات مثل أسماء الأطراف ذات الصلة ، وتواريخ إرسال الرسائل ، وأسماء الشركات المعنية ، ومبالغ العملة أو غيرها من المقاييس الكمية. بت من البيانات ، أو الرموز المخصصة لمنتجات أو خدمات أو صفقات معينة. يتم استخراج هذه الأنواع من البيانات ثم وضعها في تنسيق يمكن للشركات أو الأطراف الأخرى استخدامها كمرجع سريع أو لتطبيقات ذكاء الأعمال المتقدمة.

ما هو التنقيب عن البيانات غير منظم؟ - تعريف من techopedia