بيت قواعد بيانات ما هو اكتشاف المعرفة في قواعد البيانات (kdd)؟ - تعريف من techopedia

ما هو اكتشاف المعرفة في قواعد البيانات (kdd)؟ - تعريف من techopedia

جدول المحتويات:

Anonim

التعريف - ماذا يعني اكتشاف المعرفة في قواعد البيانات (KDD)؟

اكتشاف المعرفة في قواعد البيانات (KDD) هو عملية اكتشاف المعرفة المفيدة من مجموعة من البيانات. تقنية استخراج البيانات المستخدمة على نطاق واسع هي عملية تشمل إعداد البيانات واختيارها ، وتنظيف البيانات ، ودمج المعرفة السابقة في مجموعات البيانات وتفسير الحلول الدقيقة من النتائج المرصودة.

مجالات التطبيق الرئيسية KDD تشمل التسويق ، والكشف عن الاحتيال ، والاتصالات السلكية واللاسلكية والتصنيع.

تيكوبيديا تشرح اكتشاف المعرفة في قواعد البيانات (KDD)

تقليديا ، تم إجراء التنقيب عن البيانات واكتشاف المعرفة يدويًا. مع مرور الوقت ، نمت كمية البيانات في العديد من الأنظمة لتصبح أكبر من حجم تيرابايت ، ولم يعد بالإمكان الحفاظ عليها يدويًا. علاوة على ذلك ، من أجل وجود أي عمل تجاري بنجاح ، يعتبر اكتشاف الأنماط الأساسية في البيانات أمرًا ضروريًا. نتيجة لذلك ، تم تطوير العديد من أدوات البرمجيات لاكتشاف البيانات المخفية وجعل الافتراضات ، والتي شكلت جزءًا من الذكاء الاصطناعي.

وصلت عملية KDD إلى ذروتها في السنوات العشر الماضية. يضم الآن العديد من الطرق المختلفة للاكتشاف ، والتي تشمل التعلم الاستقرائي ، والإحصاءات البيزية ، والاستعلام الدلالي الأمثل ، واكتساب المعرفة لنظم الخبراء ونظرية المعلومات. الهدف النهائي هو استخراج المعرفة رفيعة المستوى من البيانات منخفضة المستوى.

KDD تشمل أنشطة متعددة التخصصات. ويشمل ذلك تخزين البيانات والوصول إليها ، وتوسيع نطاق الخوارزميات إلى مجموعات البيانات الضخمة وتفسير النتائج. عملية تطهير البيانات والوصول إلى البيانات المضمنة في تخزين البيانات تسهل عملية KDD. الذكاء الاصطناعي يدعم أيضا KDD من خلال اكتشاف القوانين التجريبية من التجارب والملاحظات. يجب أن تكون الأنماط المعترف بها في البيانات صالحة في البيانات الجديدة ، وأن تتمتع بدرجة معينة من اليقين. تعتبر هذه الأنماط معرفة جديدة. الخطوات المتضمنة في عملية KDD بالكامل هي:

  1. حدد هدف عملية KDD من منظور العميل.
  2. فهم مجالات التطبيق المعنية والمعرفة المطلوبة
  3. حدد مجموعة بيانات مستهدفة أو مجموعة فرعية من عينات البيانات التي سيتم إجراء الاكتشاف عليها.
  4. قم بتطهير ومعالجة البيانات من خلال تحديد الاستراتيجيات للتعامل مع الحقول المفقودة وتغيير البيانات وفقًا للمتطلبات.
  5. تبسيط مجموعات البيانات عن طريق إزالة المتغيرات غير المرغوب فيها. ثم ، تحليل الميزات المفيدة التي يمكن استخدامها لتمثيل البيانات ، اعتمادا على الهدف أو المهمة.
  6. تطابق أهداف KDD مع طرق استخراج البيانات لاقتراح أنماط خفية.
  7. اختر خوارزميات استخراج البيانات لاكتشاف الأنماط المخفية. تتضمن هذه العملية تحديد النماذج والمعلمات التي قد تكون مناسبة لعملية KDD الشاملة.
  8. ابحث عن أنماط الاهتمام في شكل تمثيلي معين ، والذي يتضمن قواعد التصنيف أو الأشجار ، والانحدار والتجميع.
  9. تفسير المعرفة الأساسية من أنماط الملغومة.
  10. استخدم المعرفة ودمجها في نظام آخر لمزيد من العمل.
  11. قم بتوثيقها وتقديم تقارير للأطراف المعنية.
ما هو اكتشاف المعرفة في قواعد البيانات (kdd)؟ - تعريف من techopedia