جدول المحتويات:
- التعريف - ماذا تعني البيانات المفتوحة المصدر لتحليل البيانات؟
- تشرح Techopedia تحليلات البيانات الكبيرة مفتوحة المصدر
التعريف - ماذا تعني البيانات المفتوحة المصدر لتحليل البيانات؟
تشير تحليلات البيانات الكبيرة مفتوحة المصدر إلى استخدام برامج وأدوات مفتوحة المصدر لتحليل كميات هائلة من البيانات من أجل جمع المعلومات ذات الصلة والقابلة للتنفيذ التي يمكن أن تستخدمها المنظمة لتعزيز أهداف أعمالها. يعد Apache's Hadoop أكبر لاعب في تحليلات البيانات الكبيرة مفتوحة المصدر - وهي مكتبة البرامج الأكثر استخدامًا على نطاق واسع لمعالجة مجموعات البيانات الضخمة عبر مجموعة من أجهزة الكمبيوتر باستخدام عملية موزعة للتوازي.
تشرح Techopedia تحليلات البيانات الكبيرة مفتوحة المصدر
تستخدم تحليلات البيانات الكبيرة مفتوحة المصدر برامج وأدوات مفتوحة المصدر من أجل تنفيذ تحليلات البيانات الضخمة إما باستخدام نظام أساسي برمجي كامل أو أدوات متعددة المصادر مفتوحة لمهام مختلفة في عملية تحليل البيانات. يعد Apache Hadoop أكثر الأنظمة المعروفة لتحليلات البيانات الضخمة ، ولكن هناك حاجة إلى مكونات أخرى قبل أن يتم تجميع نظام تحليلات حقيقي.
Hadoop هو تطبيق مفتوح المصدر لخوارزمية MapReduce رائدة من قِبل Google و Yahoo ، لذلك فهو أساس معظم أنظمة التحليل اليوم. تستخدم العديد من أدوات تحليل البيانات الكبيرة المصادر المفتوحة ، بما في ذلك أنظمة قواعد البيانات القوية مثل MongoDB مفتوح المصدر ، وقاعدة بيانات NoSQL متطورة وقابلة للتطوير ومناسبة للغاية لتطبيقات البيانات الكبيرة ، وكذلك غيرها.
تشمل خدمات تحليل البيانات الكبيرة مفتوحة المصدر:
- نظام جمع البيانات
- مركز تحكم لإدارة ومراقبة الكتل
- آلة التعلم واستخراج البيانات المكتبة
- خدمة تنسيق التطبيق
- حساب المحرك
- إطار التنفيذ