جدول المحتويات:
- خرافة: الجميع أمامنا في اعتماد البيانات الكبيرة.
- خرافة: لدينا الكثير من البيانات. لا داعي للقلق بشأن كل عيوب البيانات الصغيرة.
- خرافة: تكنولوجيا البيانات الكبيرة سوف تلغي الحاجة إلى تكامل البيانات.
- خرافة: استخدام مستودع البيانات للتحليلات المتقدمة لا طائل منه.
- الخرافة: سوف تحل بحيرات البيانات محل مستودع البيانات.
- البيانات الكبيرة يعمل - أساليب معالجة البيانات الجديدة قد لا
في مايو 2014 ، أصدرت Forrester Research تقريرين يستخلصان بعض الاستنتاجات حول الضجيج المحيط بالبيانات الضخمة. استطلعت شركة الأبحاث أكثر من 250 من المديرين التنفيذيين للتسويق وتطوير الأعمال. وفقًا لمؤلفي التقرير ، فإن خطاب البيانات الضخمة بلغ أعلى مستوياته على الإطلاق ، ويقوم بائعو التكنولوجيا بترويج المنتجات بما يبدو أنها مطالبات لا تصدق.
يتفق غارتنر مع شركة Forrester Research ؛ الضجيج الكبير يحيط البيانات الكبيرة. في تقرير أيلول (سبتمبر) 2014 ، كشف Gartner عن خمسة من أكبر أساطير البيانات ، ويقدم محللو Gartner رأيهم بشأن ما يساء فهمه بشأن البيانات الضخمة ومعالجتها. فما هي أكبر الخرافات البيانات الكبيرة؟ لنلقي نظرة.
خرافة: الجميع أمامنا في اعتماد البيانات الكبيرة.
يقول غارتنر إن الاهتمام بالبيانات الضخمة في أعلى مستوياته على الإطلاق. وعلى الرغم من ذلك ، فإن 13 في المائة ممن شملهم الاستطلاع لديهم أنظمة عمل. السبب: لا يزال يتعين على معظم الشركات معرفة كيفية استخراج أي قيمة من مستودعات البيانات الكبيرة. هنا ، يعد استطلاع Gartner أكثر تفاؤلاً من تقرير Forrester ، الذي وجد أن 9 بالمائة فقط من المشاركين في الاستطلاع قالوا إنهم يخططون لتنفيذ تكنولوجيات البيانات الكبيرة خلال العام المقبل. (البيانات الكبيرة لديها الكثير لتقدمه. معرفة المزيد في 5 مشاكل في العالم الحقيقي يمكن للبيانات الكبيرة حلها.)خرافة: لدينا الكثير من البيانات. لا داعي للقلق بشأن كل عيوب البيانات الصغيرة.
يساور غارتنر قلق بشأن إحساسنا بالبشر: "لدينا الكثير ، والقليل من السوء لن يكون مهمًا". يعتقد تيد فريدمان ، نائب الرئيس والمحلل المتميز في غارتنر ، أن هذه هي الطريقة الخاطئة للنظر إلى الوضع.
وقال فريدمان "في الواقع ، على الرغم من أن كل عيب فردي له تأثير أقل بكثير على مجموعة البيانات بأكملها مما كان عليه عندما كانت البيانات أقل ، فهناك عيوب أكثر من ذي قبل لأن هناك بيانات أكثر". "لذلك ، فإن التأثير الكلي لبيانات ذات نوعية رديئة على مجموعة البيانات بأكملها لا يزال كما هو."
ويضيف فريدمان سببًا آخر للقلق. غالبًا ما يشتمل التقاط البيانات الضخمة على بيانات من خارج العمل ، وهو بالتالي غير معروف البنية والأصل. هذا يزيد من احتمال الأخطاء.
خرافة: تكنولوجيا البيانات الكبيرة سوف تلغي الحاجة إلى تكامل البيانات.
هناك استراتيجيتان لتحليل البيانات يمكن تطبيقهما على البيانات الضخمة: "المخطط عند الكتابة" أو "المخطط قيد القراءة". حتى وقت قريب ، كان مخطط الكتابة هو الطريقة الوحيدة المستخدمة. مخطط القراءة هو الهوس الحالي في إدارة قواعد البيانات. على عكس المخطط على الكتابة ، والذي يتطلب تنسيقًا منظمًا ، يتم تحميل البيانات في قواعد بيانات المخطط في القراءة بتنسيقها الأولي. ثم يقوم المطورون - باستخدام منصات قواعد البيانات غير المهيكلة مثل Hadoop - بتحويل البيانات المختلفة إلى تنسيق قابل للاستخدام. يحتوي المخطط على قراءة مزايا واضحة ولكن ، كما يذكر Gartner ، يجب أن يحدث تكامل البيانات في مرحلة ما.خرافة: استخدام مستودع البيانات للتحليلات المتقدمة لا طائل منه.
يبدو أن قضاء الوقت في إنشاء مستودع بيانات لا معنى له بالنسبة إلى العديد من مديري المعلومات ، خاصةً عندما تكون البيانات التي تم التقاطها حديثًا مختلفة عن تلك الموجودة في مستودع البيانات. ومع ذلك ، يحذر Gartner مرة أخرى من أن تحليلات البيانات المتقدمة ستستخدم مستودعات البيانات والبيانات الجديدة ، مما يعني أنه يجب على مدمجي البيانات:- تحسين أنواع البيانات الجديدة لجعلها مناسبة للتحليل
- حدد البيانات ذات الصلة ومستوى جودة البيانات المطلوبة
- تحديد كيفية تجميع البيانات
- نفهم أن تنقيح البيانات يمكن أن يحدث في أماكن أخرى غير مستودع البيانات
الخرافة: سوف تحل بحيرات البيانات محل مستودع البيانات.
بحيرات البيانات هي مستودعات لبيانات متباينة ، على عكس مستودعات البيانات حيث تكون البيانات بتنسيق منظم. يتطلب إنشاء بحيرة بيانات جهدًا بسيطًا قليلًا (لا حاجة لتنسيق البيانات) مقارنة بمستودعات البيانات ، وهذا هو السبب في أن بحيرات البيانات مهمة.
يؤكد Gartner على أن امتلاك البيانات ليس هو الهدف - فالمقدرة على معالجة البيانات التي تم التقاطها لاتخاذ قرارات مستنيرة هي النقطة الأساسية. علاوة على ذلك ، يعد استخدام بحيرات البيانات (غير المثبتة إلى حد ما) لتسهيل عملية صنع القرار مشكلة.
وقال نيك هاوديكر ، مدير الأبحاث في شركة غارتنر: "تمتلك مستودعات البيانات بالفعل قدرات لدعم مجموعة واسعة من المستخدمين في جميع أنحاء المنظمة". "قادة إدارة المعلومات ليسوا مضطرين إلى الانتظار لحيرات البيانات للحاق بها." (تعرف على المزيد حول اعتماد البيانات الضخمة في 7 أشياء يجب معرفتها حول البيانات الضخمة قبل التبني.)
البيانات الكبيرة يعمل - أساليب معالجة البيانات الجديدة قد لا
السبب الذي جعل غارتنر يقول "أكبر الخرافات البيانات" بدلاً من "الخرافات البيانات الكبيرة" يصبح واضحا بعد قراءة التقرير. غارتنر ليس حذرا من البيانات الكبيرة. غارتنر حذر من أولئك الذين يشعرون أن الأساليب الأحدث لمعالجة البيانات الضخمة جاهزة لـ "وقت الذروة".