بيت اتجاهات كيف يمكن لبيئات مستودع البيانات الحالية أن تتوسع على نحو أفضل لتلبية احتياجات تحليلات البيانات الكبيرة؟

كيف يمكن لبيئات مستودع البيانات الحالية أن تتوسع على نحو أفضل لتلبية احتياجات تحليلات البيانات الكبيرة؟

Anonim

Q:

كيف يمكن لبيئات مستودع البيانات الحالية أن تتوسع على نحو أفضل لتلبية احتياجات تحليلات البيانات الكبيرة؟

أ:

يجب تقييم مشاريع مستودعات البيانات الفردية على أساس كل حالة على حدة. بشكل عام ، في محاولة لتوسيع تصميم مستودع بيانات حالي للتعامل بشكل أفضل مع تحليلات البيانات الكبيرة ، هناك عملية أساسية لمعرفة ما يجب القيام به. يمكن لمتخصصي تكنولوجيا المعلومات تسمية هذا "التوسع" أو "التوسع".

الويبينار: Big Iron ، تعرف على البيانات الكبيرة: تحرير بيانات Mainframe باستخدام Hadoop & Spark

سجل هنا

يتضمن التوسع بشكل عام النظر في الحصول على طاقة معالجة كافية ، والحصول على كمية كافية من الذاكرة ، واستيعاب أنشطة الخادم الأكثر قوة للتعامل مع جميع مجموعات البيانات الأكبر التي ستعمل الشركة على معالجتها. على النقيض من ذلك ، فإن التوسع التدريجي يمكن أن يعني جمع مجموعات من أجهزة الخادم وإقامة الشبكات بينها لربط البيانات الضخمة.

اقترح بعض خبراء تقنية المعلومات أن الطريقة الأكثر شيوعًا مع Apache Hadoop وغيرها من أدوات ومنصات البيانات الكبيرة الشائعة هي توسيع نطاق الأجهزة وتجميعها لتحقيق التأثيرات المطلوبة. ومع ذلك ، يشير آخرون إلى أنه باستخدام تقنية اليوم ، يمكن لمستودع البيانات زيادة حجمه باستخدام استراتيجية المشتريات التي تضيف الموارد إلى الخادم ، مثل الحصول على عدد أكبر من مراكز المعالجة جنبًا إلى جنب مع كمية أكبر من ذاكرة الوصول العشوائي.

سواء أكان حجمها أو توسيع نطاقها ، تحتاج مستودعات البيانات إلى أصول أجهزة فعلية إضافية لتكون قادرة على التعامل مع أعباء عمل البيانات الكبيرة. كما أنهم بحاجة إلى إدارة بشرية إضافية ، مما يعني المزيد من التدريب للفرق الداخلية. يحتاج الكثير من التخطيط إلى الذهاب إلى المشروع لتحديد نوع الضغط والضغط الذي ستلحقه أعباء عمل البيانات الأكبر على نظام قديم موجود من أجل تجهيزه بنظام بيئي كبير للبيانات. تتمثل إحدى المشكلات الكبيرة في اختناقات التخزين ، والتي تتطلب ترقيات إلى مراكز التخزين ، وأنواع أخرى من اختناقات الأداء التي قد تعوق نظامًا ناشئًا إن لم يتم معالجتها.

كيف يمكن لبيئات مستودع البيانات الحالية أن تتوسع على نحو أفضل لتلبية احتياجات تحليلات البيانات الكبيرة؟