جدول المحتويات:
التعريف - ماذا يعني Hadoop Ecosystem؟
يشير النظام البيئي Hadoop إلى المكونات المختلفة لمكتبة برامج Apache Hadoop ، وكذلك الملحقات والأدوات التي توفرها Apache Software Foundation لهذه الأنواع من مشاريع البرامج ، وإلى الطرق التي يعملون بها معًا.
Hadoop هو إطار عمل قائم على Java وهو شائع للغاية للتعامل مع مجموعات كبيرة من البيانات وتحليلها.
تيكوبيديا تشرح Hadoop Ecosystem
كل من حزمة Hadoop الأساسية وملحقاتها هي في معظمها مشاريع مفتوحة المصدر مرخصة من قبل Apache. تتضمن فكرة النظام الإيكولوجي Hadoop استخدام أجزاء مختلفة من مجموعة Hadoop الأساسية مثل MapReduce ، إطار عمل للتعامل مع كميات هائلة من البيانات ، ونظام الملفات الموزعة Hadoop (HDFS) ، وهو نظام متطور لمعالجة الملفات. هناك أيضا YARN ، مدير موارد Hadoop.
بالإضافة إلى هذه العناصر الأساسية في Hadoop ، قدمت Apache أنواعًا أخرى من الملحقات أو الأدوات التكميلية للمطورين. وتشمل هذه Apache Hive ، أداة تحليل البيانات ؛ Apache Spark ، محرك عام لمعالجة البيانات الضخمة ؛ أباتشي خنزير ، لغة تدفق البيانات ؛ HBase ، أداة قاعدة بيانات ؛ وأيضًا Ambarl ، والذي يمكن اعتباره مديرًا للنظام البيئي Hadoop ، لأنه يساعد في إدارة استخدام موارد Apache المختلفة معًا. مع تحول Hadoop إلى المعيار الفعلي لجمع البيانات وتصبح في كل مكان في العديد من المنظمات ، يتعلم المديرون وقادة التطوير كل شيء عن النظام البيئي Hadoop وما هي أنواع الأشياء التي تشارك في إعداد Hadoop العام.