Quelle est la différence entre Apache Hadoop et Cloudera dans le Big Data?


Meilleure réponse

Cloudera est leader du marché dans la communauté hadoop comme Redhat la été dans la communauté Linux. (Comme une autre réponse lindique)

Cloudera est un produit parapluie qui traite des systèmes Big Data. Ayant Apache Hadoop au cœur, Cloudera a créé une architecture qui contient presque tous les composants nécessaires pour traiter les bigdata.

Si vous posez cette question pour connaître votre parcours dapprentissage ou votre parcours vers Hadoop, je peux dire en toute sécurité que vous pouvez commencer avec Cloudera mais ne vous arrêtez pas là. Comprendre larchitecture est plus important que dapprendre ce que ce système fournit.

Si vous comprenez, ce quil faut pour construire un système autour de bigdata, qui sait que vous pouvez finir par construire quelque chose sur la ligne de CentOS qui peut donner concurrence directe à Cloudera 🙂

Réponse

Apache Hadoop est la distribution Hadoop de la communauté Apache tandis que Cloudera Hadoop a sa propre distribution de Hadoop qui est évidemment construite sur Apache Hadoop donc peut nont pas la dernière version de Hadoop. Cloudera Hadoop inclut des outils \ technologies supplémentaires qui ne sont pas présents dans dautres distributions Hadoop telles que Cloudera Search, Impala, Cloudera Navigator et Cloudera Manager. Avec ces outils supplémentaires, Cloudera Hadoop savère être partiellement open source et partiellement propriétaire.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *