Wat is het verschil tussen Apache Hadoop en Cloudera in big data?


Beste antwoord

Cloudera is marktleider in de hadoop-gemeenschap zoals Redhat in de Linux-gemeenschap. (Zoals een ander antwoord aangeeft)

Cloudera is een overkoepelend product dat zich bezighoudt met big data-systemen. Met Apache Hadoop als kern, heeft Cloudera een architectuur gecreëerd die bijna alle componenten bevat die nodig zijn om bigdata te verwerken.

Als je deze vraag stelt om je leertraject of reis naar Hadoop te ontdekken, kan ik dat gerust zeggen je kunt beginnen met Cloudera, maar stop daar niet bij. Het begrijpen van architectuur is belangrijker dan het leren van wat dit systeem biedt.

Als je begrijpt wat er nodig is om een ​​systeem rond bigdata te bouwen, wie weet bouw je misschien iets op de lijn van CentOS dat kan geven directe concurrentie met Cloudera 🙂

Antwoord

Apache Hadoop is de Hadoop-distributie van Apache Community, terwijl Cloudera Hadoop zijn eigen distributie van Hadoop heeft die uiteraard bovenop Apache Hadoop is gebouwd hebben niet de laatste release van Hadoop. Cloudera Hadoop bevat aanvullende tools \ technologieën die niet aanwezig zijn in andere Hadoop-distributies zoals Cloudera Search, Impala, Cloudera Navigator en Cloudera Manager. Met deze extra tools blijkt Cloudera Hadoop gedeeltelijk open source en gedeeltelijk eigendom te zijn.

Geef een reactie

Het e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *