Beste antwoord
Cloudera is marktleider in de hadoop-gemeenschap zoals Redhat in de Linux-gemeenschap. (Zoals een ander antwoord aangeeft)
Cloudera is een overkoepelend product dat zich bezighoudt met big data-systemen. Met Apache Hadoop als kern, heeft Cloudera een architectuur gecreëerd die bijna alle componenten bevat die nodig zijn om bigdata te verwerken.
Als je deze vraag stelt om je leertraject of reis naar Hadoop te ontdekken, kan ik dat gerust zeggen je kunt beginnen met Cloudera, maar stop daar niet bij. Het begrijpen van architectuur is belangrijker dan het leren van wat dit systeem biedt.
Als je begrijpt wat er nodig is om een systeem rond bigdata te bouwen, wie weet bouw je misschien iets op de lijn van CentOS dat kan geven directe concurrentie met Cloudera 🙂
Antwoord
Apache Hadoop is de Hadoop-distributie van Apache Community, terwijl Cloudera Hadoop zijn eigen distributie van Hadoop heeft die uiteraard bovenop Apache Hadoop is gebouwd hebben niet de laatste release van Hadoop. Cloudera Hadoop bevat aanvullende tools \ technologieën die niet aanwezig zijn in andere Hadoop-distributies zoals Cloudera Search, Impala, Cloudera Navigator en Cloudera Manager. Met deze extra tools blijkt Cloudera Hadoop gedeeltelijk open source en gedeeltelijk eigendom te zijn.