Beste svaret
Cloudera er markedsleder innen hadoop-fellesskap slik Redhat har vært i Linux Community. (Som annet svar antydet)
Cloudera er et paraplyprodukt som håndterer big data-systemer. Å ha Apache Hadoop i kjernen, har Cloudera opprettet en arkitektur som har nesten alle komponenter som er nødvendige for å behandle bigdata.
Hvis du stiller dette spørsmålet for å finne ut din læringsvei eller reise til Hadoop, kan jeg trygt si at du kan starte med Cloudera, men ikke stopp på det. Å forstå arkitektur er viktigere for å lære hva dette systemet gir.
Hvis du forstår, hva som trengs for å bygge et system rundt bigdata, hvem vet at du kan ende opp med å bygge noe på linjen CentOS som kan gi direkte konkurranse til Cloudera 🙂
Svar
Apache Hadoop er Hadoop-distribusjonen fra Apache Community mens Cloudera Hadoop har sin egen distribusjon av Hadoop som åpenbart er bygget på toppen av Apache Hadoop derfor kan ikke har siste utgivelse av Hadoop. Cloudera Hadoop inkluderer tilleggsverktøy \ teknologier som ikke er tilstede i andre Hadoop-distribusjoner som Cloudera Search, Impala, Cloudera Navigator og Cloudera Manager. Med disse tilleggsverktøyene viser Cloudera Hadoop seg å være delvis åpen kildekode og delvis proprietær.