Bedste svar
Cloudera er markedsleder inden for hadoop-samfund, som Redhat har været i Linux-community. (Som andet svar antydede)
Cloudera er et paraplyprodukt, der beskæftiger sig med big datasystemer. At have Apache Hadoop i kernen, Cloudera har skabt en arkitektur, der har næsten alle komponenter, der er nødvendige for at behandle bigdata.
Hvis du stiller dette spørgsmål for at finde ud af din læringsvej eller rejse til Hadoop, kan jeg med sikkerhed sige det du kan starte med Cloudera, men stop ikke med det. At forstå arkitektur er vigtigere end at lære, hvad dette system giver.
Hvis du forstår, hvad der kræves for at opbygge et system omkring bigdata, hvem ved, at du måske ender med at bygge noget på linjen CentOS, som kan give direkte konkurrence til Cloudera 🙂
Svar
Apache Hadoop er Hadoop-distributionen fra Apache Community, mens Cloudera Hadoop har sin egen distribution af Hadoop, som naturligvis er bygget oven på Apache Hadoop, derfor kan ikke har den seneste udgivelse af Hadoop. Cloudera Hadoop inkluderer yderligere værktøjer \ teknologier, som ikke er til stede i andre Hadoop-distributioner som Cloudera Search, Impala, Cloudera Navigator og Cloudera Manager. Med disse ekstra værktøjer viser Cloudera Hadoop sig at være delvist open source og delvist proprietær.