Nejlepší odpověď
Cloudera je lídrem na trhu v komunitě hadoopů, protože Redhat byl v komunitě Linux. (Jak je uvedeno v jiné odpovědi)
Cloudera je zastřešující produkt, který se zabývá systémy velkých dat. Díky jádru Apache Hadoop vytvořila Cloudera architekturu, která má téměř všechny komponenty nezbytné ke zpracování bigdata.
Pokud se ptáte na tuto otázku, abyste zjistili svoji cestu učení nebo cestu k Hadoop, mohu s jistotou říci, že můžete začít s Clouderou, ale nezastavujte se nad tím. Porozumění architektuře je důležitější, než když se naučíte, co tento systém poskytuje.
Pokud pochopíte, co je potřeba k vybudování systému kolem bigdata, kdo ví, že byste nakonec mohli postavit něco na linii CentOS, která může dát přímá konkurence Cloudera 🙂
Odpověď
Apache Hadoop je distribuce Hadoop z komunity Apache, zatímco Cloudera Hadoop má vlastní distribuci Hadoop, která je samozřejmě postavena na vrcholu Apache Hadoop, proto může nemá nejnovější verzi Hadoop. Cloudera Hadoop zahrnuje další nástroje \ technologie, které nejsou přítomny v jiných distribucích Hadoop, jako jsou Cloudera Search, Impala, Cloudera Navigator a Cloudera Manager. S těmito dalšími nástroji se Cloudera Hadoop ukazuje jako částečně otevřený a částečně proprietární.