Migliore risposta
Cloudera è leader di mercato nella comunità hadoop come Redhat lo è stata nella comunità Linux. (Come altra risposta indicata)
Cloudera è un prodotto ombrello che si occupa di sistemi di big data. Avendo Apache Hadoop al centro, Cloudera ha creato unarchitettura che ha quasi tutti i componenti necessari per elaborare i bigdata.
Se stai facendo questa domanda per scoprire il tuo percorso di apprendimento o viaggio verso Hadoop, posso tranquillamente affermare che puoi iniziare con Cloudera ma non fermarti a quello. Comprendere larchitettura è più importante che apprendere ciò che fornisce questo sistema.
Se capirai cosa serve per costruire un sistema attorno a bigdata, chissà che potresti finire per costruire qualcosa sulla linea di CentOS che può dare concorrenza diretta a Cloudera 🙂
Risposta
Apache Hadoop è la distribuzione di Hadoop dalla comunità di Apache mentre Cloudera Hadoop ha la sua distribuzione di Hadoop che ovviamente è costruita su Apache Hadoop quindi potrebbe non dispone dellultima versione di Hadoop. Cloudera Hadoop include strumenti \ tecnologie aggiuntivi che non sono presenti in altre distribuzioni Hadoop come Cloudera Search, Impala, Cloudera Navigator e Cloudera Manager. Con questi strumenti aggiuntivi Cloudera Hadoop risulta essere parzialmente open source e parzialmente proprietario.