Cel mai bun răspuns
Cloudera este lider de piață în comunitatea hadoop, așa cum a fost Redhat în Comunitatea Linux. (Așa cum a fost indicat și alt răspuns)
Cloudera este un produs umbrelă care se ocupă de sistemele de date mari. Având Apache Hadoop la bază, Cloudera a creat o arhitectură care are aproape toate componentele necesare procesării bigdata.
Dacă puneți această întrebare pentru a afla calea de învățare sau călătoria dvs. către Hadoop, pot spune în siguranță puteți începe cu Cloudera, dar nu vă opriți la asta. Înțelegerea arhitecturii este mai importantă decât învățarea a ceea ce oferă acest sistem.
Dacă veți înțelege, ce este nevoie pentru a construi un sistem în jurul valorii de bigdata, cine știe că puteți ajunge să construiți ceva pe linia CentOS care poate da concurență directă către Cloudera 🙂
Răspuns
Apache Hadoop este distribuția Hadoop din comunitatea Apache, în timp ce Cloudera Hadoop are propria distribuție Hadoop, care, evident, este construită deasupra Apache Hadoop. nu au ultima versiune de Hadoop. Cloudera Hadoop include instrumente suplimentare \ tehnologii care nu sunt prezente în alte distribuții Hadoop precum Cloudera Search, Impala, Cloudera Navigator și Cloudera Manager. Cu aceste instrumente suplimentare Cloudera Hadoop se dovedește a fi parțial open source și parțial proprietar.