A legjobb válasz
A Cloudera piacvezető a hadoop közösségben, ahogy Redhat a Linux közösségben. (Amint azt más válasz is jelezte)
A Cloudera egy ernyőtermék, amely nagy adatrendszerekkel foglalkozik. Az Apache Hadoop központi eleme a Cloudera egy olyan architektúrát hozott létre, amely szinte minden elemet tartalmaz, amely a bigdata feldolgozásához szükséges.
Ha ezt a kérdést teszi fel, hogy megtudja a Hadoop-ig tartó tanulási útját vagy utazását, nyugodtan mondhatom, hogy kezdheti a Cloudera-val, de ne álljon meg ennél. Az architektúra megértése fontosabb, hogy megtanulja, mit nyújt ez a rendszer.
Ha megérted, mi kell egy rendszer felépítéséhez bigdata köré, ki tudja, hogy a CentOS vonalán felépíthetsz valamit, ami adhat közvetlen verseny a Cloudera felé: nem rendelkezik a Hadoop legújabb kiadásával. A Cloudera Hadoop további eszközöket és technológiákat tartalmaz, amelyek nincsenek jelen a Hadoop más disztribúcióiban, mint például a Cloudera Search, az Impala, a Cloudera Navigator és a Cloudera Manager. Ezekkel a további eszközökkel kiderül, hogy a Cloudera Hadoop részben nyílt forráskódú és részben saját tulajdonú.