Najlepsza odpowiedź
Cloudera jest liderem rynku w społeczności hadoop, podobnie jak Redhat w społeczności Linuksa. (Jak wskazano w innej odpowiedzi)
Cloudera to produkt parasolowy zajmujący się systemami dużych zbiorów danych. Opierając się na Apache Hadoop, Cloudera stworzyła architekturę, która ma prawie wszystkie komponenty niezbędne do przetwarzania dużych danych.
Jeśli zadajesz to pytanie, aby poznać swoją ścieżkę uczenia się lub podróż do Hadoop, mogę śmiało powiedzieć, że możesz zacząć od Cloudera, ale nie poprzestawaj na tym. Zrozumienie architektury jest ważniejsze niż poznanie tego, co zapewnia ten system.
Jeśli zrozumiesz, czego potrzeba, aby zbudować system na podstawie bigdata, kto wie, że możesz w końcu zbudować coś na linii CentOS, co może dać bezpośrednia konkurencja dla Cloudera 🙂
Odpowiedź
Apache Hadoop to dystrybucja Hadoop ze społeczności Apache, podczas gdy Cloudera Hadoop ma własną dystrybucję Hadoop, która oczywiście jest zbudowana na bazie Apache Hadoop, dlatego może nie mają najnowszej wersji Hadoop. Cloudera Hadoop zawiera dodatkowe narzędzia \ technologie, które nie są obecne w innych dystrybucjach Hadoop, takich jak Cloudera Search, Impala, Cloudera Navigator i Cloudera Manager. Dzięki tym dodatkowym narzędziom Cloudera Hadoop okazuje się częściowo open source i częściowo zastrzeżone.