Beste Antwort
Cloudera ist Marktführer in der Hadoop-Community wie Redhat in der Linux-Community. (Wie in anderen Antworten angegeben)
Cloudera ist ein Dachprodukt, das sich mit Big-Data-Systemen befasst. Mit Apache Hadoop im Kern hat Cloudera eine Architektur geschaffen, die fast alle Komponenten enthält, die für die Verarbeitung von BigData erforderlich sind.
Wenn Sie diese Frage stellen, um Ihren Lernpfad oder Ihre Reise nach Hadoop herauszufinden, kann ich das mit Sicherheit sagen Sie können mit Cloudera beginnen, aber hören Sie nicht damit auf. Das Verständnis der Architektur ist wichtiger als das Erlernen der Funktionen dieses Systems.
Wenn Sie verstehen, was zum Aufbau eines Systems um BigData erforderlich ist, wer weiß, dass Sie möglicherweise etwas auf der CentOS-Linie aufbauen, das Ihnen helfen kann direkte Konkurrenz zu Cloudera 🙂
Antwort
Apache Hadoop ist die Hadoop-Distribution von Apache Community, während Cloudera Hadoop eine eigene Distribution von Hadoop hat, die offensichtlich auf Apache Hadoop basiert habe nicht die neueste Version von Hadoop. Cloudera Hadoop enthält zusätzliche Tools \ Technologien, die in anderen Hadoop-Distributionen wie Cloudera Search, Impala, Cloudera Navigator und Cloudera Manager nicht vorhanden sind. Mit diesen zusätzlichen Tools erweist sich Cloudera Hadoop als teilweise Open Source und teilweise proprietär.