Qual é a diferença entre Apache Hadoop e Cloudera em big data?


Melhor resposta

Cloudera é líder de mercado na comunidade hadoop assim como Redhat é na comunidade Linux. (Como outra resposta indicada)

Cloudera é um produto abrangente que lida com sistemas de big data. Tendo o Apache Hadoop no núcleo, Cloudera criou uma arquitetura que tem quase todos os componentes necessários para processar bigdata.

Se você está fazendo esta pergunta para descobrir seu caminho de aprendizagem ou jornada para o Hadoop, posso dizer com segurança que você pode começar com Cloudera, mas não pare por aí. Compreender a arquitetura é mais importante do que aprender o que este sistema oferece.

Se você entender, o que é necessário para construir um sistema em torno de bigdata, quem sabe você pode acabar construindo algo na linha do CentOS que pode dar competição direta com Cloudera 🙂

Resposta

Apache Hadoop é a distribuição Hadoop da Comunidade Apache, enquanto Cloudera Hadoop tem sua própria distribuição de Hadoop, que obviamente é construída sobre Apache Hadoop, portanto não tem a versão mais recente do Hadoop. O Cloudera Hadoop inclui ferramentas \ tecnologias adicionais que não estão presentes em outras distribuições do Hadoop, como Cloudera Search, Impala, Cloudera Navigator e Cloudera Manager. Com essas ferramentas adicionais, o Cloudera Hadoop acaba sendo parcialmente open source e parcialmente proprietário.

Deixe uma resposta

O seu endereço de email não será publicado. Campos obrigatórios marcados com *