La mejor respuesta
Cloudera es líder del mercado en la comunidad hadoop como lo ha sido Redhat en la comunidad Linux. (Como se indicó en otra respuesta)
Cloudera es un producto paraguas que se ocupa de sistemas de big data. Con Apache Hadoop en el núcleo, Cloudera ha creado una arquitectura que tiene casi todos los componentes necesarios para procesar bigdata.
Si está haciendo esta pregunta para averiguar su ruta de aprendizaje o viaje a Hadoop, puedo decir con seguridad que puedes empezar con Cloudera pero no te detengas en eso. Comprender la arquitectura es más importante que aprender lo que proporciona este sistema.
Si comprende lo que se necesita para construir un sistema alrededor de bigdata, quién sabe, puede terminar construyendo algo en la línea de CentOS que competencia directa a Cloudera 🙂
Respuesta
Apache Hadoop es la distribución de Hadoop de Apache Community, mientras que Cloudera Hadoop tiene su propia distribución de Hadoop que obviamente está construida sobre Apache Hadoop, por lo tanto, puede no tiene la última versión de Hadoop. Cloudera Hadoop incluye herramientas / tecnologías adicionales que no están presentes en otras distribuciones de Hadoop como Cloudera Search, Impala, Cloudera Navigator y Cloudera Manager. Con estas herramientas adicionales, Cloudera Hadoop resulta ser parcialmente de código abierto y parcialmente propietario.