Vad är skillnaden mellan Apache Hadoop och Cloudera i stora data?


Bästa svaret

Cloudera är marknadsledande inom hadoop-communityn som Redhat har varit i Linux Community. (Som annat svar angav)

Cloudera är en paraplyprodukt som hanterar big data-system. Med Apache Hadoop i grunden har Cloudera skapat en arkitektur som har nästan alla komponenter som är nödvändiga för att bearbeta bigdata.

Om du ställer den här frågan för att ta reda på din inlärningsväg eller resa till Hadoop kan jag säkert säga att du kan börja med Cloudera men sluta inte med det. Att förstå arkitektur är viktigare att lära sig vad detta system ger.

Om du förstår, vad som krävs för att bygga ett system kring bigdata, vem vet att du kan hamna med att bygga något på linjen CentOS som kan ge direkt konkurrens till Cloudera 🙂

Svar

Apache Hadoop är Hadoop-distributionen från Apache Community medan Cloudera Hadoop har sin egen distribution av Hadoop som uppenbarligen är byggd ovanpå Apache Hadoop därför kan inte har senaste utgåvan av Hadoop. Cloudera Hadoop innehåller ytterligare verktyg \ teknologier som inte finns i andra Hadoop-distributioner som Cloudera Search, Impala, Cloudera Navigator och Cloudera Manager. Med dessa ytterligare verktyg visar sig Cloudera Hadoop vara delvis öppen källkod och delvis proprietär.

Lämna ett svar

Din e-postadress kommer inte publiceras. Obligatoriska fält är märkta *