Bästa svaret
Det beror på din nivå av statistik och sofistikerad programmering och på den miljö du arbetar i.
R är förmodligen det bästa alternativet om du har mycket god programmeringskunskap. Det är gratis och öppen källkod, så du har tillgång till nästan alla typer av statistiska funktioner på jorden; det är dock ett programmeringsspråk, inte ett statistiskt paket, så det är relativt svagt på fram- och bakändarna – vilket betyder datainmatning och förberedelse samt formatering och utdata. Om du kan programmera, och bara vill ha siffrorna snarare än en snygg utdata, är R förmodligen något för dig.
Formellt är SAS den närmaste motsvarigheten till SPSS genom att det är en helt strukturerad och funktionell statistik paket som kan hantera alla uppgifter för dataanalys från början till slut. Nackdelen är att SAS, precis som SPSS, inte prissätts för den enskilda användaren, med licenser som kostar fem siffror. (I detta föregår det faktiskt SPSS, som ändrade sin prissättningspolicy för att matcha SAS först efter många år i affärer.) Så du skulle vara lika osannolikt att köpa SAS som du skulle göra med SPSS, men om du arbetar i ett företag eller ett universitet, du skulle antagligen ha tillgång till det.
Det mest populära statistiska paketet för ekonomisk räckvidd för de flesta enskilda analytiker är Stata. Det ger ett brett utbud av datahantering och analysfunktioner till ett pris som är mycket lägre än antingen SAS eller SPSS (med ännu lägre priser för studenter). Om du behöver ett statistiskt paket och inte är ansluten till en enorm institution kan det här vara vägen att gå.
Svar
Svaret på detta beror på många faktorer. De största drivkrafterna i min erfarenhet är: 1). kännedom om programmering / CS, 2). var i programvarans livscykel du behöver programvaran, 3). datamängdsstorlek, 4). kostnadskänslighet och 5). grad i vilken portabilitet är viktigt / storebror berör.
1). Kännedom om programmering / CS: Om du är mycket bekant med dessa begrepp är det inget fel med C, JAVA, Fortran, Python eller R (listad från det mest till det minst utmanande att använda som en SPSS-ersättning enligt min mening). Även med R är det som människor inte påpekar tillräckligt brantheten i inlärningskurvan för människor som inte har mycket programmeringserfarenhet. Det är inte oöverstigligt och det finns många resurser där ute, men om du inte har använt en kommandorad förut så verkar även R vara helt främmande. Python har också några bra paket (scipy, numpy och Sage) och har fördelen med alla andra bibliotek, även om det förmodligen är ännu svårare att använda än R för personer som inte har mycket programmeringserfarenhet. R har några rimliga GUI och utvecklingsmiljöer som är gratis, men de är fortfarande inte alls lika enkla att använda som SPSS, SAS eller STATA.
2). Punkt i modelleringens livscykel: Jag skulle karakterisera livscykeln som att ha fyra olika punkter: databyggning, datarengöring och manipulation, dataanalys och datapresentation. Om du befinner dig i slutet av livscykeln börjar saker som MySQL att ge mycket mening eftersom de är bra för att manipulera och lagra data. Om du vill källa till webben snarare än att bara använda strukturerad data behöver du återigen ett programmeringsspråk. För ren analys är R, STATA, Python, SAS, MATLAB, S + och REvolution användbara i viss utsträckning. Slutligen, om presentation är viktigast för dig är Latex något som du tror att kondomer är gjorda av, då tror jag att SPSS och i mindre utsträckning SAS är dina bästa alternativ. Eftersom R-grafik inte är objektorienterad har de en otroligt brant inlärningskurva (även om de är rimliga när du lär känna dem). Trevlig och lättanvänd presentation som är mer eller mindre ur lådan är något som du behöver betala för är något jag skulle säga har varit min erfarenhet.
3). Om du arbetar med big data (1 GB + skulle jag säga) måste du antingen betala för en programvara som kan hantera den via deras cachingsystem (SPSS, SAS eller REvolution) eller använda ett databassystem. Att skriva din egen kod är naturligtvis också ett alternativ men kan vara utmanande.
4). Kostnadskänslighet: det freeware som listas kommer med fördelen med sin prislapp.
5). Efter att ha arbetat i en organisation där detta faktiskt hände kan jag definitivt säga att människor borde vara bekymrade över hur SAS hanterar sin licensiering. Till skillnad från MATLAB, SPSS eller de flesta andra program, har SAS språk i sitt användarkontrakt som gör att de kan göra anspråk på rättigheterna till din IP om det beror på paket i SAS. Vi var tvungna att sluta använda SAS när de bestämde att de ville komma in i vår bransch och så alla dessa bibliotek med SAS-kod är nu värdelösa (vissa kan köras på WPS men de flesta kan inte). Naturligtvis kunde vi ha betalat 50 gånger mer för våra licenser men vi bestämde oss för att avstå. Att hålla all egen programvara i hjärtat av en organisation kan vara extremt riskabelt.Jag har funnit att R och databaser är en utmärkt ersättning för nästan allt annat än diagram och omedelbart läsbar utdata.