Hvad er nogle alternativer til SPSS?


Bedste svar

Det afhænger af dit niveau af statistisk og programmeringssofistikering og af det miljø, du arbejder i.

R er sandsynligvis det bedste alternativ, hvis du har meget gode programmeringsevner. Det er gratis og open source, så du har adgang til næsten enhver form for statistisk funktion på jorden; det er dog et programmeringssprog, ikke en statistisk pakke, så det er relativt svagt i for- og bagenden – hvilket betyder datainput og forberedelse samt formatering og output. Hvis du kan programmere og bare vil have tallene i stedet for en fancy output, er R sandsynligvis noget for dig.

Formelt er SAS den nærmeste modstykke til SPSS, idet det er en fuldt struktureret og funktionel statistisk pakke, der kan håndtere alle dataanalysens opgaver fra start til slut. Ulempen er, at ligesom SPSS, er SAS ikke prissat for den enkelte bruger, med licenser, der koster i de fem tal. (I dette går det faktisk forud for SPSS, som ændrede sin prispolitik, så den kun matchede SAS efter mange år i erhvervslivet.) Så du ville være lige så usandsynlig at købe SAS som du ville gøre med SPSS, men hvis du arbejder i et selskab eller et universitet ville du sandsynligvis have adgang til det.

Den mest populære statistiske pakke inden for økonomisk rækkevidde for de fleste individuelle analytikere er Stata. Det giver en bred vifte af datahåndterings- og analysefunktioner til en pris, der er meget lavere end enten SAS eller SPSS (med endnu lavere priser for studerende). Hvis du har brug for en statistisk pakke og ikke er forbundet med en kæmpe institution, kan det være vejen at gå.

Svar

Svaret på dette afhænger af mange faktorer. De største drivere i min erfaring er: 1). fortrolighed med programmering / CS, 2). hvor i modelleringens livscyklus har du brug for softwaren, 3). størrelsen på datasættet, 4). omkostningsfølsomhed og 5). i hvilken grad bærbarhed er vigtig / bekymring storebror.

1). Kendskab til programmering / CS: Hvis du er meget fortrolig med disse begreber, er der intet galt med C, JAVA, Fortran, Python eller R (listet fra mest til mindst udfordrende at bruge som en SPSS-erstatning efter min mening). Selv med R er det, som folk ikke påpeger nok, stejlheden i læringskurven for folk, der ikke har meget programmeringserfaring. Det er ikke uoverstigeligt, og der er mange ressourcer derude, men hvis du ikke har brugt en kommandolinje før, vil R endda virke helt fremmed. Python har også nogle gode pakker (scipy, numpy og Sage) og har fordelen ved alle de andre biblioteker, selvom det sandsynligvis er endnu sværere at bruge end R for folk, der ikke har meget programmeringserfaring. R har nogle rimelige GUIer og udviklingsmiljøer, der er gratis, men de er stadig ikke nær så nemme at bruge som SPSS, SAS eller STATA.

2). Punkt i modelleringens livscyklus: Jeg vil karakterisere livscyklussen som at have fire forskellige punkter: dataopbygning, datarensning og manipulation, dataanalyse og datapræsentation. Hvis du er i frontenden af ​​livscyklussen, begynder ting som MySQL at give meget mening, fordi de er gode til at manipulere og lagre data. Hvis du vil hente internettet i stedet for kun at bruge strukturerede data, skal du igen bruge et programmeringssprog. Til ren analyse er R, STATA, Python, SAS, MATLAB, S + og REvolution alle nyttige i en vis grad. Endelig, hvis præsentation er vigtigst for dig, er Latex noget, som du synes, kondomer er lavet af, så tror jeg, at SPSS og i mindre grad SAS er dine bedste muligheder. Fordi R-grafik ikke er objektorienteret, har de en utrolig stejl indlæringskurve (selvom de er rimelige, når du først lærer dem at kende). Dejlig og nem at bruge præsentation, der er mere eller mindre ude af æsken, er noget, du skal betale for, er noget, jeg vil sige, har været min erfaring.

3). Hvis du arbejder med big data (1 GB + vil jeg sige), skal du enten betale for en software, der kan håndtere det via deres caching-systemer (SPSS, SAS eller REvolution) eller bruge et databasesystem. Det er naturligvis også en mulighed at skrive din egen kode, men det kan være udfordrende.

4). Omkostningsfølsomhed: den freeware, der er anført, kommer med fordelen ved sin pris.

5). Efter at have arbejdet i en organisation, hvor dette faktisk skete, kan jeg helt sikkert sige, at folk skal være bekymrede over den måde, hvorpå SAS håndterer sin licens. I modsætning til MATLAB, SPSS eller de fleste andre software har SAS sprog i deres brugerkontrakt, der giver dem mulighed for at kræve rettighederne til din IP, hvis det afhænger af pakker i SAS. Vi måtte stoppe med at bruge SAS, når de først besluttede, at de ville komme ind i vores branche, og så alle disse biblioteker med SAS-kode er nu ubrugelige (nogle kan køres på WPS, men de fleste kan ikke). Selvfølgelig kunne vi have betalt 50 gange mere for vores licenser, men vi besluttede at undlade at stemme. Det kan være yderst risikabelt at opbevare al proprietær software i hjertet af en organisation.Jeg har fundet, at R og databaser er en glimrende erstatning for næsten alt andet end grafik og umiddelbart læselig output.

Skriv et svar

Din e-mailadresse vil ikke blive publiceret. Krævede felter er markeret med *