Nejlepší odpověď
Záleží na vaší úrovni statistické a programové propracovanosti a na prostředí, ve kterém pracujete.
R je pravděpodobně nejlepší alternativou, pokud máte velmi dobré programátorské dovednosti. Je to bezplatný a otevřený zdroj, takže máte přístup k téměř jakémukoli druhu statistických funkcí na Zemi; je to však programovací jazyk, nikoli statistický balíček, takže je poměrně slabý na přední i zadní straně – to znamená vstup a příprava dat a formátování a výstup. Pokud můžete programovat a chcete pouze čísla, nikoli fantazijní výstup, je R pravděpodobně pro vás.
Formálně je SAS nejbližším protějškem SPSS v tom, že se jedná o plně strukturovanou a funkční statistickou balíček, který zvládne všechny úkoly analýzy dat od začátku do konce. Nevýhodou je, že stejně jako SPSS, ani SAS nemá cenu pro jednotlivého uživatele, přičemž licence stojí pět číslic. (V tomto případě vlastně předchází SPSS, která změnila svou cenovou politiku tak, aby odpovídala SAS až po mnoha letech podnikání.) Takže je nepravděpodobné, že byste koupili SAS, jako byste SPSS, ale pokud pracujete ve společnosti nebo na univerzitě pravděpodobně byste k němu měli přístup.
Nejpopulárnějším statistickým balíčkem ve finančním dosahu většiny jednotlivých analytiků je Stata. Poskytuje širokou škálu funkcí pro zpracování a analýzu dat za cenu mnohem nižší než u SAS nebo SPSS (s ještě nižšími cenami pro studenty). Pokud potřebujete statistický balíček a nejste spojeni s velkou institucí, může to být správná cesta.
Odpověď
Odpověď na to závisí na mnoha faktorech. Největší řidiči z mých zkušeností jsou: 1). znalost programování / CS, 2). kde v životním cyklu modelování potřebujete software, 3). velikost souboru dat, 4). nákladová citlivost a 5). stupeň, do jaké je přenositelnost důležitá / velký bratr se týká.
1). Znalost programování / CS: Pokud jste velmi dobře obeznámeni s těmito koncepty, pak není nic špatného na C, JAVA, Fortran, Python nebo R. I s R věc, na kterou lidé dostatečně neukazují, je strmost křivky učení pro lidi, kteří nemají mnoho programovacích zkušeností. Není to nepřekonatelné a existuje spousta zdrojů, ale pokud jste dosud nepoužívali příkazový řádek, pak i R bude vypadat úplně cizí. Python má také několik skvělých balíčků (scipy, numpy a Sage) a má výhodu všech ostatních knihoven, i když je pravděpodobně ještě těžší použít než R pro lidi, kteří nemají mnoho zkušeností s programováním. R má několik rozumných grafických uživatelských rozhraní a vývojových prostředí, která jsou zdarma, ale stále nejsou tak snadno použitelná jako SPSS, SAS nebo STATA.
2). Bod v životním cyklu modelování: Charakterizoval bych životní cyklus tak, že má čtyři různé body: budování dat, čištění a manipulace s daty, analýza dat a prezentace dat. Pokud jste na začátku životního cyklu, pak věci jako MySQL začínají dávat smysl, protože jsou skvělé pro manipulaci a ukládání dat. Pokud chcete web získat spíše než jen pomocí strukturovaných dat, budete opět potřebovat programovací jazyk. Pro čistou analýzu jsou do jisté míry užitečné R, STATA, Python, SAS, MATLAB, S + a REvolution. A konečně, pokud je pro vás nejdůležitější prezentace, latex je něco, o čem si myslíte, že se z něj vyrábějí kondomy, pak si myslím, že SPSS a v menší míře SAS jsou vaše nejlepší možnosti. Protože R grafika není objektově orientovaná, má neuvěřitelně strmou křivku učení (i když je rozumná, jakmile ji poznáte). Pěkná a snadno použitelná prezentace, která je víceméně po vybalení z krabice, je něco, za co musíte zaplatit, je něco, o čem bych řekl, že byla moje zkušenost.
3). Pokud pracujete s velkými daty (řekl bych 1 GB +), musíte buď zaplatit za software, který to zvládne prostřednictvím svých systémů ukládání do mezipaměti (SPSS, SAS nebo REvolution), nebo použít databázový systém. Přirozeně je také možné napsat vlastní kód, ale může to být náročné.
4). Citlivost na náklady: uvedený freeware má výhodu své cenovky.
5). Poté, co jsem pracoval v organizaci, kde se to skutečně stalo, mohu rozhodně říci, že by lidé měli být znepokojeni způsobem, jakým SAS zpracovává své licence. Na rozdíl od MATLAB, SPSS nebo většiny jiného softwaru má SAS ve své uživatelské smlouvě jazyk, který jim umožňuje nárokovat práva na vaši IP, pokud to závisí na balíčcích v SAS. Museli jsme přestat používat SAS, jakmile se rozhodli, že se chtějí dostat do našeho oboru podnikání, a proto jsou všechny tyto knihovny kódu SAS nyní k ničemu (některé lze spustit na WPS, ale většina nikoli). Samozřejmě jsme mohli za naše licence zaplatit 50krát více, ale rozhodli jsme se zdržet se hlasování. Udržování veškerého proprietárního softwaru v srdci organizace může být extrémně riskantní.Zjistil jsem, že R a databáze jsou vynikající náhradou za téměř všechno kromě grafů a okamžitě čitelného výstupu.