Quais são algumas alternativas ao SPSS?


Melhor resposta

Depende do seu nível de sofisticação estatística e de programação e do ambiente em que você trabalha.

R é provavelmente a melhor alternativa se você tiver muito boas habilidades de programação. É gratuito e de código aberto, então você tem acesso a quase qualquer tipo de função estatística na terra; no entanto, é uma linguagem de programação, não um pacote estatístico, por isso é comparativamente fraco na frente e atrás – o que significa entrada e preparação de dados, formatação e saída. Se você pode programar e só quer os números em vez de uma saída extravagante, R é provavelmente para você.

Formalmente, SAS é a contraparte mais próxima do SPSS, por ser uma estatística funcional e totalmente estruturada pacote que pode lidar com todas as tarefas de análise de dados do início ao fim. A desvantagem é que, como o SPSS, o SAS não tem preço para o usuário individual, com licenças custando em torno de cinco dígitos. (Nesse caso, ele realmente precede o SPSS, que mudou sua política de preços para corresponder ao SAS apenas depois de muitos anos no mercado.) Portanto, seria tão improvável que você comprasse o SAS quanto o SPSS, mas se você trabalha em uma empresa ou universidade, você provavelmente teria acesso a ele.

O pacote estatístico mais popular em alcance financeiro da maioria dos analistas individuais é o Stata. Ele fornece uma ampla gama de funções de tratamento e análise de dados a um preço muito mais baixo do que SAS ou SPSS (com preços ainda mais baixos para estudantes). Se você precisa de um pacote estatístico e não está conectado a uma grande instituição, este pode ser o caminho a percorrer.

Resposta

A resposta depende de muitos fatores. Os maiores motivadores em minha experiência são: 1). familiaridade com programação / CS, 2). onde no ciclo de vida de modelagem você precisa do software, 3). tamanho do conjunto de dados, 4). sensibilidade de custo e 5). grau em que a portabilidade é importante / preocupações do irmão mais velho.

1). Familiaridade com programação / CS: Se você está familiarizado com esses conceitos, então não há nada de errado com C, JAVA, Fortran, Python ou R (listado do mais para o menos desafiador para usar como um substituto do SPSS na minha opinião). Mesmo com o R, o que as pessoas não apontam o suficiente é a inclinação da curva de aprendizado para pessoas que não têm muita experiência em programação. Não é intransponível e há muitos recursos por aí, mas se você não usou uma linha de comando antes, até mesmo R parecerá completamente estranho. Python também tem alguns pacotes excelentes (scipy, numpy e Sage) e tem a vantagem de todas as outras bibliotecas, embora seja provavelmente ainda mais difícil de usar do que R para pessoas que não têm muita experiência em programação. R tem algumas interfaces de usuário razoáveis ​​e ambientes de desenvolvimento que são gratuitos, mas ainda não são tão fáceis de usar como SPSS, SAS ou STATA.

2). Ponto no ciclo de vida da modelagem: Eu caracterizaria o ciclo de vida como tendo quatro pontos diferentes: construção de dados, limpeza e manipulação de dados, análise de dados e apresentação de dados. Se você está no front-end do ciclo de vida, coisas como o MySQL começam a fazer muito sentido porque são ótimas para manipular e armazenar dados. Se você deseja fornecer a web em vez de apenas usar dados estruturados, precisará mais uma vez de uma linguagem de programação. Para análise pura, R, STATA, Python, SAS, MATLAB, S + e REvolution são úteis até certo ponto. Por fim, se a apresentação é mais importante para você, o látex é algo de que você acha que os preservativos são feitos, então acho que o SPSS e, em menor medida, o SAS são suas melhores opções. Como os gráficos R não são orientados a objetos, eles têm uma curva de aprendizado incrivelmente íngreme (embora sejam razoáveis ​​uma vez que você os conheça). Uma apresentação agradável e fácil de usar que está mais ou menos fora da caixa é algo pelo qual você precisa pagar é algo que eu diria que foi minha experiência.

3). Se você está trabalhando com big data (1 GB + eu diria), você precisa pagar por um software que pode lidar com isso por meio de seus sistemas de cache (SPSS, SAS ou REvolution) ou usar um sistema de banco de dados. Naturalmente, escrever seu próprio código também é uma opção, mas pode ser um desafio.

4). Sensibilidade ao custo: o freeware listado vem com a vantagem de seu preço.

5). Tendo trabalhado em uma organização onde isso realmente aconteceu, posso definitivamente dizer que as pessoas devem se preocupar com a forma como a SAS lida com seu licenciamento. Ao contrário do MATLAB, SPSS ou a maioria dos outros softwares, o SAS tem uma linguagem em seu contrato de usuário que permite que eles reivindiquem os direitos sobre seu IP se depender de pacotes no SAS. Tivemos que parar de usar o SAS quando eles decidiram que queriam entrar em nossa linha de negócios e, portanto, todas as bibliotecas de código SAS agora são inúteis (algumas podem ser executadas em WPS, mas a maioria não). Claro que poderíamos ter pago 50 vezes mais por nossas licenças, mas decidimos nos abster. Manter qualquer software proprietário no centro de uma organização pode ser extremamente arriscado.Eu descobri que R e bancos de dados são excelentes substitutos para quase tudo, exceto gráficos e saídas imediatamente legíveis.

Deixe uma resposta

O seu endereço de email não será publicado. Campos obrigatórios marcados com *