¿Cuáles son algunas alternativas a SPSS?

La mejor respuesta

Depende de su nivel de sofisticación estadística y de programación, y del entorno en el que trabaja.

R es probablemente la mejor alternativa si tienes muy buenas habilidades de programación. Es gratis y de código abierto, por lo que tiene acceso a casi cualquier tipo de función estadística en la tierra; sin embargo, es un lenguaje de programación, no un paquete estadístico, por lo que es comparativamente débil al principio y al final, es decir, entrada y preparación de datos, y formato y salida. Si puede programar y solo desea los números en lugar de una salida elegante, probablemente R sea para usted.

Formalmente, SAS es la contraparte más cercana a SPSS, ya que es una estadística funcional y completamente estructurada. paquete que puede manejar todas las tareas de análisis de datos de principio a fin. La desventaja es que, como SPSS, SAS no tiene un precio para el usuario individual, y las licencias cuestan en cinco cifras. (En esto, en realidad precede a SPSS, que cambió su política de precios para igualar a SAS solo después de muchos años en el negocio). Por lo tanto, es tan poco probable que compre SAS como lo haría con SPSS, pero si trabaja en una corporación o una universidad, probablemente tendría acceso a él.

El paquete estadístico más popular en el alcance financiero de la mayoría de los analistas individuales es Stata. Proporciona una amplia gama de funciones de análisis y manejo de datos a un precio mucho más bajo que SAS o SPSS (con precios aún más bajos para los estudiantes). Si necesita un paquete estadístico y no está conectado con una gran institución, este puede ser el camino a seguir.

Respuesta

La respuesta a esto depende de muchos factores. Los mayores impulsores en mi experiencia son: 1). familiaridad con la programación / CS, 2). en qué parte del ciclo de vida del modelado necesita el software, 3). tamaño del conjunto de datos, 4). sensibilidad a los costos y 5). grado en que la portabilidad es importante / preocupaciones de hermanos mayores.

1). Familiaridad con la programación / CS: si está muy familiarizado con estos conceptos, entonces no hay nada de malo en C, JAVA, Fortran, Python o R (enumerados de mayor a menor dificultad para usar como sustituto de SPSS en mi opinión). Incluso con R, lo que la gente no señala lo suficiente es la pendiente de la curva de aprendizaje para las personas que no tienen mucha experiencia en programación. No es insuperable y hay muchos recursos por ahí, pero si no ha usado una línea de comando antes, incluso R parecerá completamente extraño. Python también tiene algunos paquetes geniales (scipy, numpy y Sage) y tiene la ventaja de todas las demás bibliotecas, aunque probablemente sea incluso más difícil de usar que R para personas que no tienen mucha experiencia en programación. R tiene algunas GUI y entornos de desarrollo razonables que son gratuitos, pero aún no son tan fáciles de usar como SPSS, SAS o STATA.

2). Punto en el ciclo de vida del modelado: Yo caracterizaría el ciclo de vida en cuatro puntos diferentes: construcción de datos, limpieza y manipulación de datos, análisis de datos y presentación de datos. Si está en la parte frontal del ciclo de vida, entonces cosas como MySQL comienzan a tener mucho sentido porque son excelentes para manipular y almacenar datos. Si desea obtener la web en lugar de solo usar datos estructurados, una vez más necesitará un lenguaje de programación. Para el análisis puro, R, STATA, Python, SAS, MATLAB, S + y REvolution son todos útiles hasta cierto punto. Finalmente, si la presentación es lo más importante para usted El látex es algo con lo que cree que están hechos los condones, entonces creo que SPSS y, en menor medida, SAS son sus mejores opciones. Debido a que los gráficos R no están orientados a objetos, tienen una curva de aprendizaje increíblemente empinada (aunque son razonables una vez que los conoces). Una presentación agradable y fácil de usar que está más o menos lista para usar es algo por lo que debe pagar, es algo que yo diría que ha sido mi experiencia.

3). Si está trabajando con big data (1GB + yo diría), entonces debe pagar por un software que pueda manejarlo a través de sus sistemas de almacenamiento en caché (SPSS, SAS o REvolution) o usar un sistema de base de datos. Naturalmente, escribir su propio código también es una opción, pero puede ser un desafío.

4). Sensibilidad a los costos: el software gratuito enumerado viene con el beneficio de su precio.

5). Después de haber trabajado en una organización en la que esto sucedió, definitivamente puedo decir que la gente debería preocuparse por la forma en que SAS maneja sus licencias. A diferencia de MATLAB, SPSS o la mayoría de los demás software, SAS tiene un lenguaje en su contrato de usuario que les permite reclamar los derechos sobre su IP si depende de paquetes en SAS. Tuvimos que dejar de usar SAS una vez que decidieron que querían entrar en nuestra línea de negocio, por lo que todas esas bibliotecas de código SAS ahora son inútiles (algunas se pueden ejecutar en WPS pero la mayoría no). Por supuesto, podríamos haber pagado 50 veces más por nuestras licencias, pero decidimos abstenernos. Mantener cualquier software propietario en el corazón de una organización puede ser extremadamente arriesgado.He descubierto que R y las bases de datos son un excelente sustituto de casi todo lo que no sea la creación de gráficos y la salida inmediatamente legible.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *