SPSS의 대안은 무엇입니까?


최상의 답변

통계 및 프로그래밍 정교함의 수준과 작업 환경에 따라 다릅니다.

R은 아마도 당신이 아주 좋은 프로그래밍 기술을 가지고 있다면 최고의 대안 일 것입니다. 무료이며 오픈 소스이므로 지구상의 거의 모든 종류의 통계 기능에 액세스 할 수 있습니다. 그러나 이는 통계 패키지가 아닌 프로그래밍 언어이므로 프런트 엔드와 백 엔드에서 비교적 약합니다. 즉, 데이터 입력 및 준비, 형식 지정 및 출력을 의미합니다. 프로그래밍 할 수 있고 멋진 결과물보다는 숫자 만 원하는 경우 R이 적합 할 것입니다.

공식적으로 SAS는 SPSS에 가장 가까운 대응 요소입니다. 완전히 구조화되고 기능적인 통계라는 점에서 데이터 분석의 모든 작업을 처음부터 끝까지 처리 할 수있는 패키지입니다. 단점은 SPSS와 마찬가지로 SAS는 개별 사용자에 대해 가격이 책정되지 않고 라이센스 비용이 5 개 숫자로 책정된다는 것입니다. (이 점에서 실제로는 SPSS보다 앞서서 몇 년 동안 사업을 시작한 후에야 가격 정책을 SAS와 일치하도록 변경했습니다.) 따라서 SPSS처럼 SAS를 구매할 가능성은 낮지 만 기업이나 대학에서 일하는 경우, 아마도 액세스 할 수있을 것입니다.

대부분의 개별 분석가의 재정적 범위에서 가장 인기있는 통계 패키지는 Stata입니다. SAS 또는 SPSS보다 훨씬 저렴한 가격으로 광범위한 데이터 처리 및 분석 기능을 제공합니다 (학생에게는 훨씬 저렴한 가격). 통계 패키지가 필요하고 대규모 기관과 연결되어 있지 않은 경우이 방법을 사용할 수 있습니다.

답변

이에 대한 답은 여러 요인에 따라 달라집니다. 내 경험에서 가장 큰 동인은 다음과 같습니다. 1). 프로그래밍 / CS에 대한 지식, 2). 모델링 라이프 사이클에서 소프트웨어가 필요한 곳, 3). 데이터 세트의 크기, 4). 비용 민감도와 5). 이식성이 중요한 정도 / 빅 브라더 문제.

1). 프로그래밍 / CS에 대한 익숙 함 : 이러한 개념에 매우 익숙하다면 C, JAVA, Fortran, Python 또는 R (제 생각에는 SPSS 대체물로 사용하기 가장 까다로운 것부터 가장 까다로운 것까지 나열 됨)에 문제가 없습니다. R을 사용해도 사람들이 충분히 지적하지 않는 것은 프로그래밍 경험이 많지 않은 사람들을위한 학습 곡선의 가파른 정도입니다. 극복 할 수없고 많은 리소스가 있지만 그 전에 명령 줄을 사용하지 않았다면 R조차 완전히 이질적으로 보일 것입니다. Python에도 몇 가지 훌륭한 패키지 (scipy, numpy 및 Sage)가 있으며 다른 모든 라이브러리의 이점을 가지고 있지만 프로그래밍 경험이 많지 않은 사람들에게는 R보다 사용하기가 훨씬 더 어려울 수 있습니다. R에는 무료로 제공되는 합리적인 GUI와 개발 환경이 있지만 SPSS, SAS 또는 STATA만큼 사용하기 쉽지는 않습니다.

2). 모델링 수명주기의 요점 : 수명주기를 데이터 구축, 데이터 정리 및 조작, 데이터 분석 및 데이터 표현의 네 가지 요소로 특성화합니다. 라이프 사이클의 최전방에 있다면 MySQL과 같은 것들이 데이터를 조작하고 저장하는 데 적합하기 때문에 많은 의미가 있습니다. 구조화 된 데이터를 사용하는 것보다 웹을 소싱하려면 다시 한 번 프로그래밍 언어가 필요합니다. 순수한 분석을 위해 R, STATA, Python, SAS, MATLAB, S + 및 REvolution은 모두 어느 정도 유용합니다. 마지막으로, 프레젠테이션이 가장 중요하다면 Latex가 콘돔이 만들어 졌다고 생각하는 것입니다. SPSS와 SAS가 최선의 선택이라고 생각합니다. R 그래픽은 객체 지향이 아니기 때문에 엄청나게 가파른 학습 곡선을 가지고 있습니다 (비록 일단 알게되면 합리적이지만). 상자에서 다소 벗어난 멋지고 사용하기 쉬운 프레젠테이션은 비용을 지불해야하는 것이 내 경험이라고 말할 수있는 것입니다.

3). 빅 데이터 (1GB 이상)로 작업하는 경우 캐싱 시스템 (SPSS, SAS 또는 REvolution)을 통해 처리 할 수있는 소프트웨어 비용을 지불하거나 데이터베이스 시스템을 사용해야합니다. 당연히 자신의 코드를 작성하는 것도 옵션이지만 어려울 수 있습니다.

4). 비용 민감성 : 나열된 프리웨어에는 가격표의 이점이 있습니다.

5). 실제로 이런 일이 발생한 조직에서 일한 경험이 있다면 사람들은 SAS가 라이선스를 처리하는 방식에 관심을 가져야한다고 분명히 말할 수 있습니다. MATLAB, SPSS 또는 대부분의 다른 소프트웨어와 달리 SAS는 사용자 계약에 SAS의 패키지에 의존하는 경우 IP에 대한 권리를 주장 할 수있는 언어가 있습니다. 일단 그들이 우리의 사업 라인에 들어가고 싶다고 결정한 후 우리는 SAS 사용을 중단해야했습니다. 그래서 모든 SAS 코드 라이브러리는 이제 쓸모가 없습니다 (일부는 WPS에서 실행될 수 있지만 대부분은 불가능합니다). 물론 우리는 라이센스 비용을 50 배 더 지불 할 수 있었지만 기권하기로 결정했습니다. 독점 소프트웨어를 조직의 중심에 두는 것은 매우 위험 할 수 있습니다.R과 데이터베이스가 그래프와 즉시 읽을 수있는 출력을 제외한 거의 모든 것을 대체 할 수있는 훌륭한 대체품이라는 것을 알게되었습니다.

답글 남기기

이메일 주소를 발행하지 않을 것입니다. 필수 항목은 *(으)로 표시합니다