데이터 분석의 몇 가지 예는 무엇입니까?


최상의 답변

기본적으로 Google에 수백만 개의 데이터 분석 예가있을 수 있으므로 여기에 “재미있는 ”분석, 우리가 항상 생각하지는 않습니다.

BEER 에 대한 분석 (이제 모두의 관심을 받고 있습니다.))

맥주에 대한 “셀프 서비스”를 구현함으로써 (모든 사람이 조금씩 다른 종류를 따를 수 있음) 바 입찰자들은 평균 소비량이 더 높다는 것을 깨달았을뿐만 아니라 무엇을 알 수 있었는지 알 수있었습니다. 가장 좋아하는 맥주입니다. 맥주 분석은 또한 가장 빠르게 소비되는 맥주가 무엇인지 (Guiness 술통이 St. Patrick ’S 날에 기록에 도달 함)을 파악하는 데 도움이되므로 향상된 정밀도로 예측하고 주문할 수 있습니다. 좀 더 “스파이”수준에서는 일부 바텐더가 파인트를 부을 때 더 “관대 한”지 또는 (자신 또는 고객에게) 많은 것을 제공하는 경향이 있는지 확인할 수 있습니다.

-카지노 분석

모든 카지노 기계 (또는 카페트)가 생성하는 데이터를 추적함으로써 관리자는 무엇이 사용되는지, 무엇이 사용되지 않는지, 가장 인기있는 것은 무엇이고, 하루, 월 또는 연중 어느 시간에 사용되는지에 대해 더 많은 지식을 갖게됩니다. , 가장 많은 이익 (또는 손실)을 발생시키는 것. 이러한 모든 통찰력을 바탕으로 그들은 그에 따라 행동하고 카지노의 일부를 수정하거나 조정하기 위해 적절한 조치를 취할 수 있습니다.

어쨌든 분석을 수행하려면 항상 올바른 장비를 갖추는 것이 좋습니다. 향상된 탐색을 위해 데이터 정리 작업을 용이하게하는 데이터 분석 도구

제공된 것과 같은 더 많은 예제를 읽으려는 경우 위의 기사를 읽어 보시기 바랍니다. 바, 레스토랑 및 카지노에서의 실제 생활에서 사용되는 5 가지 빅 데이터 사례 !

답변

분석은 개별 검사를 위해 전체를 별도의 구성 요소로 나누는 것을 의미합니다. 데이터 분석은 원시 데이터를 얻고이를 사용자의 의사 결정에 유용한 정보로 변환하는 프로세스 입니다. 질문에 답하고, 가설을 테스트하거나 이론을 반증하기 위해 데이터를 수집 및 분석합니다.

통계 학자 John Tukey 는 1961 년 데이터 분석을 “절차 데이터 분석, 이러한 절차의 결과를 해석하는 기술, 분석을 더 쉽고, 더 정확하고, 더 정확하게 만들기 위해 데이터 수집을 계획하는 방법, 데이터 분석에 적용되는 (수학적) 통계의 모든 기계 및 결과. ”

구분할 수있는 여러 단계가 아래에 설명되어 있습니다. 단계는 반복적입니다. 이후 단계의 피드백은 이전 단계에서 추가 작업으로 이어질 수 있습니다.

데이터 요구 사항

분석에 대한 입력으로 필요한 데이터는 분석을 지시하는 사람 또는 분석의 완제품을 사용할 고객의 요구 사항에 따라 지정됩니다. 데이터가 수집되는 일반적인 유형의 개체를 실험 단위 (예 : 사람 또는 인구 집단)라고합니다. 인구에 관한 특정 변수 (예 : 연령 및 소득)를 지정하고 얻을 수 있습니다. 데이터는 숫자 또는 범주 (예 : 숫자의 텍스트 레이블) 일 수 있습니다.

데이터 수집

데이터는 다양한 출처에서 수집되었습니다. 요구 사항은 분석가가 조직 내 정보 기술 담당자와 같은 데이터 관리자에게 전달할 수 있습니다. 데이터는 교통 카메라, 위성, 녹화 장치 등과 같은 환경의 센서에서도 수집 될 수 있습니다. 또한 인터뷰, 온라인 소스에서 다운로드 또는 문서 읽기를 통해 얻을 수 있습니다.

데이터 처리

처음에 얻은 데이터는 분석을 위해 처리하거나 구성해야합니다. 예를 들어 스프레드 시트 또는 통계 소프트웨어와 같은 추가 분석을 위해 테이블 ​​형식으로 데이터를 행과 열에 배치하는 작업이 포함될 수 있습니다.

데이터 정리

처리 및 정리 된 데이터는 불완전하거나 중복되거나 오류가있을 수 있습니다. 데이터 정리의 필요성은 데이터를 입력하고 저장하는 방식의 문제로 인해 발생합니다. 데이터 정리는 이러한 오류를 방지하고 수정하는 프로세스입니다. 일반적인 작업에는 레코드 일치, 데이터 부정확성 식별, 기존 데이터의 전체 품질, 중복 제거 및 열 분할이 포함되며 이러한 데이터 문제는 다양한 분석 기술을 통해 식별 할 수도 있습니다. 예를 들어, 재무 정보를 사용하여 특정 변수에 대한 합계를 신뢰할 수 있다고 판단되는 개별적으로 게시 된 수치와 비교할 수 있으며, 미리 결정된 임계 값보다 높거나 낮은 비정상적인 금액도 검토 할 수 있습니다. 전화 번호, 이메일 주소, 고용주 등과 같은 데이터 유형에 따라 여러 유형의 데이터 정리가 있습니다.이상 값 탐지를위한 정량적 데이터 방법을 사용하여 잘못 입력 된 데이터를 제거 할 수 있습니다. 텍스트 데이터 맞춤법 검사기를 사용하여 잘못 입력 된 단어의 양을 줄일 수 있지만 단어 자체가 올바른지 확인하기가 더 어렵습니다.

탐색 데이터 분석

데이터가 정리되면 분석 할 수 있습니다. 분석가는 탐색 데이터 분석 이라는 다양한 기술을 적용하여 데이터에 포함 된 메시지를 이해하기 시작할 수 있습니다. 탐색 프로세스는 추가 데이터 정리 또는 데이터에 대한 추가 요청으로 이어질 수 있으므로 이러한 활동은 본질적으로 반복적 일 수 있습니다. 데이터 이해를 돕기 위해 평균 또는 중앙값과 같은 기술 통계 가 생성 될 수 있습니다. 데이터 시각화 는 데이터 내의 메시지에 대한 추가 정보를 얻기 위해 그래픽 형식으로 데이터를 검사하는 데 사용할 수도 있습니다.

모델링 및 알고리즘

알고리즘 이라는 수학 공식 또는 모델을 적용 할 수 있습니다. 상관 또는 원인 과 같은 변수 간의 관계를 식별하기위한 데이터입니다. 일반적으로 데이터의 다른 변수를 기반으로 데이터의 특정 변수를 평가하기 위해 모델을 개발할 수 있으며, 모델 정확도 (예 : 데이터 = 모델 + 오류)에 따라 일부 잔여 오류가 있습니다.

출처 :

답글 남기기

이메일 주소를 발행하지 않을 것입니다. 필수 항목은 *(으)로 표시합니다