[통계학] 종속변수가 1개일 때 통계 분석 기법 선택(한 눈에 보기)
종속변수가 1개이고 연속형 변수일 때 종속변수가 1개이고 범주형 변수일 때천천히, 하나씩 https://m.blog.naver.com/y4769/220024117776
- 데이터분석/Statistics(통계학)
- · 2024. 7. 8.
이산확률분포와 연속확률분포의 차이는 뭘까? 확률분포確 率 分 布 / probability distribution 시행에서 확률변수 (random variable)namu.wiki이산확률분포: 확률변수가 취하는 값들의 집합이 자연수의 부분 집합과 일대일 대응 됨연속확률분포: 확률변수가 취하는 값들의 집합이 실수의 구간을 이룸위 나무위키의 설명은 직관적으로 이해하기 어려워서 예시를 들어 설명해보겠다!대한민국 대학생의 몸무게를 확률변수 X라고 가정해보자. 여기서 확률변수 X는 60.5kg, 60.55kg, 60.555kg, 60.55555555 등 무수히 많은 몸무게를 가질 수 있다.↑ 이렇게 연속적으로 확률변수를 많이 가진 확률의 분포를 연속확률분포라고 한다. (키, 발사이즈 등도 마찬가지) 반대로 동전..
상관분석이란?상관분석 이해하기두 변수간에 어떤 선형적 관계를 갖고 있는 지 분석하는 방법이다. 상관분석을 통해 두 변수간의 연관된 정도를 상관계수(correlation coefficient)로 나타낸다. 이 때 상관계수는 연관된 정도만 나타낼 뿐, 인과관계(원인과 결과)의 의미를 갖지 않는다. (※ 인과관계는 보통 회귀분석을 통해 확인하는 경우가 많다.)상관분석은 보통 연속형 자료끼리 비교할 때, 많이 찾는 분석 방법이지만 연속형vs연속형, 범주형vs범주형, 연속형vs범주형 자료에서도 상관분석을 사용할 수 있고 이 글에서 크게 이 세 가지 유형의 상관분석에 대해 다뤄볼 예정이다. (with 파이썬 코드) 상관계수와 유의확률(P-value) 해석하기상관계수는 -1부터 1사이의 값을 가진다. +1 에 가까..
정규성 검정(Nomality Test)이란?데이터 셋의 분포가 정규분포를 따르는지 검정하는 것이다.정규분포 형태아래 이미지와 같이 종 모양의 형태를 띄운 데이터가 정규분포의 형태다.정규성 검정을 하는 이유가 뭘까?정규성 검정을 하는 이유의 대부분은 특정 데이터를 분석하기 전에 모수적인 방법을 선택할지 혹은비모수적인 방법의 분석을 실시할지 정규성 검정을 통해 결정하고 검정 결과의 신뢰도를 높이기 위해서다. 통계에서는 데이터의 정규분포를 가정해야 가능한 분석 기법들이 많다. 예를 들어 T-TEST, 선형회귀 분석 등 모두 정규성이 만족해야 분석할 수 있는 기법이다. 만족하지 않는다면 비모수적 분석 기법을 사용해야 한다. 정규성 검정의 종류검정 방법아래 검정들은 가설검정 모두 귀무가설(h0)을 채택할 때, 정..
혹시 이렇게 생각하고 있다면 잘못 이해하고 있는 것이다모집단(분석하고자 하는 전체 집단)에서 표본을 30개 이상 추출했으니 추출한 해당 표본의 분포는 정규분포에 따른다. ↑ 잘못 이해이건 간단한 예제로 이해 가능한데, 예를 들어 우리나라 성인 몸무게 데이터를 300개를 한번에 추출 했다고 가정하자.300명 중 추출된 몸무게 데이터는 50kg: 150명, 60kg: 100명, 70kg: 40명, 100kg: 10명 이라고 가정하자이 결과를 히스토그램으로 대충 그려보면 다음과 같이test 당연히 정규분포를 따르지 않는다. 중심극한정리에 대해 최대한 쉽게 설명해보겠다. 예시를 잘 보자 중심극한정리 정의모집단 분포에 상관없이 모집단에서 추출한 표본의 크기 n이 커질수록 (n≥30) 표본평균의 분포가 정규..
종속변수가 1개이고 연속형 변수일 때 종속변수가 1개이고 범주형 변수일 때천천히, 하나씩 https://m.blog.naver.com/y4769/220024117776