-
통계학 - 평균기초수학/통계학 유사품 2024. 5. 27. 15:56
평균 : Average , Mean
A single number or value that best represent a set of data
평균은 다양한 종류가 있다.
산술평균 외에도 수십가지가 존재.
Distribution
Probabiliy Distribution
개개의 데이터가 실현되기 전의 가능성을 수식화하여 정리 한 것
확률 분포는 실제로 자주 볼 수 있는 일부 확률의 케이스들을 체계적으로 정리 한 것
많은 경우 독립적이고 동일한 분포를 같는(iid) 확률 변수의 경우
원래의 변수 자체가 정규분포를 따르지 않더라도 표본 평균의 분포가 정규 분포를 따르는 경향이 있다.
CLT : 중심 극한 정리 Central limit theory => 표본평균의 분포 가 정규 분포를 따르는 경우?
정규 분포를 이용한 원래의 분포와는 상관 없이 평균에 대한 통계 모델 설계 가능
iid : independent , identically distributed
독립적 : 개별 관측치 사이에 연속성이 존재하지 않음
동일성 : 분포의 형태 뿐 아니라 모수도 같음
수렴 Conversion
CLT : 표본 평균의 분포가 정규분포로 수렴함
그 정도의 차이 : 데이터 양의 차이 // 일반적으로 n = 30
normal ,Bernoulli, Binormial, Poisson, Standard normal,
Chi, Fl, ChiSquared
t - 분포
CLT 의 문제 :
평균과 분산 둘다 모르는 경우
CLT 이 만족될만큼 충분한 데이터가 아닐 경우 : 추정된 분산을 사용할 경우 값이 흔들린다(오차범위?)
평균은 덧셈 뺄셈으로? 변환을 통해서? 해결 할 수 있다.(축이동?)
다만 분산의 경우 변환을 통해서는 해결이 어렵다?
이를 대체하기 위해서 '자유도' 라는 모수가 존재한다. (이는 데이터의 수와 연관되어 있다.)
많으면 z / 적으면 t : 나누는게 번거롭다 (5개만 되도 정규분포와 굉장히 비슷?)
=> z는 타당성 이 필요하지만 t는 그렇지아니하다.
직관적이고 깔끔한 데이터 : 이해와 사용에 상당한 주의 필요
=> 상당한 가공이 들어간 2차 생산 데이터
'기초수학 > 통계학 유사품' 카테고리의 다른 글
통계학 - ANOVA (0) 2024.05.31 통계학 - 3 : 통계적 가설 (0) 2024.05.28 통계학 -2 /code 해례본 (0) 2024.05.27 통계학 (0) 2024.05.27