ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • 통계학 - 평균
    기초수학/통계학 유사품 2024. 5. 27. 15:56

    평균 : Average , Mean

    A single number or value that best represent a set of data 

    평균은 다양한 종류가 있다.

    산술평균 외에도 수십가지가 존재.

     

     

     

    조화 : 머신러닝 때?
    right skew에 강하다?

     

     

    Distribution

    Probabiliy Distribution

    개개의 데이터가 실현되기 전의 가능성을 수식화하여 정리 한 것

    확률 분포는 실제로 자주 볼 수 있는 일부 확률의 케이스들을 체계적으로 정리 한 것

    확률적 추정 : 잘 알려져있지 않은 모수를 찾는

    많은 경우 독립적이고 동일한 분포를 같는(iid) 확률 변수의 경우 

    원래의 변수 자체가 정규분포를 따르지 않더라도 표본 평균의 분포정규 분포를 따르는 경향이 있다.

     

    CLT : 중심 극한 정리 Central limit theory => 표본평균의 분포 가 정규 분포를 따르는 경우?

    정규 분포를 이용한 원래의 분포와는 상관 없이 평균에 대한 통계 모델 설계 가능

     

    iid :  independent , identically distributed

     

    독립적 : 개별 관측치 사이에 연속성이 존재하지 않음

    동일성 : 분포의 형태 뿐 아니라 모수도 같음

     

    수렴 Conversion

    CLT : 표본 평균의 분포가 정규분포로 수렴함 

    그 정도의 차이 : 데이터 양의 차이 // 일반적으로 n = 30

    끼에에에ㅔ엑

    normal ,Bernoulli, Binormial, Poisson, Standard normal, 

    Chi, Fl, ChiSquared

     


    t - 분포

    CLT 의 문제 :

    평균과 분산 둘다 모르는 경우 

    CLT 이 만족될만큼 충분한 데이터가 아닐 경우 : 추정된 분산을 사용할 경우 값이 흔들린다(오차범위?)

    평균은 덧셈 뺄셈으로? 변환을 통해서? 해결 할 수 있다.(축이동?)

     

    다만 분산의 경우 변환을 통해서는 해결이 어렵다?

    이를 대체하기 위해서 '자유도' 라는 모수가 존재한다. (이는 데이터의 수와 연관되어 있다.)

    많으면 z / 적으면 t : 나누는게 번거롭다 (5개만 되도 정규분포와 굉장히 비슷?)

    => z는 타당성 이 필요하지만 t는 그렇지아니하다.

     

     

    직관적이고 깔끔한 데이터 : 이해와 사용에 상당한 주의 필요

    => 상당한 가공이 들어간 2차 생산 데이터

     

    '기초수학 > 통계학 유사품' 카테고리의 다른 글

    통계학 - ANOVA  (0) 2024.05.31
    통계학 - 3 : 통계적 가설  (0) 2024.05.28
    통계학 -2 /code 해례본  (0) 2024.05.27
    통계학  (0) 2024.05.27
Designed by Tistory.