ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • 통계학 - 3 : 통계적 가설
    기초수학/통계학 유사품 2024. 5. 28. 21:09

    통계적 가설 검정

    주어진 자료가 특정 가설을 충분히 뒷받침하는지 여부를 결정하는 통계적 추론 방법

    • 정량적인 측정량의 정의
    • 객관적으로 누구나 납득할만한 기준 필요

    A/B 테스트에서의 두 집단의 매출 비교

    세그멘트(연령 등 특정 기준에 따른 유저 그룹) 에 따른 특성(매출, 방문) 차이 확인

    두 집단(투약 실험) 의 의학적 효과 (혈당 등) 차이 검사

     

    통계적 가설 검정의 효과

    • 의사결정에 필요한 이론적 근거를 확보
    • 객관적인 자료와 수치로 설득력을 높힌다
    • 모호한 상황에서 불확실성을 수치로 가시화한다
    • 체계화된 프로세스를 통해 다양한 리스크를 제거한다
    • 여러 통계 / AI 도구를 Custom 하여 활용할 수 있다.

     

    • 귀무(영)가설 (H0)/(Null Hypothesis): 두 그룹의 평균은 같다. 즉, 두 그룹 간에는 유의한 차이가 없다. // 기존의 통념
    • 대립가설 (H1 또는 Ha)/(Alternative Hypothesis): 두 그룹의 평균은 다르다. 즉, 적어도 한 그룹은 다른 그룹과는 평균이 다르다. // 새로이 입증, 주장하고자 하는 것.

    통계 : 우리는 귀무가설을 reject할 근거를 찾는데 실패했다.  = 통계적 검증을 귀무가설로 실시한다.

     


     

    통계량이 먼저인가? 데이터 수집이 먼저인가?

     

    회사 '내'에서는 ' Schema'라고 불리는 DB에 저장되어 있기에, 이미 처리된 데이터를 다루기 때문에 형식이나 양식을 알고 있다. 라는 조건 하 통계량을 먼저 설정 할 수 있다.

     

    Satterthwaite  유도

    통계량은 특정 분포를 따른다  :  따르지 않으면 의미가 없다?

    평균 : 중심 극한 이론에 따라 정규분포 양상

    T/F : 이진분류 : 베르누이 분포?

    ㄴ  각각의 데이터를 보고 어떤 특성을 따를것이라고 예상하는 것은 분석가의 능력 이라고 한다. 

     

    이러한 통계량 및 분포를 기반으로 관련 확률을 구할 수 있다 ( p-value)

    ex) 동전 던지기 후 동전이 부셔질 가능성은 희박하다 => 일어나지 않을 일 이라고 간주 할 수 있다.

     

    통계 수식상의 영문 : 실제 통계에 있는 값 // 라틴 : 구할 값

     

    검정 통계량과 가설의 기각

    Measures of dispersion are used to determine the spread of data

    p-value

    귀무 가설이 정확하다는 가정 하에서 실제 관찰된 결과만큼 극단적인 검정 결과를 얻을 확률

    p 기준 수치 : Confidence level : 신뢰 수준

    사회과학 기준 : 5% 일반적 // 비판의 대상 

    해결방안? : 데이터를 늘리는 것. 검정력: Statistical power //  1 - β

    [통계 기초] Type I error VS. Type II error 비교 분석! (False Positive VS. False Negative) : 네이버 블로그 (naver.com)

     


    건강한 T - test

    Right Positive skew // Left Negative?

    • 왜도나 이상치가 반드시 결과를 반대 방향으로 왜곡하는 것은 아닙니다.
      • 이 경우 왜도가 실제 결과에 영향을 미치지는 않았습니다.
      • log 변환을 한 뒤 다시 검정을 해보아도 결과는 바뀌지 않습니다.
      • 하지만 많은 경우, 이상치와 왜도는 결과에 큰 영향을 미칠 수 있습니다.

     

    Confidence Interval

    표본을 뽑아 신뢰 구간을 무수히 많이 계산한다면 100번 중 95번은 신뢰구간이 모수를 포함하고 있다.

     

    • 흔히 보이는 잘못된 해석은 “*모수가 신뢰 구간 안에 들어갈 확률이 95%(신뢰 수준)”*이라는 것입니다.
      • 모수도 신뢰 구간도 모두 변수가 아닌 상수이기 때문에 들어가거나 들어가지 않거나 둘 중 하나만 가능합니다.
    • 신뢰 구간을 통해 우리는 모수의 범위를 대략 짐작해볼 수 있습니다.
    • 하지만 아쉽게도 파이썬은 이런 부분에서 구하기가 어려워, 다음과 같이 긴 코드로 신뢰 구간을 구해보았습니다

    • 검정통계량 t는 두 집단의 평균의 차이를 나타내는 값인데, 그것이 0보다 훨씬 작습니다.
      • 이에 더해 신뢰구간 또한 0보다 훨씬 멀기 때문에, 조금 더 확신을 가질 수 있습니다.
    • 그런데 왜 이렇게 수식이 길어진 걸까요? welch란 이름은 어디서 나온 걸까요?
      • 사실 t-test는 가정과 목적에 따라 다양한 변형variation이 있습니다. 이를 알아보겠습니다.

    D.i.M 평균 차이 // Lower bound // Upper bound

     

     

     

    One Sample t-test

    '한 집단'의 평균이 특정값과 크게 차이가 나는지 검정 // scipy.stats.ttest_lsamp

     

    Two-Sample t-test

    '두 집단'의 평균 차이 검정 // Pulled barriers

    Welch t-test : 두 집단의 표본, 분산이 다르다고 가정 / 자유도와 분산 구현 / 제약 조건이 풀어지면, 검정력이 약해짐

     

     

    Paired t-test

     

     

     

     

    '기초수학 > 통계학 유사품' 카테고리의 다른 글

    통계학 - ANOVA  (0) 2024.05.31
    통계학 -2 /code 해례본  (0) 2024.05.27
    통계학 - 평균  (0) 2024.05.27
    통계학  (0) 2024.05.27
Designed by Tistory.