ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • TIL - 06.18
    카테고리 없음 2024. 6. 19. 10:46

    공부는 역시 벼락치기!

    시발

    스케일링 - 이상치 제거 순서 

    나의 의견 : 제거하고 스케일링 해야함

    이유 :  스케일링의 방식 : 편차 기준 값의 재정렬

     -> 스케일링 먼저 하고 제거하면 이상치가 적용된 상태에서의 정렬 : 남은 값들에 있어 의미가 퇴색됨. 

     

    조사 대상과 통계의 평균

    ex) 각 값을 Join 하기 전, 볼펜A와 B간의 길이의 평균 비는 1:1

    이후 소비자 구매 수량에 따라 A*3,B*1 는 평균비가 1:3으로 A쪽으로 쏠리게 된다.

     

    이때 주목할 대상이 어디인가에 따라 이전값에 대해 이상•결측치 처리를 하거나 이후값에 처리를 하는것을 결정해야 한다.

     

     

Designed by Tistory.