-
TIL - 06.18카테고리 없음 2024. 6. 19. 10:46
공부는 역시 벼락치기!
시발
스케일링 - 이상치 제거 순서
나의 의견 : 제거하고 스케일링 해야함
이유 : 스케일링의 방식 : 편차 기준 값의 재정렬
-> 스케일링 먼저 하고 제거하면 이상치가 적용된 상태에서의 정렬 : 남은 값들에 있어 의미가 퇴색됨.
조사 대상과 통계의 평균
ex) 각 값을 Join 하기 전, 볼펜A와 B간의 길이의 평균 비는 1:1
이후 소비자 구매 수량에 따라 A*3,B*1 는 평균비가 1:3으로 A쪽으로 쏠리게 된다.
이때 주목할 대상이 어디인가에 따라 이전값에 대해 이상•결측치 처리를 하거나 이후값에 처리를 하는것을 결정해야 한다.