-
TIL - 06.17TIL 2024. 6. 17. 21:28
데이터 전처리 작업 시 기준 정하기
어느 컬럼에 적용이 가능한가?
ex ) price : 끝값이 중요 // time : 끝값 의미X(min : 일정값 , max : 사건, 사고)
그렇다면 그 영향은 어떻게 될 것인가?
그 내용과 관련없는 다른 column의 값들은 ?
무작위로 갈려나가는데 어떤 특정 값(price의 극단값) 이라서 잘려나갈 가능성은?
화물 탑차에 적재하는 물건의 크기를 단순히 부피로 계산해도 되는가?
적재 효율성을 싸그리 무시한 경우라고 할 수 있으나 평균적인 예상은 가능하다.
그리고 무게와 관련된 포장의 한계점을 생각해본다면 ..
데이터 분석은 깊게 고민할 수록 내용이 많아져 어느정도 부분을 포기해야 할까 아니면 디테일을 챙겨야 할까?
새로 알게 된 코드
import seaborn as sns import matplotlib.pyplot as plt sns.pairplot(data=merge_df4, plot_kws={'alpha': 0.1})
'TIL' 카테고리의 다른 글
TIL - 06.20 (0) 2024.06.21 TIL - 06.19 (0) 2024.06.19 TIL - 06.14 (0) 2024.06.17 TIL - 06.12 (0) 2024.06.12 TIL - 06.11 (0) 2024.06.11