ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • TIL - 06.17
    TIL 2024. 6. 17. 21:28

    데이터 전처리 작업 시 기준 정하기

     

    어느 컬럼에 적용이 가능한가?

    ex ) price : 끝값이 중요 // time : 끝값 의미X(min : 일정값 , max : 사건, 사고)

     

    그렇다면 그 영향은 어떻게 될 것인가?

    그 내용과 관련없는 다른 column의 값들은 ? 

    무작위로 갈려나가는데 어떤 특정 값(price의 극단값) 이라서 잘려나갈 가능성은?

     

    화물 탑차에 적재하는 물건의 크기를 단순히 부피로 계산해도 되는가?

    적재 효율성을 싸그리 무시한 경우라고 할 수 있으나 평균적인 예상은 가능하다.

    그리고 무게와 관련된 포장의 한계점을 생각해본다면 ..

     

    데이터 분석은 깊게 고민할 수록 내용이 많아져 어느정도 부분을 포기해야 할까 아니면 디테일을 챙겨야 할까?

     

     

     

     

    새로 알게 된 코드

    import seaborn as sns
    import matplotlib.pyplot as plt
    
    sns.pairplot(data=merge_df4, plot_kws={'alpha': 0.1})

     

    'TIL' 카테고리의 다른 글

    TIL - 06.20  (0) 2024.06.21
    TIL - 06.19  (0) 2024.06.19
    TIL - 06.14  (0) 2024.06.17
    TIL - 06.12  (0) 2024.06.12
    TIL - 06.11  (0) 2024.06.11
Designed by Tistory.