파이썬 정리/데이터 전처리, 시각화 툴
-
파이썬 - 데이터 전처리/시각화 2파이썬 정리/데이터 전처리, 시각화 툴 2024. 5. 9. 17:35
Line 연속형 데이터시계열에 따른 데이터 변화 및 추이 시각화import seaborn as snsdata = sns.load_dataset('flights')df = data[['year','passengers']].groupby('year').sum().reset_index()plt.plot(df['year'],df['passengers'])plt.show() Bar막대그래프 범주형 데이터각각의 막대로 크기를 비교하는 것이 효과적ex)카테고리 별 값 크기 시각적 비교 plt.bar(x,y)... Historgram연속적인 데이더의 분포 , 데이터의 빈도를 시각화 해서 특정 정보를 얻고자 할 때 유용하게 사용 plt.hist(data, bins=30) # 구간들의 범위plt.xlabel('..
-
파이썬 - 데이터 전처리/시각화파이썬 정리/데이터 전처리, 시각화 툴 2024. 5. 9. 12:23
전처리 및 시각화 - 설득 : 데이터 전달의 목적성과 효과성 정의 : 무엇을 위해 ~이런 형태의 데이터가 필요하다이유 : 복잡 다양 데이터를 다루다가 전처리 로직에 매몰되어 큰 그림을 잊는 경우 발생결론 : 정의 활용 - 올바른 의사결정을 위한 사전 설계 습관 ---내가 원하는 데이터를 보기 위한 데이터 전처리 정형 데이터 속 불규칙한 데이터ex) 성별 : 남 or 여 +남성 + 여자 +여성 등 의 다양한 경우의 수 핸드폰 번호 '-'붙였다가 뗏다가 띄워쓰거나 다양.=>데이터 전달의 목적성에 따른 처리, 효과성을 가짐 excel vs pandas판다스의 장점1. 자동화와 프로그래밍 기능2. 대용량 데이터 처리3. 복잡한 데이터 처리 분석4. 확장성과 유연성5. 버젼 관리 Index더보..