전체 글
-
WIL - 6주차WIL 2024. 5. 27. 10:31
머신러닝 기초더보기Supervised LearningUnSupervised LearningReinforecement Learning clustering 은 군집화 train_set, test_setStratified sampling산점도 alpha = 0.1 // 숫자가 낮을수록 밀도가 높을수록 표시됨 : 흐리게 correation : 선형적 관계 ( 비례, 반비레) 에 유용하나, 원점에 대해 대칭적인 경우엔 파악할 수 없음 (0) 단순한 침대수, 방수, 인구수는 중요하지 않지만 비교 대상이 있을 경우 의미 있어질 수 있음(예시 : 나누기)rooms per household : total room / households 머신러닝 알고리즘을 위한 데이터 준비 : 전처리- interpolation(보간법)..
-
TIL - 05.23TIL 2024. 5. 24. 09:11
상관 분석(相關 分析, 영어: correlation analysis, dependence analysis : 두 변수 간에 어떤 선형적 관계 상관 분석 - 위키백과, 우리 모두의 백과사전 (wikipedia.org) 일정한 형태(특정값, 선분 기준으로 뭉쳐져 있음)를 가진 상관 관계 그래프.그 관계성과 관계없는 경계값 존재 (50000, 35000 구간 등 가로 직선)를 확인하고 머신러닝에 적합한 자료인가 를 판단하고 영향을 미칠 것 같다면 제거 할 것. 머신러닝 학습을 위한 데이터 셋, 테스트를 위한 데이터 셋으로 나누는 것은 전처리 이전에 나눠야 한다.why? 전처리 과정또한 전체적인 데이터 구성에 영향을 미치기 때문
-
TIL - 05.22TIL 2024. 5. 22. 22:16
많은 컬럼의 unique값 구하고 그 그래프를 그리는 방법 2가지더보기list = ['Mortgage Loan','Not Specified', 'Personal Loan', 'Student Loan','Debt Consolidation Loan','Auto Loan', 'Payday Loan','Credit-Builder Loan', 'Home Equity Loan']# 에 대해 1개 이상이면 T / Fdef seg(col) : for i in col : bank[i]=np.where(bank[i]bank002 = bank.groupby('Customer_ID',as_index = False)[['Mortgage Loan','Not Specified', 'Personal Loan', ..
-
TIL - 05.21TIL 2024. 5. 21. 11:07
# 핸즈온 머신러닝 'tenserflow' 인공지능 : 사람의 능력, 기능 -> 컴퓨터로 구현 (머신러닝 아닌 예시 : 전문가 시스템)머신러닝 : 대량의 데이터를 활용하여 스스로 패턴이나 규칙, 특성을 학습한다. ( 데이터 의존적 - driven)딥러닝 : + 인공신경망으로 이뤄져있다. (neural networks) : 최초의 신경망 : Perceptron, Signoid?임계점을 꼭 필요로 하지 않는다.(일부만 가지고 있다?) 방식 예시머신러닝 : SYM, K-nearset neighbor, random foerst딥러닝 : DNN, CNN, RNN(LSTM) , Transformer, GPT .. SupervisedClassification - Labeling -Regression : 회귀..
-
WIL - 5주차WIL 2024. 5. 20. 21:53
Class / Method / Object / Attribute / InstanceDataframe Attributes in Python Pandas - GeeksforGeeks pd.query / 열추가 / Groupby groupby('col', as_index=False) dtype('O') : Object / DataFrame List / nan 종류 / 2차원 배열 차원 하강 / nunique vs unique / pd.value_counts() /\pd.replace / 최빈값 / df_filter / str.contains() / df행반복 (regex= boolean)True일 경우 string/pattern을 regular expression pattern으로 인식. False일 경우..
-
TIL*2 - 05.17,9TIL 2024. 5. 20. 00:47
전처리에 시간이 많이 든다 = 이거 파고 들려면 어디까지 들어가야 할지 모르겠다. dtype('O') : Object더보기'b' boolean 'i' (signed) integer 'u' unsigned integer 'f' floating-point 'c' complex-floating point 'O' (Python) objects 'S', 'a' (byte-)string 'U' Unicode 'V' raw data (void) DataFrame List더보기to.DFL = ['Thanks You', 'Its fine no problem', 'Are you sure']#create new df df = pd.Da..