-
TIL - 05.21TIL 2024. 5. 21. 11:07
# 핸즈온 머신러닝
'tenserflow'
인공지능 : 사람의 능력, 기능 -> 컴퓨터로 구현 (머신러닝 아닌 예시 : 전문가 시스템)
머신러닝 : 대량의 데이터를 활용하여 스스로 패턴이나 규칙, 특성을 학습한다. ( 데이터 의존적 - driven)
딥러닝 : + 인공신경망으로 이뤄져있다. (neural networks) : 최초의 신경망 : Perceptron, Signoid?
임계점을 꼭 필요로 하지 않는다.(일부만 가지고 있다?)
방식 예시
머신러닝 : SYM, K-nearset neighbor, random foerst
딥러닝 : DNN, CNN, RNN(LSTM) , Transformer, GPT ..
Supervised
Classification - Labeling -
Regression : 회귀 분석 - 가격예측 회귀 // linear?
제주도 특산물 , 캘리포니아 집값 예측
UnSupervised Learning
Clusterig Algorithm - Predictive // 그룹으로 나눠주지만 그것이 무엇인진 모른다
고객 군집화 : 전소현 튜터님 // 장학금 분배를 위한 학생 분류 : 서정욱 튜터님
Dimensionality Reduction : 차원 축소 - 데이터 정제
Reinforecement Learning
Agent, Enviorment
-> action
<- state, reword
정규 분포가 한쪽으로 쏠린다
가시안?
테스트 세트 만들기
머신러닝 평가할 떄 사용할 데이터를 분석하기 전에 미리 빼놓기
분석 할 때 평가 데이터를 미리 분석하게 되면 -> 평가에 유리한 분석을 해버릴 수 있음( 일반화 x)
# 랜덤하게 데이터를 나누어줌 from sklearn.model_selection import train_test_split train_set, test_set = train_test_split(housing, test_size = 0.2, random_state=42)
# random_state : seed값
# 결과를 비교할 때 (랜덤으로 달라질 수 있는 상황을 일치시켜주기 위해서)
# 나중에 비교할 때 서로 같은 random state 를 써야 함변수를 정하지 않으면 돌릴 떄 마다 바뀐다.
'TIL' 카테고리의 다른 글
TIL - 05.23 (0) 2024.05.24 TIL - 05.22 (0) 2024.05.22 TIL - 05.20 (0) 2024.05.20 TIL*2 - 05.17,9 (0) 2024.05.20 TIL - 05.15 (0) 2024.05.15