기초수학
-
통계학 - ANOVA기초수학/통계학 유사품 2024. 5. 31. 17:40
t-test 한계3개의 대상 일 시 95% 유지하는 것 어려움 (3!/2!) 분산 분석ANOVAAnalysis On Variation 분산 = 표준편차의 제곱단위(Unit)이 다름 = 데이터 정리 분석 머신러닝에 필요 degree of freedom : 자유도 ANOVA assumption 방식의 기반에는 normal(정규분포) 가 있고 이를 이동하면 표준정규분포가 된다 집단 간 분산 - Variation between groups집단 사이의 평균이 멀리 떨어질수록, 값이 커진다 집단 내 분산 - Variation Within groups집단 내의 분산이 크면, 집단 사이의 평균이 더 커야 귀무가설 기각 가능=> A,B 집단의 평균 키가 173, 174인데 분산이 30을 넘기면 거의 유사함. 실질..
-
통계학 - 3 : 통계적 가설기초수학/통계학 유사품 2024. 5. 28. 21:09
통계적 가설 검정주어진 자료가 특정 가설을 충분히 뒷받침하는지 여부를 결정하는 통계적 추론 방법정량적인 측정량의 정의객관적으로 누구나 납득할만한 기준 필요A/B 테스트에서의 두 집단의 매출 비교세그멘트(연령 등 특정 기준에 따른 유저 그룹) 에 따른 특성(매출, 방문) 차이 확인두 집단(투약 실험) 의 의학적 효과 (혈당 등) 차이 검사 통계적 가설 검정의 효과의사결정에 필요한 이론적 근거를 확보객관적인 자료와 수치로 설득력을 높힌다모호한 상황에서 불확실성을 수치로 가시화한다체계화된 프로세스를 통해 다양한 리스크를 제거한다여러 통계 / AI 도구를 Custom 하여 활용할 수 있다. 귀무(영)가설 (H0)/(Null Hypothesis): 두 그룹의 평균은 같다. 즉, 두 그룹 간에는 유의한 차이가 없다..
-
통계학 -2 /code 해례본기초수학/통계학 유사품 2024. 5. 27. 21:32
df.order_id.value_counts() 더보기Syntax:df['column']: This is the dictionary-like access method. You use the column name as a key inside square brackets.df.column: This is the attribute access method. You use a dot followed by the column name.Flexibility:df['column']: This method is more flexible because it works with any column name, including those with spaces or special characters. For example, ..
-
통계학 - 평균기초수학/통계학 유사품 2024. 5. 27. 15:56
평균 : Average , MeanA single number or value that best represent a set of data 평균은 다양한 종류가 있다.산술평균 외에도 수십가지가 존재. DistributionProbabiliy Distribution개개의 데이터가 실현되기 전의 가능성을 수식화하여 정리 한 것확률 분포는 실제로 자주 볼 수 있는 일부 확률의 케이스들을 체계적으로 정리 한 것많은 경우 독립적이고 동일한 분포를 같는(iid) 확률 변수의 경우 원래의 변수 자체가 정규분포를 따르지 않더라도 표본 평균의 분포가 정규 분포를 따르는 경향이 있다. CLT : 중심 극한 정리 Central limit theory => 표본평균의 분포 가 정규 분포를 따르는 경우?정규 분포를 이용..
-
통계학기초수학/통계학 유사품 2024. 5. 27. 10:32
개인화 추천모델 과거의 기록 : 너가 누구인가? // Cold start : 새로 가입한 대상으론 적용하기 어렵다 해결 : 정보가 적더라도 그 주기를 당겨서 매번 업데이트 해볼까?하루에 N번 / 몇번 하는 것이 적절할 것인가? 개인화 vs 연관화이유 설명과 핵심지표로 설득하기 CTR : 클릭 전환율 연관화 동작 : 기존 작품과 유사성이 존재하는 CTR추천에 따른 전환율 상승 확인 가능 개인화 동작 : 추천하려는 작품(팝업작품) 과 유저 사이의 유사도 CTR유저가 좋아할만한 작품을 추천하면 CTR이 극적으로 상승=> 행렬 분해 알고리즘과 embedding vector 활용 : ML지식 필요 추가 분석 : 매출 추척, Action item방문 목적 : 신규 열람과 앱 방문은 별개 // 짬 나는 시간..