-
데이터 수집과 원천을 이해 / 활용법 이해 / 핵심지표 이해
-> 올바른 질문
데이터 분석에 대한 착각
잘 분석하면 문제 목적 결론 나옴
가공하면 유용한 정보 얻음
실패하면 방법론, 스킬 부족
오류사례
심슨의 역설
'부분'에서 성립한 대소관계가 종합적인 '전체'에서 성립하지 않는
모순적인 경우를 말한다.
시각화를 활용한 왜곡
자료의 표현 방법에 따라서 해석의 오류 여지 존재
기본 / 로그값 / 기준치 설정
등에 따라 상관관계가 역전 된 것처럼 보이는 경우도 존재
샘플링 편향(sampling Bias)
전체를 대표하지 못하는 편향된 샘플 선정으로 인한 오류
literary digest : 대선 여론조사 / 자사 내 명부 이용
-> 구독 여력이 있고 정치에 관심이 있는 대상 위주 편항
상관관계-인과관계
상호 의존성, 증감 추종
종속변수 ㅡ 원인과 결과가 명확하게 수치변화
-> 소아마비 / 아이스크림은 여름에 많음=> 상관관계는 맞으나 인과관계 아님
데이터 활용 예제
문제 및 가설 정의 : 생각
데이터 분석 : 작업
결과 해석 및 액션 도출 : 생각
문제 정의
구체적으로 설정
ex: 매출증가 대상 고객층, 제품 초점 설정 등)
지난 6개월 동안 2~35 세 여성 고객층의 구매 전환률이 급격히 감소하였다.이 고객층의 전환율을 현재의 2%에서 5%로 끌어올리기 위해 어떤 마케팅 전략을 적용할 수 있을까?
상황분석
3개월 전부터 자사 제품의 사용자 수가 감소하고 있다.
사용자 수를 늘리기 위한 포인트 이벤트를 하고 있지만,
효과가 없어 보인다. 또한 자사 제품 내 서비스 중 A보다 B가
더 안 좋은 상황이다. 사용자가 줄었기 때문에, 수입도 감소하고 있다.
3개월 전, 자사 제품 이용자수 감소, 포인트 이벤트 효과, A,B, 수입
그전엔 무슨 일이 일어나서
타사는 어떠하며
홍보가 되었는지 그리고 고객 유인책으로 적절한지
B만 심한 것인가?
수입률 하락이 고객 수 하락률 보다 급격한가? 등.
중요한것이 수입이라면 그 외의 것은 문제라기보단 원인이다.
문제 정의를 위한 방법론
MECE
Mutually Exclusive, Collectively Exhaustive
상호 배타적 , 전체적 포괄적 구성요소로 나누는 것
중복과 누락이 없도록 나누어야 함
Logic Tree
MECE 원칙 기반 문제들을 하위 문제로 분해
상->하위 계층적 접근 / 일반적으 도표 형식 표현
로직트리 Cheat Sheet
비즈니스에 따라 정의를 달리 사용하면 좋음
-> 배민 고객 세그먼트
기존 : 라이트 일반, 헤비
배민 : 고마운분 , 귀한분 , 더귀한분 , 천생연분 등
기존 : 캡슐 점유율
배민 : 배달 플랫폼 점유
문제 정의의 필요성
풀고자 하는 것을 명확히 정의하고
데이터 방향성을 정하며
결과를 정리하고 해석하여
더 나아가기 위한 새로운 액션플랜 수립
so what?
결국 어떻다는 것인지 를 알아내는 작업
이전 정보 소재 및 현에서 과제에 맞는 중요 핵심 추출
why so?
왜 그렇게 말하지?, 구체적 의미 검증 확인
so what의 요소의 타당성을 자료 전체 혹은 그룹핑한 요소로
증명할 수 있다는 사실을 검증하는 작업
결과 공유 대상 정의 후 원하는 변화 생각
-> 회사 소속이라면 경영자의 시야로 보려는 노력
많은 이들과 의견을 나누는것도 방법
반드시 혼자 오래 고민 하는 시간 필요
데이터 유형
정성적(Qualitative) 데이터
비수치적 정보 : 사람의 경험, 관점, 태도 와 같은 주관적 요소 포함
대부분 텍스트, 비디오, 오디오 형태 - 정형화, 구조화 X
새로운 현상이나 개념에 대한 이해 심화
정량적(Quantitative) 데이터
수치적 정보 : 양적 측정 분석 가능 / 통계적 분석 쉬움
개인의 해석이나 주관이 적게 작용하는 객관성 - 지표설정 용의
설문조사, 실험, 인구 통계, 지표 분석등 활용
-> 비즈니스 데이터, 행동 로그 데이터, 마케팅 데이터
활용
DAU(오늘 활성 사자수), Retention,
NPS(Net Promoter Score,추천지수) = 추천고객비율 - 비추천 고객 비율
분포, 평균, 중앙값 등 경향성 및 패턴 파악 가능
비즈니스 분석, 예측 모델링, 추세 분석을 포함한 머신러닝 같은 현대적 데이터 분석 기법 활용 가능
예상 답변 가능 질문
한달 동안 우리 회사가 버는 매출은 얼마인가?
하루 평균 우리 플랫폼에 접속하는 고객수는?
지난달에 방문한 유저 중 얼만큼이 다시 우리 서비스를 이용했는가?
문제정의 : 어떤 문제를 풀고자 하는가? 의 정의
ㄴ 둘 이상의 해석이 나오지 않도록 구체적으로 표현하고 정의하였는가?
지표 : 어떤 결과를 기대하는가 에 대한 정량화된 기준
ㄴ 정의한 문제를 확인하는데 적합한가?
ex) 날씬해지기
'날씬'을 정의
국가 비만 도 정의에 의한 '정상' 체중 (18.5~23)(지표:BMI(체중/키**2)
이상적으로 생각하는 체지방률(15%)(체지방량/몸무게)
수단 : 주 5회 이상 운동, 매일 7시 이후 금식
지표 : 운동이행률 (5일/5일), 식단 달성률(30일/30일)
주요 지표 이해
Active User(활성 유저) / MAU, DAU?
서비스에 들어오는 모든 유저? X
AU 정의에 따라 전략, 방향이 달라짐 -> '이탈유저' 정의
1)사이트 진입 유저
메인 홈 활성 시 / 허들 낮음 / 가장 높음 / 대상 액션 효율 떨어짐
2)추가행동 한 유저
두번쨰로 낮음 / 1번보단 높음
3)서비스의 최종 액션 수행한 유저
가장 허들 높음 / 서비스 goal 액션(ex 수강신청) / 가장 낮은 AU 지표
자사 서비스 핵심 및 효용성 경험한 유저 / 대상 액션 효율 이익 높음
AU / 정밀도,허들 반비례
어디까지? 기준? 효용성을 느끼는? 유저 규묘(사이즈)는?
Retention Ratio (재방문율)
정의 : 서비스를 사용한 사람이 다시 서비스를 사용하는 비율 %
한번 흭득한 유저가 다시 서비스로 돌아왔는가?
높은 서비스는 흭득비용에 투자한 비용을 빠르게 회수 할 수 있음
서비스(특히 앱서비스) 성장에 있어 매우 중요한 지표
방문기준 vs 특정기준(AU처럼 지정가능)
자연스러운 감소 이후 기울기가 완만해지며 안정화되는 그래프라면
시장에 적합한(안착한) 서비스라고 할 수 있음
N-day 리텐션
N일 이후에 재방문한 AU 비율(일반적임)
게임,소셜 등 습관적, 반복적 행동 유도하는 제품 적합
AU 최초 집계일이 Day0 설정, 이후 N일차 리텐션 계산(N-W, N-M가능)
사용주기에 따라 과소평가 가능성 있음
Unbounded 리텐션
특정 날짜 포함 그 이후에 재방문한 유저 비율 / 한번이라도 재방문한 유저 비율
정기적으로 방문하는 서비스가 아닐 경우 적합, 이탈율의 반대 개
Ex) Day 5는 5일차까지 한번 더 들어온 경우
-> 마지막 방문일 이전 방문한 것으로 계산 -> 실제로는 그렇지 않음 -> N-day와는 큰 차이 존
위 표기준 1.6일날 토끼귀(무지) 접속 시 이전 리텐션 값 전부 변동됨 -> 절대적 수치보다는 트렌드 보는 용도 적합
채용사이트 / 쇼핑몰 / 부동산 매물 서비스
=> n-day 리텐션 적용 시 불필요한 할인, 푸시 메시지 발송 등 잘못된 액션 가능성 존재
Bracket 리텐션
설정 특정 기간 기반 재방문율 측정 / N-day 확장개념 -> 일/주/월 단위가 아나닌 지정 구간으로 나눔
ex) 1(0일차) / 2(1-3일차) / 3(4-6일차) / ....
활성 유저가 특정 활동을 위해 각 bracket 내 재방문시 잔존유저로 간주.
사용주기가 길거나 주기적인 경우 : 식료품 배달, 세차 서비
====
리텐션 높은 세그먼트(고객층) 발굴 작업 필요 / 사용 주기에 따라 조회기간 조절 필요 / 사후 분석 용이
Funnel
퍼널(Funnel)이란 소비자의 행동을 기업 관점에서 재구성한 것으로, 고객이 유입되어 전환에 이르는 단계를 수치로 확인하고 분석하는 방법론
잠재고객 유입 - 최종 목표 액션 달성까지의 과정 / 각 단계별 이용자수 감소 / 전환률 측정
-> AARRR
Acquisiton - 유입 / 앱 설치, DAU, 실행수
Activation - 활성화 / 상품조회, 장바구니 담기, 좋아요 수
Retention - 재방문(구매) / 전환,이탈 데이터
Referral - 수익 / 전체매출, LTV, ARPPU
Revenue - 추천 / 리뷰작성, 공유, 친구초대
이를 통해 CAC(Customer Acquistion Cost)의 산출 및 효율적 예산 운용 가능
사용 주기, 변수, 객단가 등 여러가지 고려 필요
DIKW 중 K에 해당하는 가정을 베이스로 하는 지표 - 모니터링 필요
북극성 지표
제품, 서비스의 '성공' / core value 나타낸 것.
-> 장기성장을 위해 필수적 모니터링 요소.
제품,서비스 전략의 핵심 / 유저,고객이 제품,서비스에서 느끼는 가치 /
회사의 사업 목표를 나타내는 지표 중 선행지표(후행 X)
부정 : 외부요인 영향 / 전체여정을 반영하지 않는 / 직접 가치를 느낄 수 없는 / 측정불가 or 기간설정 안되는 지표
Ex) 회원가입 수, DAU, Retention, 다운로드 수, 페이지 뷰 수(예외 존재)
제품,사업 조직이 무엇에 최적화 되어야 하고
무엇을 포기해도 되는지에 대한 방향 제시
제품,사업 조직의 진척과 가치창출을 전사에 보여줌
지원 조직이 더욱 적극적으로 지원, 재품개발 액션 실행속도가 빨라짐
제품,서비스 조직이 결과에 책임을 지도록 함
비즈니스 임팩트에 따라 평가가 가능
=>효율 증대 : 전사적 목표 집중, 상반된 목표나 중복 업무 방지(MECE구조)
결과
데이터 처리, 분석, 모델링 후에 얻어진 구체적 데이터의 출력
숫자, 통계, 그래프, 차트 등의 형태로 나타낼 수 있음
"결과, 상관관계 존재 확인"
결론
분석된 데이터 결과를 바탕으로 이끌어낸 의미나 통찰
데이터 기반한 해석, 추론 또는 권고사항을 포함
"상관관계 기반, x의 향상이 y의 증가로 이어질 수 있는 결론"
=> 스토리 필요 / 필요이상의 주관 관여 x
+목적의식, 공유대상, 적절한 변화 고려
1. 단순 쉽게 전달
핵심지표 - 지표해석 방법 - (오너쉽 조직)활용방안 포인트 제안(액션포인트)
2. 흥미 유발
모든 내용 X - 상대 맞춤 필터링 - 디테일 문서 따로 공유
3. 대상자 관점 접근
대상자 시선 이해 쉽도록 정리 - 지식의 저주 X 논지 뒷받침 자료 첨부 - 허들 낮은 시각화 활용
4. 시각화 팁
대상이 직관적으로 이해할 수 있는 구성 - 선, 막대로 대부분 가능 - 범례와 단위 함께 표현
결론보고서 플로우(추천)
전체 내용 요약 한문장 / 보고서 메인주제 / 쓴 이유와 원하는 변화 /
문제 정의 / 핵심 내용 전개 / 결론 및 액션 아이템 단계별 서술
책추천
빅데이터 시대, 성과를 이끌어 내는 데이터 문해력 / 로지컬 씽킹(MECE, 로직트리 실습, 구조사고 방법론)
'SQL 정리 > 세션' 카테고리의 다른 글
세션 SQL - 3회차 (0) 2024.04.24 04.23 - 세션 2회차 (0) 2024.04.23 SQL 세션 - 단축기 (0) 2024.04.22 Session / 24-04-19 / 데이터 분석 기본 개념 (1) 2024.04.19