-
Session / 24-04-19 / 데이터 분석 기본 개념SQL 정리/세션 2024. 4. 19. 17:58
SQL에 관련된 이야기 // 녹화본 제공
DATA DB QUERY SQL 기본개념
----
서비스의 현상태를 숫자 확인, 문제및 해결방안 제시
데이터 추출
타팀 요청 내용 기반 유관부서 공유
가공
추출 후 데이터 전처리(확인, 이상치 결측치 처리) 정합성 검증
깊게가면 머신러닝 딮러닝도 이용.
시각화
인사이트 도출
----
기업의 이익창출 -> KPI
실험의 결과를 비교 이해 가능하게 하는 데이터 분석 : %등의 수치화 가능
사업부 : ROI, ROAS 최소투자 최대이익 전략수립
기획 : 서비스 유입부터 잔존, 터널/단계뼐로 이탈 잔존 비교
'내가 생각한것을 검증하고 설들력있게 전달 하는것!'
AB테스트 차이?
엔지니어 : 데이터 사용 환경 제공
분석가 : 추출 가공 시각화 인사이트 도출
과학자 : 미래지향적, 모델개발 최적화
-----
차별점
논리와 숫자 기반의 인사이트 를 타 부서에 제공.
ex) 유저 레밸링 구간 개선
기술스택 제공 예상
기본적 범용적 질의어 SQL
데이터 : 문자 숫자 이미지 음성 영샹 형태(아날로그 아닌 전자화된)의 "정보"
DB : 저장 데이터 모음
DBMS - data base management system
db에 규칙성 및 정합성을 부여하여 데이터 등록/정리/검색에 용이하도록 하는 software system.
tag 달린 내용을 분류 해줌.
관계형 / 계층형 / 망형
관계형은 2개의 개선안이다?
Query 쿼리를 날린다~
DB에 접근하기 위한 질의 - 결과 흭득 표준화 된 언어(이에 속하는 SQL, Python)
작동 순서
FROM (- ON - JOIN) - WHERE - GROUP BY - HAVING - SELECT (- DISTINCT) - ORDER BY - LIMIT/OFFSET
엔지니어 py spark
------
SQL 실 사용 모습
관계형의 복구 가능은 망형의 특성과 유사한 것인가? 어떻게 작동하는가?
파이썬이 테그 달고 분류하는 과정으로 사용된다
'SQL 정리 > 세션' 카테고리의 다른 글
세션 SQL - 3회차 (0) 2024.04.24 데이터 리터리시 (2) 2024.04.24 04.23 - 세션 2회차 (0) 2024.04.23 SQL 세션 - 단축기 (0) 2024.04.22