
0. 데이터 리터러시를 포함해 다른 여러 가지 능력을 사용하기로 했다.
1. 데이터 리터러시
정의 : 데이터를 읽고 쓰며, 이해하는 능력. 그러나 이는 단순히 데이터랠 해석하는 것을 넘어 비판하여 그 문제의 본질에 대가가서 활용할 수 있는 전반적인 해석 능력을 일컫는다.
데이터 분석만 잘하면 문제,목적,결론이 나올거 같지만 실제로는 그렇지 않다. 오히려 데이터 해석에 있어서 수 많은 치명적인 오류들이 드러난다. EX) 심슨의 역설, 샘플링 편향, Literary Digest
즉, 데이터에 기반한 결론이라고 해서 모든 자료가 올바른 자료는 아니며, 이를 비판적으로 분석한느 과정은 반드시 필요하다고 할 수 있다.
2. 데이터 리터러시가 지켜지지 않는 이유
이는 문제가 명확하게 정의되지 않은 것으로 인해서 대게 발생함. 보통 3단계로 구성되어서 데이터 분석이 이루어진다.
|--------------------------------| |--------------------------------| |-------------------------------|
문제 및 가설 정의 => 데이터 분석 => 결과 해석 및 액션 도출
(생각) (작업) (생각)
|___________________| |___________________| |___________________|
[1] 문제 정의
- 데이터 분석을 위한 기본 초석으로 특정 상황에 대해서 명한 진술을 통해 프로젝트의 방향을 설정함
[2] 데이터 분석
- 가설과 문제에 대한 정의를 기반으로 조사하여 데이터를 시각화하는 작업
[3] 결과 해석 및 액션 도출
- 가설에 대한 액션을 도출하고 이에 대한 해석을 만들어
방법론
1) MECE (Mutually Exclusive, Collectively Exhuastive)
- 문제 해결과 분석에서 널리 사용되는 접근 방식
- 문제를 상호 배타적, 전체 포괄적 요소로 나누는 것
- 보다 복잡한 문제를 체계적으로 분해하고, 구조화된 방식으로 분석할 수 있음

2) 로직 트리
- MECE 원칙을 기반으로 복잡한 문제를 더 작고 고나리 쉬운 하위 문제로 분해하는 데 사용
- 상위 문제로 시작해 하위 문제로 계층적 접근
- 일반 도표 형식으로 쉽게 파악이 됨

3. 데이터의 유형
[1] 정성적 데이터
- 비수치적 정보 = 사람의 경험,관점,태도와 같은 주관적 경험을 포함한 정보
[ EX : 텍스트, 비디오, 오디오 형태 등]
- 정형적이지 않고, 비구조화
- 새로운 현상이나 개념을 이해하는 데에 사용함
[2] 정량적 데이터
- 수치적 정보 = 양적인 측정과 분석을 통해서 얻을 수 있는 정보
[ EX : 숫자, 형태, 설문조사, 실험, 인구통계, 지표 분석 ]
- 개인의 해석이나 주관이 적개 들어가는 객관성 있음
- 지표를 만들기에 용이
- 일일 활성 사용자수 / 재방문 비율 등 서비스의 건강 상태를 나타내는 중요한 지표들을 확인
- 통계적 분석 적용(분포, 평균, 중앙값 등을 계산) => 경향성과 패턴 파악
[3] 정리
정량적 데이터 | 정성적 데이터 | |
유형 | 정형 데이터, 반 정형 데이터 |
비 정형 데이터 |
특징 및 관점 | 여러 요소의 결합으로 의미 부여 객관적 내용이 다수 |
객체 하나가 함축된 의미 내포 주관적 내용이 다수 |
구성 및 형태 | 수치나 기호 데이터 베이스, 스프레드 시트 등 |
문자, 언어 웹 로그, 텍스트 파일 |
위치 | DBMS, 로컬 시스템 등 내부 | 웹 사이트, 모바일 플랫폼 등 외부 |
분석 | 통계 분석시 용이 | 통계 분석시 어려 |
단순카운트, 고객수 증가여부 / 제거 횟수 등 => 비율, 고객 평균 장바구니 비율... 제거 횟수... [지표]를 만드는 것
4. 지표
[1] 지표 정의
- 특정 목표 or 성과를 측정하기 위한 구체적, 측정 가능한 기준
- 목표 달성도 평가, 전략적 결정에 의한 핵심정보를 제공
- 정의한 문제에 대한 파악을 위해 필요
[2] 문제 정의 VS 지표 설정
- 문제 정의 : 어떤 문제를 풀고 싶은지
- 지표 설정 : 어떤 결과를 기대하는지
[3] 북극성 지표
- 제품 / 서비스 성공 정의
- 제품 / 서비스가 유저에게 주는 핵심 가치를 잘 표현하는 것
- 장기 성장을 필수적으로 모니터링 해야함
- 특징 : 고객이 느끼는 가치, 목표에 대한 선행지표, 제품/서비스 전략의 핵심 지표
- 방향성 : 최적화된 가치와 방향성 제시
- 가치 창출을 전사 / 조직 결과를 보여줌
- 북극성 지표 : 전 직원을 목표에 집중 시킴
- 상반된 목표에 집충, 중복으로 일하는 것을 방법
5. 결론 도출
[1] 결과 : 구체적인 데이터의 결론. 분석을 통한 결과물
[2] 결론 : 분석화된 데이터를 끌어낸 통찰과 의미 (해설과 추론, 권고 사항)
=> 대게 결론에 대해서 내야하지만, 결과에 대해서 잘 얘기할 필요가 있음
이번주의 WIL과 함께 작성하면서 생각을 정리한다.
이번주 직무 스터디 / 코딩 기초 발제 와 관련해서 KDT 에 대해서 좀 작성도 하고 나도 내 스스로 좀 반성할 점을 정리하고 싶어졌다.
Keep : 목표를 세워서 데일리 스크럼 작성 / TIL 은 8시 부터 정리하면서 있기
Problem : 이번에 스스로 많이 커뮤니케이션을 잘 안됐다고 느꼈다. 많이 속상했다. 콧물도 나고, 찔찔 짜가지고....
사실 사람을 보기에 너무 부끄러움도 많아서 다른 분들 보는게 어려웠다. 그래서 그런 점을 고치고 싶다.
Try : 개인 공부를 하면서 손들고 커뮤니케이션을 하는 방법에 대해서 논의
WIL 이번주는 CASE WHEN을 활용한 코딩을 사용헀다. DATE DIFF 도 포함해서. 근데 코드가 너무 어려웠다...! ㅜㅜ
select user_id,a.buyer,a.in_cart,a.remove,a.viewer,ROUND((a.remove/a.in_cart) * 100, 2) as rate
FROM
(
SELECT user_id,
COUNT(DISTINCT CASE WHEN EVENT_TYPE = 'purchase' THEN event_time END) AS buyer,
COUNT(DISTINCT CASE WHEN EVENT_TYPE = 'view' THEN event_time END) AS viewer,
COUNT(DISTINCT CASE WHEN EVENT_TYPE = 'cart' THEN event_time END) AS in_cart,
COUNT(DISTINCT CASE WHEN Event_type = 'remove_from_cart' THEN event_time END) AS remove
FROM quest.2019_dec
GROUP BY user_id
ORDER BY user_id
) a
HAVING rate > 0
ORDER BY user_id desc
우이씨..... 이게 알고보니까 구매 포기율은 제거 / 카트에 담은 수 이렇게 라고 한다.
이게 CASE WHEN 의 경우에는 다중 개별 칼럼의 경우에는 그래도 된다고 했다.주말에 일단 SQLD 관련해서 넣어야겠다..
이번에 코드는 짰는데 그 코드를 짜서 잘 못해서 더 중요하게 다른 이 커머스를 넣지 못했다. 그래서 아쉽다....
'𝐓𝐈𝐋 (𝐅𝐨𝐫 𝐂𝐚𝐦𝐩) > 𝐂𝐎𝐃𝐈𝐍𝐆 (𝐒𝐐𝐋, 𝐏𝐘𝐓𝐇𝐎𝐍)' 카테고리의 다른 글
[𝟐𝟓.𝟎𝟑.𝟎𝟓] 𝐓𝐈𝐋 𝐍𝐎𝐓𝐄 𝟏𝟏 (0) | 2025.03.05 |
---|---|
[𝟐𝟓.𝟎𝟑.𝟎𝟒] 𝐓𝐈𝐋 𝐍𝐎𝐓𝐄 𝟏𝟎 (0) | 2025.03.04 |
[𝟐𝟓.𝟎𝟐.𝟐𝟒] 𝐓𝐈𝐋 𝐍𝐎𝐓𝐄 𝟔 (1) | 2025.02.24 |
[𝟐𝟓.𝟎𝟐.𝟐𝟎] 𝐓𝐈𝐋 𝐍𝐎𝐓𝐄 𝟓 (0) | 2025.02.20 |
[𝟐𝟓.𝟎𝟐.𝟏𝟗] 𝐓𝐈𝐋 𝐍𝐎𝐓𝐄 𝟒 (0) | 2025.02.19 |