0. 데이터 리터러시를 포함해 다른 여러 가지 능력을 사용하기로 했다.


1. 데이터 리터러시

정의 : 데이터를 읽고 쓰며, 이해하는 능력. 그러나 이는 단순히 데이터랠 해석하는 것을 넘어 비판하여 그 문제의 본질에 대가가서 활용할 수 있는 전반적인 해석 능력을 일컫는다.

데이터 분석만 잘하면 문제,목적,결론이 나올거 같지만 실제로는 그렇지 않다. 오히려 데이터 해석에 있어서 수 많은 치명적인 오류들이 드러난다. EX) 심슨의 역설, 샘플링 편향, Literary Digest

즉, 데이터에 기반한 결론이라고 해서 모든 자료가 올바른 자료는 아니며, 이를 비판적으로 분석한느 과정은 반드시 필요하다고 할 수 있다.

2. 데이터 리터러시가 지켜지지 않는 이유

이는 문제가 명확하게 정의되지 않은 것으로 인해서 대게 발생함. 보통 3단계로 구성되어서 데이터 분석이 이루어진다.

|--------------------------------| |--------------------------------| |-------------------------------|
     문제 및 가설 정의     =>          데이터 분석      =>   결과 해석 및 액션 도출
             (생각)                                 (작업)                              (생각)
|___________________| |___________________| |___________________|

[1] 문제 정의
 - 데이터 분석을 위한 기본 초석으로 특정 상황에 대해서 명한 진술을 통해 프로젝트의 방향을 설정함

[2] 데이터 분석
 - 가설과 문제에 대한 정의를 기반으로 조사하여 데이터를 시각화하는 작업

[3] 결과 해석 및 액션 도출
 - 가설에 대한 액션을 도출하고 이에 대한 해석을 만들어 

방법론 
 1) MECE (Mutually Exclusive, Collectively Exhuastive)
- 문제 해결과 분석에서 널리 사용되는 접근 방식
- 문제를 상호 배타적, 전체 포괄적 요소로 나누는 것
- 보다 복잡한 문제를 체계적으로 분해하고, 구조화된 방식으로 분석할 수 있음

  2) 로직 트리
- MECE 원칙을 기반으로 복잡한 문제를 더 작고 고나리 쉬운 하위 문제로 분해하는 데 사용
- 상위 문제로 시작해 하위 문제로 계층적 접근
- 일반 도표 형식으로 쉽게 파악이 됨

3. 데이터의 유형

 [1] 정성적 데이터
 - 비수치적 정보 = 사람의 경험,관점,태도와 같은 주관적 경험을 포함한 정보
 [ EX : 텍스트, 비디오, 오디오 형태 등]
 - 정형적이지 않고, 비구조화
 - 새로운 현상이나 개념을 이해하는 데에 사용함

 [2] 정량적 데이터
 - 수치적 정보 = 양적인 측정과 분석을 통해서 얻을 수 있는 정보
 [ EX : 숫자, 형태, 설문조사, 실험, 인구통계, 지표 분석  ]
 - 개인의 해석이나 주관이 적개 들어가는 객관성 있음
 - 지표를 만들기에 용이
 - 일일 활성 사용자수 / 재방문 비율 등 서비스의 건강 상태를 나타내는 중요한 지표들을 확인
 - 통계적 분석 적용(분포, 평균, 중앙값 등을 계산) => 경향성과 패턴 파악 

 [3] 정리

  정량적 데이터 정성적 데이터
유형 정형 데이터,
반 정형 데이터
비 정형 데이터
특징 및 관점 여러 요소의 결합으로 의미 부여
객관적 내용이 다수
객체 하나가 함축된 의미 내포
주관적 내용이 다수
구성 및 형태 수치나 기호
데이터 베이스, 스프레드 시트 등
문자, 언어
웹 로그, 텍스트 파일
위치 DBMS, 로컬 시스템 등 내부 웹 사이트, 모바일 플랫폼 등 외부
분석 통계 분석시 용이 통계 분석시 어려

단순카운트, 고객수 증가여부 / 제거 횟수 등 => 비율, 고객 평균 장바구니 비율... 제거 횟수... [지표]를 만드는 것

4. 지표

 [1] 지표 정의 
 - 특정 목표 or 성과를 측정하기 위한 구체적, 측정 가능한 기준
 - 목표 달성도 평가, 전략적 결정에 의한 핵심정보를 제공
 - 정의한 문제에 대한 파악을 위해 필요

 [2] 문제 정의 VS 지표 설정
  - 문제 정의 : 어떤 문제를 풀고 싶은지
  - 지표 설정 : 어떤 결과를 기대하는지 

 [3] 북극성 지표
  - 제품 / 서비스 성공 정의
  - 제품 / 서비스가 유저에게 주는 핵심 가치를 잘 표현하는 것
  - 장기 성장을 필수적으로 모니터링 해야함
  - 특징 : 고객이 느끼는 가치, 목표에 대한 선행지표, 제품/서비스 전략의 핵심 지표
  - 방향성 : 최적화된 가치와 방향성 제시
  - 가치 창출을 전사 / 조직 결과를 보여줌
  - 북극성 지표 : 전 직원을 목표에 집중 시킴
  - 상반된 목표에 집충, 중복으로 일하는 것을 방법

5. 결론 도출

  [1] 결과 : 구체적인 데이터의 결론. 분석을 통한 결과물
  [2] 결론 : 분석화된 데이터를 끌어낸 통찰과 의미 (해설과 추론, 권고 사항)

=> 대게 결론에 대해서 내야하지만, 결과에 대해서 잘 얘기할 필요가 있음


이번주의 WIL과 함께 작성하면서 생각을 정리한다.

이번주 직무 스터디 / 코딩 기초 발제 와 관련해서 KDT 에 대해서 좀 작성도 하고 나도 내 스스로 좀 반성할 점을 정리하고 싶어졌다.

Keep : 목표를 세워서 데일리 스크럼 작성 / TIL 은 8시 부터 정리하면서 있기
Problem : 이번에 스스로 많이 커뮤니케이션을 잘 안됐다고 느꼈다. 많이 속상했다. 콧물도 나고, 찔찔 짜가지고....
사실 사람을 보기에 너무 부끄러움도 많아서 다른 분들 보는게 어려웠다. 그래서 그런 점을 고치고 싶다.
Try : 개인 공부를 하면서 손들고 커뮤니케이션을 하는 방법에 대해서 논의

WIL 이번주는 CASE WHEN을 활용한 코딩을 사용헀다. DATE DIFF 도 포함해서. 근데 코드가 너무 어려웠다...! ㅜㅜ

select user_id,a.buyer,a.in_cart,a.remove,a.viewer,ROUND((a.remove/a.in_cart) * 100, 2) as rate
FROM
(
SELECT user_id,
COUNT(DISTINCT CASE WHEN EVENT_TYPE = 'purchase' THEN event_time END) AS buyer,
COUNT(DISTINCT CASE WHEN EVENT_TYPE = 'view' THEN event_time END) AS viewer,
COUNT(DISTINCT CASE WHEN EVENT_TYPE = 'cart' THEN event_time END) AS in_cart,
COUNT(DISTINCT CASE WHEN Event_type = 'remove_from_cart' THEN event_time END) AS remove 
FROM quest.2019_dec
GROUP BY user_id
ORDER BY user_id
) a
HAVING rate > 0
ORDER BY user_id desc

우이씨..... 이게 알고보니까 구매 포기율은  제거 / 카트에 담은 수 이렇게 라고 한다.

이게 CASE WHEN 의 경우에는 다중 개별 칼럼의 경우에는 그래도 된다고 했다.주말에 일단 SQLD 관련해서 넣어야겠다..
이번에 코드는 짰는데 그 코드를 짜서 잘 못해서 더 중요하게 다른 이 커머스를 넣지 못했다. 그래서 아쉽다....

myo