09. 데이터 분석에 기반한 서비스 기획(2)
4. 다양한 데이터 분석 도구들
1) 초급
1-1) GA(Google Analytics)
- 종류: Google에서 제공하는 웹 분석 서비스이다. 사용자를 로그 기반으로 트래킹하여 보기 쉬운 형태로 제공해주는 분석 도구.
- 장점: 무료로 제공되는 툴이며, 초기 스타트업이 주로 사용. 웹 트래픽과 사용자 행동을 쉽게 트래킹하고 분석할 수 있다.
- 단점: 웹 분석을 기반으로 하기 때문에, 앱 분석에는 한계가 있다. 따라서, 초반에는 GA 툴을 활용하고, 이후에는 다른 데이터 시스템으로 디테일화하는 것이 좋다.
1-2) Excel
- 종류: 상용화된 툴로, RAW 데이터를 따로 추출해서 엑셀에 넣고, 피벗 테이블과 피벗 차트를 활용하면 다양한 기준에 따른 데이터 분석이 가능.
- 장점: 누구나 쉽게 사용할 수 있으며, 데이터를 쉽게 시각화할 수 있는 것이 큰 장점. 이를 통해 데이터를 이해하고 결론을 도출하는 데 효과적인 도구.
- 단점: 실시간으로 데이터를 분석할 수 없다. 데이터가 확정되고 업데이트되기까지 대기해야 한다.
2) 중급
2-1) SQL(Structured Query Language)
- 종류: 데이터에 접근하는 가장 기본적인 도구. SQL은 데이터베이스에서 정보를 검색, 추가, 수정, 삭제하는 데 사용되는 표준 프로그래밍 언어.
- 특징: 진입장벽이 낮아 데이터 분석가 외에도 마케터, PM, PO 등이 두루 사용하고 있다. 간단한 용어로 데이터 분석을 할 수 있다.
2-2) Amplitude / Mixpanel
- 종류: 이벤트 로그 기반의 프로덕트 데이터 분석 도구. 사용자 행동을 트래킹하고 분석하여 프로덕트 개선에 활용할 수 있다.
- 장점: 다양한 분석 도구를 제공하여 데이터 분석가 없이도 유의미한 프로덕트 인사이트 확보가 가능. 기획자와 마케터에게도 유용하게 사용할 수 있다. 무료와 유료 시스템을 제공.
- 단점: 다른 도구에 비해 초기 비용이 높다. 초기 서비스나 제품에 대해서 개발자와 논의가 필요.
2-3) Tableau(태블로)
- 종류: 다양한 시각화 차트를 제공하는 BI 도구.
- 특징: 데이터 분석 결과를 시각적으로 표현하여 업무 보고나 사내 커뮤니케이션에 활용하기 좋다. 주로 데이터 분석가 중심으로 분석이 진행.
3) 고급
3-1) R
- 종류: '오픈 소스 통계 데이터 마이닝' 언어로서, 데이터 시각화 및 분석에 특화된 프로그래밍 언어.
- 장점: 코드를 통해 엄청 깊은 부분까지 분석이 가능. 통계 분석, 데이터 마이닝, 머신러닝 등에 많이 이용.
- 단점: GUI(Graphical User Interface)가 제공되지 않아 진입장벽이 높다. 사용자는 명령어를 통해 직접 프로그래밍해야 한다.
3-2) Python
- 종류: 데이터 사이언스나 직접 서비스를 개발할 때 사용하는 언어. 그 외에도, 다양한 용도로 사용할 수 있다.
- 장점: 직관적인 문법으로 학습이 용이하며, JAVA, C, C+ 보다 쉽다. 데이터 분석 뿐만 아니라 웹 개발, 시스템 스크립팅 등 다양하게 활용 가능.
- 단점: GUI가 제공되지 않아 진입장벽이 높다. 또한, 시각화 능력이 R에 비해 다소 약하다. 하지만 다양한 라이브러리를 통해 시각화 능력을 보완할 수 있다.
2. Amplitude 활용한 데이터 분석 (Amplitude 란?)
1) 정의
- Amplitude는 사용자들이 수행한 '이벤트'를 바탕으로, 이벤트 + 이벤트 속성값 + 사용자 속성값 등을 통합적으로 수집하여 사용자 행동을 분석할 수 있는 분석도구.
- 데이터 분석방법, 어떠한 각도로 분석할지에 대한 시각을 열어주므로 필요하다.
2) 사용 사례
- 다양한 스타트업들이 엠플리튜드를 프로덕트 분석에 활용하고 있다. 예를 들면, 마켓컬리, 지그재그, 오늘의집, 뤼이드 등이 있다.
3) 이벤트와 속성값
- 이벤트: 유저의 행동이나 유저가 특정 행동을 한 사건.
- 이벤트 속성값: 특정 행위에 관련된 값.
- 유저 속성값: 해당 이벤트를 발생시킨 유저에 관한 값.
4) 장점
- 파워풀한 분석을 기획자, 디자이너, 사업개발 등 다양한 부서 사람들이 쉽게 활용할 수 있다.
- 대용량 데이터를 활용하면서도 분석속도가 매우 빠르고 신뢰도 있는 분석결과를 보여준다.
- 시각화를 쉽게 할 수 있고, 관리용 대시보드 보고용 노트북을 쉽게 제작할 수 있다.
- 무료기능으로도 충분히 파워풀한 분석이 가능.
5) 단점
- 코호트(그룹핑) 등 유료기능을 사용하기 위해서는 연간 약 3,000만원의 비용이 발생.
- 유저행동들에 대한 이벤트를 남기기 위해 초기 셋팅하는데 많은 리소스가 필요.
6) Amplitude v.s. GA
1) 커스터마이징 가능성
- Amplitude: 각 프로덕트에 맞춰서 커스터마이징이 가능하다.
- GA: 제공하는 한에서만 사용가능하며, 커스터마이징이 불가능하다.
2) 분석 범위
- Amplitude: 앱과 웹 모두 분석이 가능하다.
- GA: 웹사이트 관리에 특화되어 있다.
3) 사용자 친화성
- Amplitude: 사용자 친화적이며, 모든 기능에 tool tip이 제공되어 쉽게 배울 수 있다.
- GA: Amplitude에 비해 사용자 친화성이 낮을 수 있다.
4) 협업 도구
- Amplitude: 팀원들과 협업할 수 있는 다양한 도구를 제공한다. 예를 들면, Dashboard, Notebook 등이 있다.
- GA: Amplitude에 비해 협업 도구가 제한적일 수 있다.
21. SQL을 가장 빠르게 학습하는 방법
1) SQL과 데이터 분석
- SQL(Structured Query Language)은 데이터베이스에 질문을 하는 언어.
- 문법이 명확해야 올바른 데이터를 제공받을 수 있다.
- SQL은 비교적 간단한 문법과 단어로 구성되어 있어 쉽게 배울 수 있다.
2) SQL의 문법
- SQL 문법은 데이터 베이스 관리 시스템(DBMS) 제공사에 따라 약간씩 차이가 있지만, 핵심적인 부분은 대동소이 하다.
- 대표적인 SQL에는 Oracle SQL, My SQL, Postgre SQL 등..
3) SQL 대표 구문
- SELECT: 데이터를 읽어오는 구문
- INSERT: 데이터를 삽입하는 구문
- UPDATE: 데이터를 수정하는 구문
- DELETE: 데이터를 삭제하는 구문
- DROP: 데이터테이블을 제거하는 구문
4) 데이터 베이스의 구조
- 데이터 베이스는 '표 형식'으로 데이터를 저장하며, 이 표를 '테이블'이라고 부른다.
- 데이터별로 테이블을 구분하여 저장.
5) SQL을 활용한 데이터 분석 방법
- 하나의 자료를 빠르게 훑어보고, 많은 쿼리를 작성해보는 것이 중요.
- 정확한 문법을 외우는 것보다, 문법을 적용하고 수정하는 능력이 중요.
- 기존에 작성된 쿼리를 활용하고, 스스로의 궁금증을 해결하는 쿼리문을 작성하는 것이 효과적.
6) SQL 연습 사이트
- [W3Schools](https://www.w3schools.com/sql/exercise.asp)
- [HackerRank](https://www.hackerrank.com/domains/sql)
- [Programmers](https://school.programmers.co.kr/learn/challenges?tab=sql_practice_kit)
7) SQL 예시
- 예시1: 27살 회원의 이름과 성별 데이터를 가져오는 쿼리
SELECT name, gender FROM member WHERE age=27
- 예시2: 성별에 따른 회원 수를 가져오는 쿼리
SELECT gender, count(name) FROM member GROUP BY gender
'PM(Product Manager) > 학습일지 3주차' 카테고리의 다른 글
4 day 2024.01.18. (0) | 2024.01.18 |
---|---|
3 day 2024.01.17. (0) | 2024.01.17 |
2 day 2024.01.16. (0) | 2024.01.16 |
1 day 2024.01.15. (1) | 2024.01.16 |