데이터분석 3

데이터 엔지니어링 공부를 시작해야겠다

Inflearn을 통해 수강하던 머신러닝 기초 강의 수강을 끝냈다. 전체 시간은 15시간이지만, 공부에 대한 몰입 부족 및 이해 부족 등으로 생각보다 시간이 소요됐다. 크게 분류 모형, 회귀 모형, 군집 모형을 기준으로 머신러닝을 돌려보는 방법에 대해서 배운 것 같다. 이걸 이제 회사 업무에 적용해보고 유의미한 것들은 리포팅이나 공개적으로 적용해봐야겠다. 머신러닝을 배우면서 왜 모든 데이터 작업에서 전처리 단계까지가 중요하다고 하는지 실감할 수 있었다. 우선 제대로 된 데이터를 확보하는 것도 중요하다. 아티클을 찾아보면 데이터 사이언티스트들이 우스갯소리로 "회사에서 데이터 분석을 하려고 시도하면, '사용할 수 없는 데이터만 존재'하거나 '데이터가 없을 것'이다"라고 말한다. 처음에 전문가들의 허세인가 생..

잡상들 2023.01.15

2022년 회고 (2) - 데이터 분석가로 직무 전환하면서

목차 1. 데이터 분석가로 직무 전환하기 2. 데이터 분석가의 일 (1) - 대시보드 제작하기 3. 데이터 분석가의 일 (2) - 가설검증, 리서치 데이터 분석가로 직무 전환하기 2022년 3월에는 비즈니스 분석가로 이직했다. 식품 B2C 스타트업 회사의 물류기획에서, IT B2B 중견기업 데이터 분석가로 이직했다. 그렇기에 주변에서 어떻게 이직할 수 있었냐는 질문을 자주 받았다. 아마 업종, 비즈니스 형태, 규모가 다른 회사에 직무까지 다르게 가서 그런 것 같다. 이직을 준비하면서 느낀 점은 데이터 분석가 직무는 Fit이 되게 중요한 것 같다. 회사에 따라 선호하는 유형의 인재가 조금씩 다르다. 분석가에게 Airflow 작업 등 엔지니어링 경험을 더 기대하는 회사도 있고, 반대로 비즈니스의 의사결정 지..

잡상들/회고 2022.12.26

SQL을 활용한 코호트 분석Cohort Analysis

SQL을 활용한 Cohort 분석 방법에 대해 정리한 글입니다. Cohort 분석이란? Cohort 분석은 흔히 '동질집단분석'으로 알려져 있습니다. 특정 기간에 같은 특성이나 경험을 공유하는 그룹을 나누어 분석하는 행동 분석 방법의 하나입니다. 쿠팡에서 발표한 Cohort 자료를 예로 들어보겠습니다. 2019년에 가입한 고객들의 거래액은 가입한 2019년과 비교할 때 2020년에 2.19배로 증가했습니다. 2019년에 100만원어치 구매를 한 고객들이 2020년에 219만원어치 구매를 했다고 볼 수 있습니다. 쿠팡에 대한 신뢰도가 높아지면서 객단가가 높은 상품을 구매했거나, 또는 다른 채널에서 구매하던 상품도 쿠팡을 통해서 구매하는 등 긍정적인 변화가 있음을 알 수 있습니다. 또한 거래액이 2배, 3배..