잡상들/일상회고

2022년 회고 (2) - 데이터 분석가로 직무 전환하면서

KmkmKim 2022. 12. 26. 11:02
목차
1. 데이터 분석가로 직무 전환하기
2. 데이터 분석가의 일 (1) - 대시보드 제작하기
3. 데이터 분석가의 일 (2) - 가설검증, 리서치

 

데이터 분석가로 직무 전환하기

 

2022년 3월에는 비즈니스 분석가로 이직했다.

 

식품 B2C 스타트업 회사의 물류기획에서, IT B2B 중견기업 데이터 분석가로 이직했다. 그렇기에 주변에서 어떻게 이직할 수 있었냐는 질문을 자주 받았다. 아마 업종, 비즈니스 형태, 규모가 다른 회사에 직무까지 다르게 가서 그런 것 같다.

 

이직을 준비하면서 느낀 점은 데이터 분석가 직무는 Fit이 되게 중요한 것 같다. 회사에 따라 선호하는 유형의 인재가 조금씩 다르다. 분석가에게 Airflow 작업 등 엔지니어링 경험을 더 기대하는 회사도 있고, 반대로 비즈니스의 의사결정 지원 측면에서 비즈니스 전략 관련 실무 경험을 더 선호하는 회사도 있다. 채용 공고를 보면 느낌이 오는데, 내가 지원한 회사는 후자에 가까웠다. 그렇기에 Fit이 맞았던 것 같다. 

 

그리고 SQL 실력에 자신감이 있었다. 당시에 Google Bigquery 가이드 문서 하나와 함께 밑바닥부터 SQL을 시작했다. 물론 회사에 데이터 사이언티스트가 계셨지만, 박사까지 공부하신 분께 쿼리를 묻는 것은 지나친 비효율이었다. 그래서 물류팀에서 데이터를 활용하는 경우 모두 내가 처리했다. SQL도 하나의 언어이기 때문에, 자주 사용하다보니 익숙해졌고 숙달할 수 있었다. 이처럼 SQL과 이전에 경험한 비즈니스 실무경험을 최대한 어필하면서 면접을 진행했고 운좋게 통과할 수 있었다.

 

3월에 입사한 직후, 이런저런 온보딩 프로세스를 밟고 일을 시작했다.

 

규모가 큰 IT업종 기업이었지만, 본부 내 데이터를 활용하는 정도는 비교적 초기 단계였다. 새로오신 본부장님과 우리 팀장님의 주도로 조직 내 데이터를 활용하게 하려는 시도가 진행되고 있었다. 그렇기에 내가 입사해서 가장 많이 진행한 작업 중 하나는 Grafana를 활용해서 대시보드를 제작하는 것이었다. 구성원들이 사업 지표를 가시적으로 볼 수 있게 만드는 단계가 가장 기초적이고 중요했기 때문이다.

 


대시보드 제작하기​

대시보드 제작은 남들에게는 간단해보이지만, 생각보다 공수가 많이 드는 작업 중 하나다. 대부분의 사람들은 엑셀이나 파워포인트로 만들던 그런 과정을 떠올리며, '너네는 전문가니까 더 빨리해야지'를 기대한다. 다만, 현실은 그렇지가 않다.

 

대부분의 작업은 필요한 부서나 의사결정자의 요청으로 시작된다. 이 때 지표와 개념에 대한 정의를 하는 것부터 적지 않은 시간이 소요된다. 예를 들어보면, '전환율'을 시계열로 표기하고 싶다라는 요청이 온다. 물론 일을 하면 눈치로 처리할 수 있지만, 그래도 꼭 확인이 필요하다. 퍼널 기준 최초 단계 대비 전환율이 필요한 것인지, 퍼널 기준 직전 단계 대비 전환율이 필요한지, 혹은 둘다 필요한지 확인하게 된다.

 

요청사항을 받은 이후에는 데이터 점검을 진행한다.​ 이미 적재되고 있는 데이터라면 어떤 형태로 적재되고 있는지 확인하게 된다. 만약 적재되지 않는 상황이라면, 담당 개발자를 찾아서 요청하게 된다. 이 때 데이터가 이상한 형태로 적재되고 있으면, 다시 요청자와 논의를 하게 된다. 데이터가 이런 형태로 쌓이고 있다보니, 새로 적재하거나 혹은 이런 형태로 제공하는 것이 가능한데 괜찮겠냐 등 논의를 진행한다.

 

논의가 끝나면, 어디에 작업할지를 결정하게 된다. 해당 차트를 배치할 대시보드를 따로 생성하는 것이 좋을지, 혹은 기존의 대시보드에 차트를 추가하는 것이 좋을지 등 판을 결정하게 된다. 하나의 대시보드에 모든 차트를 다 밀어넣으면 대시보드가 무거워진다. 차트마다 돌아가는 쿼리가 많아져서 무거워지고, 동시에 사용자가 모이면서 부하가 걸린다. 그렇기에 차트끼리 그룹핑을 잘해서 대시보드를 생성하는 것이 필요하다.

 

작업할 공간에 대한 결정이 끝나면, 본격적으로 차트를 생성한다. 이 때 고려하는 것은 시각화에 대한 부분이다. 복잡성과 간결성 사이에서의 줄다리기다. 최대한 많은 데이터를 볼 수 있게 만드는 것과 최대한 간결하게 만들어서 핵심을 잘 전달하는 것 사이의 줄다리기다. 이를 위해서는 실무자가 어떤 지표가 중요한지 등을 정확히 이해하고 있어야 한다.

 

요청사항부터 차트 생성까지 끝나면, 담당자에게 대시보드를 공유하고 피드백을 받게 된다. 피드백을 받은 이후에 원하는 형태로 수정보완을 마치면 최초 제작은 완성되게 된다. 이후에는 대시보드의 사용현황을 보면서, 잘 사용되는지를 확인한다.

ⓒ Grafana


업무에 대해 회고해보자면, 우선 정말 빡세게 제작하는 과정에서 쿼리 실력이 더욱 향상되었다. 물류기획으로 쿼리를 짤 떄는 원하는 결과물을 빠르게 만드는 수준이었다면, 지금은 쿼리의 성능에 대해서도 고민하고 짤 수 있는 수준으로 성장한 것 같다. 또한 대시보드 제작이 프로덕트 매니저에게 필요한 역량을 쌓는 것에도 도움이 되었다. 정보 전달을 용이하기 위해서 어떻게 시각화를 해야할지 고민하고 했던 과정들이 되게 값진 시간이었던 것 같다.

 

아쉬운 점은 초기에 대시보드에 대한 사전기획이 부족했기에 종종 다시 작업해야 하는 경우들이 있었다. 예를 들면, 같은 지표의 대시보드라도 운영팀이냐 기획팀이냐에 따라서 보는 관점이 조금씩 달라졌다. 이 때 차트를 새로 만들어서 부하를 주는 방식보다는 필터 등 다른 방식에 대한 가이드를 제공하면서, 사용성도 높고 DB 부하도 줄일 수 있는 형태로 제작할 수 있었을 것 같다. 그래서 연말에 여유가 생겼을 때 열심히 개편하면서 쿼리 성능과 함께 대시보드 성능도 개편하는 작업을 진행했다.

 

모니터링에 대한 비효율을 개선하지 못했다. 비즈니스 분석가로 대시보드 제작도 담당하지만, 제작한 대시보드에 대한 모니터링도 직접 담당하고 있다. 아침마다 대시보드를 확인하면서, 특이사항을 확인하고 보고하는 작업을 하고 있는데, 이렇게 하는 것보다 더 효율적인 방법들이 분명 존재한다. 그래도 1년 가까이 모니터링을 하고 지표를 직접 보면서, 어떤 상황이 특이한 상황인지 보는 안목이 약간 길러진 것 같다. 이를 토대로 내년에는 최대한 모니터링과 리포팅 프로세스도 효율화 할 수 있도록 해봐야겠다.

 


데이터 분석과 가설검증, 그리고 리서치

 

대시보드를 제작하는 것 이외에는 데이터 분석 과제를 세우고 가설 검증을 진행하거나, 리서치 작업 등을 진행했다. 분석 과제를 잡고 가설 검증을 하는 단계에서 통계 공부의 필요성을 느꼈다. 대부분의 가설 검증은 어떤 결과값에 대하여 어떤 변수가 어느 정도 유의미하다를 논하는 것이다. 문제에 대해 가설을 세우고, Cohort, Funnel 등 분석을 진행하고 매월마다 지표에 대한 예측치를 산출하는 작업이 관련된 일이었다.


이를 설명하기 위해서는 통계 지식이 필요했다. 그래서 회귀분석, 베이지안 통계, 시계열 분석 등 다양한 통계와 관련된 영역을 공부했다. 주로 K-MOOC를 활용해서 강의를 듣거나, 유튜브에 특정 주제를 잘 설명해놓은 강의들이 많기 때문에 그런 것들을 참고해서 공부했다. 빠른 학습을 위해 교재는 한빛미디어에서 나온 책들을 주로 활용했다.


또한 외부 스터디나 행사를 활용하기도 했다. 마케팅은 본인들이 진행한 캠페인 사례들을 적극적으로 어필하는 경우가 많아서, 케이스를 찾아보기 쉽다. 반면 데이터의 경우, 내부 데이터를 공개할 수 없다보니 이런 케이스를 접할 수 있는 경우가 많지 않았다. 그래서 PAP(Product Analysis Playground)에서 이탈 분석 스터디를 진행하면서, 업계 사람들과 이야기를 나누고, 쏘카 데이터 서밋 행사에 참가하는 등 다양한 시도를 했고 많은 것을 배웠다. :)

 

리서치 작업은 주로 경쟁사들의 IR자료를 분석하거나, 트렌드에 대한 조사를 진행하는 것들이 많았다. 경쟁사들의 실적과 주요 비즈니스 액션에 대한 동향을 정리한다. 이런 업무들에 대한 비중은 이번에는 크게 높지 않았던 것 같다. 필요한 데이터를 적재하거나, 사업에 필요한 지표를 모니터링 할 수 있도록 만드는 대시보드 제작 작업 비중이 더 높았던 시기였기 때문이다.

 



데이터 분석 및 리서치 업무에 대한 회고를 해보자면, 긍정적인 부분은 통계와 재무를 공부하고 실무에 적용할 수 있는 기회였다. 대학교 때 회계도 배우고, 경영통계학도 수강했지만 생각보다 실무에서 사용할 일이 적었다. 이번에 그런 배운 것들을 적용할 기회가 있던 것이 유의미했다.

개선하고 싶은 점은 내년에는 조금 더 유의미한 분석들을 많이 해보고 싶다. 유의미한 분석이라 한다면, 쏘카에서 주유카드 오용을 방지하고 위해 연구했던 사례나 예약 테트리스처럼 발생할 수 있는 이익을 극대화 시킬 수 있는 방향으로 유의미한 분석들을 더 진행해보고 싶다. 또한 최근에 컨설팅 업계에서 진행하는 산업분석이나 기업분석을 위해 리서치하는 방식을 접하면서, 지금 내가 하는 방식에서 더 개선할 부분이 많다는 것을 느꼈다.

 

 


끝으로

 

이처럼 입사한 이후, 대시보드 제작, 데이터 분석과 가설검증 그리고 리서치 업무를 진행했다. 운이 좋게도(?), 내가 속한 팀장님이 Techfin 조직까지 맡게 되면서, 커머스뿐만 아니라 금융/결제 서비스를 담당하는 조직과 일할 기회도 있었다.

이런 업무를 통해 달성하고자 했던 목표는 조직의 의사결정의 질을 높이는 것이었다. 조직의 의사결정이 잘 이루어지려면 필요한 정보를 적시적소에 제공해야한다. DB와 인터넷에 쌓여있는 것은 자료(데이터)이지 정보가 아니기 때문에 이를 유의미한 정보로 만들어서 제공하기 위해 노력했다.

내년에는 관련한 리소스를 효율화하면서, 동시에 비즈니스 가치를 높일 수 있는 일들을 많이 해보고 싶다. 특히 지금 배우고 있는 머신러닝 등을 활용해서, 예측을 통해 대응할 수 있는 비즈니스 문제를 해결하는 일들에 기여해보고 싶다.

'잡상들 > 일상회고' 카테고리의 다른 글

2023년 2월 회고.  (4) 2023.02.26
2023년 1월 회고  (0) 2023.02.04
2022년 회고 (1) - 물류 사업개발/PO로 1년 5개월을 마무리하고  (1) 2022.12.23
22년 11월 회고  (0) 2022.12.04
22년 10월 회고  (2) 2022.11.01