본문 바로가기

Tableau/태블로 대시보드

[태블로 1] Sample_Store 데이터를 통한 Insight 도출

반응형

안녕하세요 

정말 오랜만 입니다!

이전 게시물을 올릴때까지만 해도 안드로이드와 ios의 꿈나무 였는데..

저의 길이 아닌것 같아 데이터 분석 분야로 진로를 전향했습니다

하지만 아직 버리기는 아쉬운 저만의 아이디어가 있는데요...

그래서 flutter라는 귀여운 아이와 함께 모바일계의 두 산맥을 때려잡고자 배우고 있습니다

 

 

다시 본론으로 돌아와서

오늘 게시물은 제가 tableau를 통해 시각화를 한 결과를 공유 하고자 합니다.

저도 이번 프로젝트(?)가 처음 만든것이라 부족한 부분이 많지만 Insight 공유차 소개 하겠습니다.

 

 

다들 sample_store_data 아시죠?(태블로 기본 내장 데이터)

저는 처음에 이 데이터를 보고 어떠한 인사이트를 도출하라는것인지 도저히 감이 안잡혔습니다.

특히 데이터를 접한고 다음날이 되서야 두개의 시트(Person, Refund)를 발견했는데요

시트1과 다르게 Column 한개만 있어서 총 3개의 시트가 서로 관련이 있는것인지 없는것인지 고민했었습니다.

 

생각의 과정

- 기본적으로 sample_store_data는 e-커머스 기업이라고 가정    <---중요!!
-Why?
    - 데이터의 대부분이 고객주문 관련정보(Customer, CustomerID, Name, Category..etc)이다
    - 물류와 배송기간 그리고 환불 데이터 有

- 기업이라면 수익 최대한 증가 必
- 수익 창출 VS 환불률 감소

 

제공된 데이터가 기업의 데이터라면 기업의 가장 첫 번째 목표는 "수익 증대"라는 생각을 했습니다.

이후 수익증가를 위해 어떠한 선택을 할 것인가 고민을 했고

제공된 환불 데이터를 가지고 "환불을 감소 시킬수있는 방법이 있지 않을까?"라는 의문을 가지며 접근했습니다.

 

- 국가별 환불율-

중국과 호주의 환불율은 약 전체의 50%를 차지한다 (주황색)

첫번째로 국가별 환불율 행,열에 배치하여 국가별로 환불율이 얼마인지 알아봤습니다.

이때 중국과 호주에서 다른 나라에 비해 환불율이 월등히 높다는것을 발견했습니다.

 

-상위 30명 환불 고객 국가 분석-

상위 30명환불 고객&amp;amp;amp;amp;amp;amp;nbsp; &amp;amp;amp;amp;amp;amp;nbsp;(SUB) Top 30 Refund Customers

 한불을 많이 한 고객들중 상위 30명의 국가를 조사했습니다

 

 이유

지도를 기반으로 한 환불율의 논리적 비약때문인데요

 

만약 중국에서 어떤 한 사람이 대량의 환불을 했다고 가정했을때

지도만을 기반한 환불 수치는 중국에서 환불율이 많다는 정보를 표시할수있습니다.

하지만 제가 얻고 싶은 정보는 어느 국가에서 환불율이 높은가(환불하는 사람이 많은가?)인데

만약 한 사람만 많이 한것이라면 그것은 다수의 환불율을 표시한것이 아닌

단순히 그 고객만의 수치를 나타낸것이였던것이죠

즉 대량 환불한 사람들에의한 "잘못된 일반화"가 발생합니다

 

이러한 이유로 저는 "환불하는 사람들중 중국과 호주의 사람들이 정말 많은가?"를 확인하기위해

상위 30명의 고객을 시각화 했습니다.

 

결과는 실제로 중국과 호주 고객들의 대부분이 환불을 많이 하고있었습니다

따라서 실제로 위 두나라에서 환불 고객이 많다는것을 확인했습니다.

 

그렇다면 환불이 왜 이 특정 두나라에서 많이 발생한 것일까?

 

- 년도별 환불율-

 

<이유 >

환불율 감소는 어느 기업이든 관심을 가질수밖에 없는 솔루션입니다.

하지만 만약 환불율이 점차 개선 되고있다면???

즉 저는 위 지표를 통해 우리기업이 지금 당장 해야할일인지 아닌지를 판단하는데 도움을 주고 싶었습니다.

 

IF

환불율이 감소 추세라면 일단 참고만 하고 지켜본후 다른 수익성 증대 방법에 투자해야 하는것이고

환불율이 증가 추세라면 이는 반드시 지금 개선 되어야할 시급한 문제 이기 때문입니다.

보시다시피 sampleStoreData에서는 중국에서 환불율이 증가하고 있습니다.

정말 정말! 예산이 부족하거나 시간이 없다면 중국부터 환불율을 줄이는게 좋을것 같습니다.

 

 

-배송등급별 환불율-

배송등급별 환불율

 

 

"왜 환불율이 발생하는것일까?"

저는 배송 등급별에 대한 문제가 있지 않을까?라는 생각을 했습니다

 

개인적으로 인터넷 쇼핑을 하는경우가 종종있는데 대부분 예상시간에 왔지만(1~2일)

정말 딱한번 2주동안 안와서

그냥 환불해달라고 했었던 기억이 있었습니다.

이러한 제 경험을 바탕으로 배송등급이 낮다면 환불이 높을것이라는 가정을 하고 시각화를 했습니다.

 

예상대로(?) 배송등급이 낮아질수록 환불율이 높았고 추가적으로 주황색 색상으로 환불율에 국가의 색상을 표시했는데요

(주황색 색상은 중국과 호주를 나타냅니다)

중국과 호주에서 절반이상의 환불을 차지했습니다.

 

종합해보면

 

"중국과 호주에서 환불 고객이 많다"

"중국에서 최근 환불율이 상승중이다"

"배송형태가 낮을수록 환불을 많이 하는 경향이 있다"

 

 

 

So... What Can We Do?

 

 데이터를 통한 문제점으로부터  대안을 제시했습니다.

 

 

첫번째 "환불 처리후 서비스 향상 유지 혹은 개선"

 

의류제품 구매에서의 반품행동유형연구 -지혜경- https://www.koreascience.or.kr/article/JAKO200923659446810.pdf

 

 

논문에 따르면 온라인 쇼핑 구매시 고객들은 상품의 만족도 여부보다

"후 처리" 즉 반품완료 처리까지의 서비스, 처리시간이 재구매에 영향을 끼친다고합니다.

 

예를들어 "쿠팡"에서 제가  삼성 노트북을 샀고 제품 불만족으로 반품을 한다고 가정해보겠습니다.

이때 저는 아마도 "삼성" 노트북에(디자인 성능 등등) 대한 불만족이지 "쿠팡"에 대한 불만을 갖지 않았을겁니다

(배송중 파손 사항 제외) 이유는 쿠팡은 단순히 최저가의 제품을 배송해주는 "매체"일뿐이기 때문입니다.

그런데 이때 환불이 제대로 이루워지지 않는다면 저의 불만은 "삼성"이 아닌 "쿠팡"으로 변할것입니다.

위 논문은 이러한 결과를 말하고있습니다.

따라서 제품 생산이 아닌 일종의 "매체"인 우리 기업은 환불율이 많은 특정국가(중국과 호주)에서

환불을 얼마나 잘 처리가 되고있는지 확인해서 개선해야 합니다.

(배송 전문 기업이라 가정했기때문)

그래야 고객들의 재방문율이 늘기 때문이죠

 

 

 

두번째 "중국과 호주의 물류창고 위치 파악"

 

두번째 제안은 조금 더 원론적인것에 집중했습니다.

바로 물류창고의 위치인데요

조사 결과 표준 배송등급에서 평균 배송일이 4~8일이였습니다.

아무리 낮은 배송등급이라도 7,8일은 너무 오래걸리는데요

왜 우리 기업은 이렇게 배송을 할 수밖에 없을까요?

다른 나라에 비해 중국과 호주는 굉장히 땅이 넓은데 이동시간이 길어서 있지 않을까?라는 추측을 할 수있었습니다.

(가정한 상태이기 때문에 실제 물류 창고의 위치가 어디에 있는지 모릅니다^^)

만약 물류창고가 배송건이 많은 지역에 없다면 그 주변에 세우는것이 좋다고 판단했습니다.

 

 

 

세번째 "추가 데이터 확보"

 

사실 환불이 100% 배송등급에 따라서 이루워진다고 확실할 수없습니다.

따라서 앞으로 고객들에게 환불 사유에 대해 포인트 지급등을 통해 구체적으로 적게 하고

그러한 데이터를 모아서 refund_data에 추가 할 필요가 있습니다.

 

 

 최종 DashBoard

 

Amazon

UI

저는 국제 배송을 하는 기업이라고 가정하자 마자 Amazon을 생각했습니다.

사실 이것을 만들면서 어떻게 UI를 작업해야 할지 고민을 굉장히 많이 했습니다.

그런데 Tableau Public에서 Amazon을 검색 해보니 

너무 예쁜 디자인들이 많았습니다.하지만 만들 실력은 안돼서...

"색상이라도 맞추자...."라는생각으로 만들었습니다

혹시 이 글을 보시는 분이 저와 같은 태린이라면

Tableau Public에서 관심 주제에 대해 검색 해보시는것도 좋은것 같습니다.

 

 

마무리

 

앞서 말했듯이 데이터에서 문제점을 찾기위해 매일 생각하면서

여러 가정을 했었는데요

이 생각의 시간들이 합쳐진 가정은

"내 가정이 맞았으면 좋겠다", "이것은 이런결과가 나와줘야되는데"라는 생각과 동시에

" 더 많은 고민을 한 가정이라면 객관성을 잃을수도 있겠다"라는것을 느꼈습니다.

 

하지만 이 글을 쓰는 시점에 문득 

"결과가 예상대로 안나오면

또 다른 관점으로 시도를 해보는것이 이 분야의 매력이 아닐까"라는 생각이 드네요...

(데이터 분석 10년차인것 처럼 써서 죄송합니다ㅠ)

 

아무튼!!

이번 대시보드는 저에게 첫 태블로 입문이자 처음 데이터분석의 맛을 보게 해준 프로젝트였습니다.

그리고 정말 들어가고 싶었던 동아리에도 들어갈수있게 해준 대시보드이고요 ^^

찾아보면 제 분석도 많은 논리적 비약이나 문제점들이 있을텐데요

그런부분이 있다면 언제든지 댓글 달아주시면 좋겠습니다.

 

 

 

감사합니다!!

 

 

 

 

반응형