본문 바로가기

경험노트

[D.CAMP] 데이터 분석 교실 - 알렉스앤컴퍼니 서하연, Numberworks 하용호 ga

ga


지원서를 넣었는데, 떨어졌었다. (관련 내용은 맨 밑에다가 기록해둘 것이다.)그런데 당일 수업날 추가 합격이 되어서 25만원을 디캠프에서 지원을 받고 수업에 나가는 혜택을 누린다.첫수업부터 굉장히 도움이 되었고 새로운 시각을 가질 수 있게 된 것 같다.데이터는 내 세계관에 변화를 주고 있다.앞으로 스타트업을 운영하는데 있어서 많은 도움이 될 것 같다.날짜마다 차곡차곡 정리해서 나갈 것이고, 그 날 깨달은점도 같이 기입해나갈 생각이다. 


[수료하고 난 뒤의 최종 분석]







5주에 걸쳐, 데이터 수업이 모두 끝이 났다.데이터의 신세계를 맛본 기분이였다.왜 데이터가 제일 중요할 수 밖에 없고 왜 기업은 데이터의 전략적 활용이 없으면 무너질 수 밖에 없는지 그 당위성을 확인한 5주의 시간이였다.


데이터가 너무나도 중요하다는 것을 이론적으로 알고 있었다.그래서 이 수업에 관심이 갔고 다음 같은 질문을 나는 머릿속에서 하며 수업에 참여했다. 1.실질적으로 데이터가 어떻게 사용되고 있는지 2.실무적인 프로세스들을 볼 때 왜 중요할 수 밖에 없는지 3.경영자의 입장에서는 데이터를 그렇다면 어떻게 활용해야되는지 4. 스타트업에 데이터 문화를 녹일려면 어떤 시각을 대표는 가지고 있어야 되는지 5.데이터의 총체적인 인사이트는 어떤 것인지 이렇게 크게 요약할 수 있겠다.


1.데이터가 생각보다 굉장히 복잡하게 사용되고 있을 것 같지만 점점 공부하면서 알게 됬지만 기본에 충실하면 고급 분석도 쉬워질 수 있다는 것을 알게 되었다.즉 기본이라는 것은 잘 기록하고 목적에 맞게끔 기본적인 프로세스들을 잘 셋팅하는 것 뿐이다.그리고 볼 때에는 항상 쪼개서 보는 습관을 들이는 것. 데이터의 목적은 바로 고객을 위한 가치를 만들어내는 것이다.그리고 그것은 종종 회사의 비전에까지 영향을 미치기도 한다


2.유저들마다 각각 세그먼트해서 타겟팅할 수 있다는 사실에 감동했다.이렇게나 세세하게 꼼꼼하게 그들을 포커스 할 수 있는 것은 데이터로 고객들의 흔적이 남기 때문에 가능하다고 생각했다.이것은 자원의 최적화다.(정확히 알고 자원을 투입할 수 있기 때문에)

스타트업이 성장하고 난 뒤에 데이터에 대한 문화,혹은 분석이 이루어져야됨을 시사하는 것이 아니라, 이미 스타트업 자체가 시작되면 곧바로 그런 데이터 같은 총체적인 비즈니스 행위들이 일어나야 한다는 것이다.그리고 데이터로 기록하지 않으면 누가 뭘 어떻게 하고 있는지가 절대 안잡힌다.즉 ... 사업을 감으로 운영하게 되는 것이다. 모든 것을 데이터화해야 한다.그래야 기록하고 분석할 수 있다.


3.난 수업을 듣기 전에는 이렇게 생각했다.스타트업 팀에 데이터 문화를 만들고 서로 의사소통을 데이터로 가능하게 하자.이것보다 더 중요한 게 있다. 어떤 데이터를 어떤 목적으로 볼 것인가? 하는 점이다.그것이 정해지면 모두가 이해가능한 가장 쉬운 숫자로 표현하고 데이터 분석가나 개발자만 이것을 하는게 아니라 데이터 분석을 할 줄 모르는 사람들도 데이터의 시각이 꽤나 있게 내가 만들어야 된다는 사실이다.즉 내가 만드는 스타트업의 사고체계는 근본적으로 data analyzing이 뒷받침되어야 한다.


4.우선, 경영자가 당연히 데이터에 대해서 잘 알고 있어야 한다고 생각이 든다.물론 깊은 수준의 까지 분석이나 그럴 필요가 없다.그러나 어떤 상황에서는 어떤 걸 봐야되고 어떤 의미있는 상황을 만들어내기 위해서는 어떤 식으로 데이터들이 조작되어야 하는지 알고 있어야 한다.그래서 이들을 바탕으로 데이터가 좀 더 조직내에서 쉽게 공유되고 확산될 수 있도록 리더가 그런 문화를 만들어줘야 하는 것이다.


5.데이터는 앞으로 더욱 더 그 중요성이 기하급수적으로 증가하게 될 것이다.데이터는 인간의 노동을 혁신적으로 줄여주고 있다.사고하는 방법을 바꾸고 있고 일하는 방식을 완전히 바꿔놓고 있다.현재 비즈니스에서는 이제 기업들의 데이터 싸움이 될 것이다라고 하는 것은 그냥 나온 말이 아니다.실제로 그렇다.데이터는 인간의 지식을 더욱 확장하고 직관에 더욱 객관성과 합리성을 불어놓고 있다.데이터는 모여 지식이되고 데이터 기반에 지식이 모여 지혜가 된다.그것을 강한 인사이트를 불러 일으킨다.데이터에 우리는 사활을 걸어야 한다.그리고 자동화할 수 있는 것은 모두 자동화해버린 다음에 남는 리소스는 더욱 더 중요한 일에 인간의 지능을 사용해야 한다.


마지막, 물음이 이제 생긴다. 그러면 이제는 어떻게 데이터를 활용해나갈 것인가?


나는 데이터 분석가가 아닌, 기획자 이면서 스타트업의 대표다.그러니까 앞으로 어떻게 데이터를 조금씩 공부해나갈 것이며 어떻게 데이터를 내 삶 자체로 문화'화'할 것인가가 고민과제다.데이터의 방법론들은 내가 기록한 것들을 참조하며 될 것이다.그러나 데이터의 why에 대한 고민은 조금 장기적인 어떤 전략이 필요한 것으로 판단이 된다.사실 결국 데이터를 판단하고 해석하는 힘은 사고력에서 나온다. 그러니까, 끊임없이 질문하고 원리를 파고들고 현상에 항상 본질적인 면을 보려는 연습이 필요하겠다.그렇다면 데이터를 바라보는 눈도 동시에 향상될 것이라고 믿는다.그리고 모든 것을 기록하고 거기서 해석하는 작업을 해야겠다. 이것은 블로그에서 내가 어느정도 실험하고 있는 부분이기도 하다.그러나 이제 점점 데이터도 쌓이고 있고, 또 블로그라는 매체에만 한정되어서 가는 것이 아닌, 점차 그 방법론도 어떤 데이터의 활용 방법도 계속 버전업 되어야 하는 것은 분명하다.그리고 항상 기억하자.두 번 이상 반복이 되고 패턴이 보이면, 그리고 그것이 계속 기록할 만한 가치가 있다면 이제 자동화하는 연습을 해야한다.아니면 거기서 rule를 추론해보고 그런 시스템을 만들 수 있는 생각을 해야한다.앞으로 데이터에 대해 끊임없이 공부해야겠다.


8월 5일 수요일 5주차 수업


[분석]

이날만 처음으로 사람들끼리 네트워킹을 했는데, 수업 듣는 사람들 중에 아무도 네트워킹을 하자는 말이 없었다고 했다.약 30명중.

그러나 딱 한명만이 네트워킹을 하는 자리를 마련하고, 서로 연결되서 정보들 공유와 아이디어를 섞는 계기가 되자 라는 건의를 했는데 그게 나라고 했다.

그래서 ,나는 이 날의 수업에서는 그런 '연결'에 대한 기억이 좀 강하게 남아있다.그래서 오프라인 밋업에서 사람들을 시스템으로 연결시키는 오프넥팅 이라는 서비스를 계속 생각하고 있다.이거는 시간을 두고 좀 구체화해 나갈 생각이다. 여기서 좀 더 확장적인 생각들을 했는데

earthy group 에서 earthy fashion이 우선 큰 프로젝트이고 그 밑에 semi 느낌으로

earthy offnecting 이 있다.그리고 earthy analyzing 까지. 좀 더 고민해봐야겠다.


우선 수업 내용 자체에 대해서는 크게 이런게 기억이 남았다.결국 인간은 데이터를 그들의 뇌를 최적화하고 지식을 확장,개선하는데 사용할 것이고 데이터는 늘 인간을 돕는 최고의 도구로 존재하게 될 것이라는 점이다.그에 따라 데이터의 중요성은 당연히 더욱 부각되겠고, 결국 누가 데이터를 잘하느냐가 결국 생존 우위가 될 것이라는 점이다. 약간 손정의 프리젠테이션 강의 일부 내용이 생각났다.

[ 인간이 집중할 것은 가치창조를 위한 창조와 상상력!! 자원의 선택과 집중에 대한 판단!! ]

지금 이 시대는 기술, 비즈니스모델, 시스템 이런 것들 하나에만 의존해서는 생존할 수 없는 시대다!

인류를 변화시키는 기술의 맥락을 이해하고,
광속으로 변화하는 기술에 따라 비즈니스모델을 적응시키고,
시스템에 의한 관리 이런거는 로봇 인공지능에게 줘버려야 한다!

인간이 집중할 것은 가치창조를 위한 창조와 상상력!! 자원의 선택과 집중에 대한 판단!!

기술과 비즈니스모델, 그리고 시스템을 넘어선 역사적 전환점을 느끼면서 길목을 차단할 기회를 찾아가야 한다!


인생을 살아갈 때, 내가 가진 강점이 무엇이고 약점이 무엇이고 나는 최종 목표가 무엇이고 내가 잘해야되고 잘하고 싶은 건 무엇이고 그런 것들을 생각하듯이 데이터도 완전 똑같다는 생각을 했다. 즉.. 데이터는 그냥 삶 그자체 였다.


그리고, 데이터는 협상의 도구가 된다는 사실. 실은 요즘에 협상에 대한 관심이 많다.나는 매일매일 협상을 연습하고 있다. 가격의 흥정을 할 때나 사람을 설득시킬 때.그럴 때마다 내가 느낀 협상의 제일 중요한 점은 감정을 흔드는 것이였다.그리고 여기서 어떤 객관적 자료를 가지고 접근하면 오 데이터가 되겠네 이런 생각을 하게된다. 감정+데이터 패키지를 들고 협상 테이블에 앉게 되면 최고의 협상을 할 수 있게 될 것이라는 생각이 든다.


끝.



[요약]

쿠퍼스컨설팅으로, 외국계 회사 있다가 KT 빅데이터 있다가

장사가 맞는 것 같애. 2014년. "쫄지마 창업 스쿨" 이거 들었었다.

굉장히 비즈니스적인 면에서 어떻게 빅데이터를,어떻게 빅데이를 난 활용했고


빅데이터 키워드는 거의 인도에서 점령 1~5등. 

6등 산호세

7등 서울


대한민국도 그 붐에 와중에 앞서있는 나라.

KT에서 많이 느낀 것: 우리나라에서 어떤 잘된 사례가 나타나면 글로벌 사례라고 봐도 그래서 무방할 것 같다. KT빅데이터 팀장.


근데 2014년 빅데이터 키워드가 갑자기 가트너 전망에서 왜 빠졌을까?

-> 빅데이터는 공기이기 때문이다.


빅데이터는 인간의 지적 노동을 대체해주는 스마트 혁명같은 것.

산업 혁명은 육체 노동의 대체. 마치 증기기관처럼 빅데이터도 도와줄 것이다 인간을.

남아도는 리소스를 또 다른데에 투자를 할 수 있다는 거다.


구글 번역 : 확률적으로 가장 (번역된 문서) 나은 거를 보여주는 것. 많으면 많을 수록 그래서 번역이 정확히 나오는 거다.


와... 포브스 들어가서 내러티브 사이언스 보면, 컴퓨터가 기사를 쓴다....

데이터를 활용한 컴퓨터가 기사를 쓴다...


수요 예측의 정확도를 어떻게 높일 것인가? 

구글이 어떤 짓을 할 수 있는지 알아보자.

개표하기 직전에 구글에 이명박 정동영 이회장 문국현... 막 쳤다.


구글의 검색결과 얼마나 나왔는지

실제 득표수와의 상관관계?

신뢰도 수치.0.9876 근데 무슨 조사기관보다 훨씬 정확도가 높았다.


이걸 박원순 시장, 나경원 붙었을 때, 

나경원 enter = 46.6 milion

박원순 enter = 54.8 milion


나:박 = 46.2 : 53.4     >>>> 최종결과.


빅데이터가 지적 노동을때 사람의 역할은 무엇이 되어야하나..?


human computer symbiosis = 사람과 컴퓨터의 공생을 생각해야된다.


                  기계의 영역

               =========     

직관->가설->검증

=========

인간의 영역

 

===========================> 인간은 직관을 통해 가설을 세우고 기계는(컴퓨터는) 모든 가능성의 것들을 돌려보면서 검증하는 것.


모든 것은 결국 가설을 잘 세워야 한다! 


 KT와 서울시의 심야버스 최적노선 분석 사례

CDR 데이터로. 


건대입구 지나가는 노선 수정을 보면, 

이전에는 행정 같은 업무들이 민원에 따라 (이거 해줘 vs 야 왜 저거 해줘 이거 그냥 해 )

이렇게 막 헷갈려하는데..데이터 기반이면 답이 딱 나온다는 것.


정부에서 빅데이터 예산 뭔 (미래부 ) 프로젝트를 해야되는데, 할게 없어서.. 우선 KT한테 말하고 그리고 서울시를 가봤다. 뭐 할거 잇는지. 그래서 KT는 이걸 했다. 

"내가 가지고 있는 데이터의 강점을 파악해야 한다."


너무나도 소중한 데이터 : 위치 데이터 (통화하면 그 자리에서 위치 뜰꺼니까)

서울 시민들이 어디있는지 알고 있어. 그러면 사람들의 위치를 알고 있는 것으로 뭔가 서울시에 도움이 되는 것이 없을까? 그래서 히트맵하고 해가지고 서울시 찾아갔다.

서울시 "올뺴미 버스 운영하려고 하는데.."


유동인구 원래 하둡 테이블에서 쫙쫙 하는데, 그냥 지도에 뿌려봐. 이랬다.


데이터가,내가 가지고 있는 데이터가 본질적인 힘이 뭔지를 파악하는 것이 중요하다.


멍 = 1.계란 2.찜질 3. 소고기 4.약


어떻게 베노플러스 연고(포지셔닝이 아주 모호)는 멍이라는 시장으로 포지셔닝하고 어떻게 계란을 이길 수 있을까? 


처음 가설 : 아기들이 멍이 들었을 때 엄마들이 살꺼다

근데, 사실 보니. 아이들보다 여자들이 더 멍을 ... 왜냐하면 성형때문에 멍이 많아.

아니면 비키니 때 멍. 이런 쪽으로 그래서 타게팅.


근데 소셜을 가지고 데이터에 대한 분석은 좀 사실 되게 답이 없다.

특히나 언급량... 이거는... 해봤자 다 아는거.


고객의 퍼소나에 대해서 많이 분석한다.소비자들을 분석하실 때 (매출 데이터, 구매 데이터 뭐 이런거 많이 보는데 ) 그런 상황에서 이런데서는 인사이트가 없어. 그래서 퍼소나에 대해서 정의를 내려야 되고 송길영 부사장은 머리에 자동으로 퍼소나가 있었던 거다.

인터뷰나 관찰을 통해 퍼소나를 정립한 뒤에 소셜을 분석하면 의미 있는 값을 도출할 수 있을 것 같다.


올레티비 우수고객 - > 20명 뽑아가지고 심층 인터뷰 1:1

"아 우리 올레티비 시청하는 고객은 휴식형,보상형,허세형,매니아형으로 나뉘는 걸 알게 되었다."


추천에서 가장 중요한 건 리텐션 또 여기서 제일 중요한 건 occation.


고객의 피소나를 정의하고 --> 로그를 분석하고 --> 솔루션.

그래서, 가설이 참 중요한 것 같다고 말한다.


코오롱 패션 의류 브랜드 사례.

ceo가 빅데이터 꽂힘. 25명 모아서 빅데이터 TF 구성. 뭐든 해바.

아웃도어의 수요예측이 굉장히 코오롱에서 중요한 문제.

회사 구석구석에 숨어있는 "다크 데이터"에 집중.


사람이 물건을 살 때 의식 프로세스


어 나 살래 -> 뭐가 예쁘지, 뭐 사지 -> 난 원래 이러니까 후보 -> BUY -> USE -> SHARE 


고객을 분석할 때 구매 데이터는 buy단계에서 발생. 그것만 분석하지말고 본인이 운영하는 플랫폼에서 고객이 어떤 프로세스를 거치느냐를 보고, 어디에서 뚝뚝 떨어지는 것을 find한 다음에 그것이 왜 그런 이유로 나타나고 있는지 증거를 확보해라.


-빅데이터 활용 사례-

Trend sensing


모든 유통의 핵심. 뭐가 요즘 뜨지..??

--> 이런 노동을 컴퓨터가 대신 해줄 수 있다면...............


트렌드가 생길때, 유행을 선도하는 집단이 있다.


네트워크 : 

스타형 (influnce - follower 근데 서로는 몰라) / 

big mouth는 없는데 커뮤니티형 / 

커뮤니티를 연결해주는 브릿지형 


2.5% 미친 또라이 이노베이터 , 13.5 얼리어답터  그리고 Chasm이 있고

early majortity 34%  그러니까 Chasm을 넘어야... 돈을 벌 수 있다.


뉴발런스 매니저 : 부천 날라리 여고생이 신은 거는 내년에 대박난다.

이런 얘들을 스니져(재채기 하는) 라고 부른다.그래서 스니져가 뭐 하나 냄새맡고 재채기 하는 지를 보고 그걸 판다.



2009년 하버드 H1N1 독감 확산 분석: 우정의 역설 

- "나보다 내 친구가 인기가 많다." 


랜덤으로 1300명 뽑고 랜덤 그룹 만들고 니 친구 소개해줘해서 또 다른 1300그룹 만들어

그리고 그 두개 그룹을 관찰해. 그리고 누가 H1N1 독감에 걸리는지 관찰해


--> 결론은... 유행을 이끄는 집단이 있다.개를 찾으면 된다.


소셜 네트웤 분석을 할려면.. 진짜 네트웤을 분석해야한다.

어떤 키워드가 어떤 순서로 확산되는지 보자.


트위터는 네트웤 분석이 되는데, 주제가 정치적인 것에 많이 취우쳐있다.

페이스북 네트웤 분석은 페이스북에서 발급하는 뭐 아이디를 받고 동의를 받은 상태에서

사람들 사이에 네트웤을 볼 수 있다고. 30만명 친구들을 보면 1200만명 걸칠 수 있다.


(모든 걸 자동화할려고 한다... 이렇게 되면 진짜 자동화오고... 자동화를 어떻게 설계하고 어떻게 해석하고 어디에 집중해야될지를 고민해야 된다.)


와.. 데이터는 협상의 도구도 되기도 함.

유통에서는 만약에, 620원단가까지는 되는데 640원이 되버리면 안되요!! 라고 협상을 할 수가 있다는 거임.유통은 10원도 엄청 중요.


1.최고의 비주얼과 최상의 맛을 제공하는 삼겹살의 두께는 몇 MM?


2.최단 시간 내 가장 깨끗하게 수행할 수 있는 호텔 객실 청소 프로세스는?

---------------------------------------------------------------------

여기 사람들끼리 네트워킹 하면서 느낀 점


1.패션테크 파면 이게 피봇팅 일어난다.. 졸라 파라 졸라 졸라 졸라 졸라 졸라 졸라 졸라 졸라


2.중국에는 스케일이 우선 크고, 돈은 많은데 투자할 데가 없어서.


3.여기 수업듣는 사람들.회사에 가서 사람들에게 설명해주기도.


4.데이터 25명중 , --> 나 혼자 연결을 생각!!

-> 하고 보니 엄청나게 반응이 좋았다.

오프넥팅 아이디어 발상.




7월 29일 수요일 4주차 수업


잊지 않고 다시 온다.

핵심->와서 많이 사고 간다.<-핵심


GA는 이것을 세팅하고 측정을 지원 >>


목표라고 가서, 이 목표칸에서 설정을 한다.이것들을 모아서 잘하나 못하나 판단.


목표 설정에 보면 뭐 주문하기,계정 만들기 클릭 하는게 있는데, 이거 클릭한다고 해서 되는건 아니다.처음부터 맞춤 버튼을 눌러서 목표를 정하는 것.


유형에 4개가 있다.


도착: 사이트 방문하는 숫자 그 자체,특정 페이지에 도달하는 것

시간:

세션당 페이지수/조회 화면수: 세션당 몇페이지 봣느냐

이벤트:페이스북 공유를 몇번 눌렀나


*시간으로 측정하는 회사가 있꼬, 세션당 몇페이지 봤냐


유입경로)

시작이 있고 우리가 원하는게 있다면, 서울에서 부산을 갈떄 뿅가는게 아니라, 뭐 대전 대구 뭐 갔다가 가겠지? 그래서 그 포인트 포인트 들을 카운트 할 수 있다. 여기에 유입경로에서 할 수 있다.

 

 시작 ---------------------유입경로--------------------도촥

                      (step,step,step.....) 


유입경로 : 도착지까지 갈때 들리게 될 여정들을 같이 본다.

            시험에서도 중요한게 점수가 아니라 오답노트.



같음 : /menu/all.php  딱 정확히 매칠될 때 카운트!


근데 문제... 링크타고 들어가면 / / all.php?page=2 막 체크가 안됨.

그래서 


시작값: 앞에서 적어준 부분까지 맞다면 ok

/munu/all.php로 설정하면


/munu/all.php?page=3 이든 /munu/all.php?user_id 다 같게 본다는 것.



정규식

(초급사용)

찾기 기능이라고 보면 된다.


all 이라고 지정해두면

http://www.chdkl.com/menu/all.php 이거면 카운팅.


(중급 사용)  이게 중요한 것!!!!


   이따금 URL 두개다가 목표가 될 수 있다.OR조건은  pipe ㅣ 문자를 쓴다.

      orderend.htmlorder_complete.html 


 이런 헷갈리는 부분이 있찌

abbㅣcc 있을때, a bb or cc 인지 abb or cc 인지 헷갈리지?

그러면 괄호로 묶어주면되. bb or cc 엿다면 a(bbㅣcc)


*예1) 웹과 모바일의 결제 페이지 url이 다르게 되었을


*쩜(.)은 임의의 문자 1개에 해당,별(*)은 그것이 0개이상이면 매칭.

쩜은 많이 사용된다!!!

/products/.*/cycles 로 하면 저 안에 모든게 들어가도 된다라는 뜻.


 .*(orderend.htmlㅣorder_complete.html).*

--> 이 의미는 앞에,뒤에 아무거나 와도 상관없고 왼쪽이든지 오른쪽이든지


유입단계를 잘 세팅하고 나면 (전환에 목표에 가면...) 유입경로 시각화가 나온다.


얼마나 하고있고 !!! 얼마나의 비율 !!!


주문서 작성에서 결제 완료로 넘어가는게...??? 얼마나 되느냐.. 

54% 였는데, 60%로 올라가면 정말 좋은거지. 그래서 퍼널마다 최적화하는게 중요.

A/B테스트를 해본다 A,B 유저 그룹으로 나누고 뭐 글씨를 다르게 제공한다던지, 또 누구에겐 뭔가 다른걸 보여주던지..그런식... 전환율의 추이를 추적해야한다.


유입경로 시각화는 정말 아름다운 거다.





URL이 아닌 것들도 측정할 수 있을까???

애초에 정리된 형태로 GA에 들어오면 좋은텐데...

공유하기 버튼 그런 것...


그래서 이벤트 개념으로 들어가는 거다.유저 행동들이 엑셀같이 들어간다면 분석할 떄 더 좋겠다!!!!! --> event. 


category             action               label                 value


shopping

gamemain



아 이런 것도 되구나, 3분 이상 머무르면 그 사람에게 어떤 이벤트를 발생하게 해서..하는거..

조건을 다 걸 수 있대. 이벤트를 검색하면 된다.


GA는 기본적으로 URL개념.

근데 특정 어떤 개념에 직면했을 때 이벤트를.

이벤트를 발생시키려면 사실 좀 어렵다. 왜냐하면 이런 화면이 되면

GA라이브러리를 가서 쏴주라 라고 코딩을 개발자가 해줘야된다는 것. 코딩단에 직접 들어가야된다.  IF를 막 쓰는거 ... 자바스크립을 통해서... 예를들면 


 ga('send','event','ecommerce','add to cart',how) ;


이런식..


"새로운 정보가 알고 싶어요" 

"개발자가 코딩하고 다음 릴리즈 기다리세요" 이렇게..어려움이...


근데, 구글이 우리를 구원하셨다. Google Tag Manger.

이게 뭐냐면


개발자 ->(html) GA 코딩 코딩 -> GA서버 -> (html)     분석가

원래 이렇게

근데 구글 태그 매니저는


구글매니저가 자동으로 코드로 만들어 준다.

tagmanager.google.com 구 버전과 신버전이 있는데,

2014년 10월에 나온 신버전으로.


마이그레이션 하셔야됩니다.이런 팝업이 뜬다. 똑같이 구글 아날리틱스처럼 하면 되.


근데 구글 탭 매니저가 꼭 내가 쓰는건 아니고, 개발자한테 그냥 이거 써라고 하면됨.

그럼 뭐 추가하거나 빼거나 하는게 굉장히 쉬워진다.그래서 막 협업할려고 하지말고 그냥 이거 넣어서 하면 훨씬 편하다.


개념들


트리거 (이런 조건이면) ->          태그 (이거 쏴라) ->       GA


어떤 버튼이 눌리면~

마우스가 어디 올라가면~

어떤 url이면~


엄청 추울떄....

봄 의상을 보여줘야되냐.. 겨울 의상을 보여줘야되냐...

방문 형태에 실험이라는 게 있다.

거기에 가면 실험할 트래픽 비율이 있는데, 포탈이 어느정도에 따라서 그 비율이 달라지는데.

만약 트래픽이 5명이면 5%면..말이 안되겠찌? 트래픽 비율이 늘리면 늘릴수록 빠르게 결과 나오겠지?



위에 디폴트 url 들어가는 유저 중에 대안1 대안 2 이렇게 있는데

막 취합을 해서 그래서 보여준다.


분석은 궁극적으로 액션을 하기 위한 것.


Multi Armed Bandit ( bandit은 슬로우 모션이라고 생각)


넌 또뭐냐..이걸알면 잘난체 할 수 있다.


즉, 100만원을 내가 가지고 있고, 슬로우 머신이 5개가 있으면 옛날 같으면

20만원씩 5개 투자해서 돈 다써보고 아~ 이러는데

그렇게 하는ㄱ ㅔ아니라, 1만원씩만 투자해보고, 예상 대비 어떤 머신에서 좀 확률이 좋게 나온다면 거기에 집중투자 하는거


그래서, MAB 두가지 측면에서 좋다.


-결과를 더 빨리 얻는다. 


(a/b 테스트는 기회비용이 존재한다.좋은 곳에 50이 가면, 반대로 안좋은 곳에도 50이 간다.)


근데 MAB는 그 기회비용까지 최적화한다. 결론까지 가는 동안의 이득도 놓치지 않는다.




!!분석!!

1.무조건 목적을 먼저 정하라

2.사실을 발견할 때 까지 나눠라 나눠라.


Robert Capa 유명한 사진기자.

"당신의 사진이 만족스럽지 않다면 그것은 충분히 가까이 않았기 때문이다."


                                 ↓


"만약 당신의 분석이 만족스럽지 않았다면 충분히 세그먼트를 하지 않았기 때문이다."



개별 기능은 알겠는데 뭐부터 해야할지 모르곘다!!!!!!!!!!!!!!!!!!


이럴때 큰 2가지 실수.. -?1.한번에 모든 것을 할라고 , 2.잘못된 순서로 파고드는 거


Avinash kaushik 인도 아이씨. 아날리틱스 계의 대부. 

웹 데이터 분석학 이라는 책. 초대부!!! 


이 사람 블로그도 있는데, 스텝을 만들었따. 


유입방문자수광고 CTR - 1

이탈률 방문당페이지뷰 - 2

결제 전환률 페이지값 - 3

유저취득비용- 4

장바구니,결제 퍼널 멀티채널분석 - 5

소셜대화율,소셔셜 전파율 - 6

비결제 전환률,비결제가치측정 -7

캠페인 가치분석,오프랑니 분석-8

고객 생애 가치 -9


 이 식으로 간다..


1. 고객이 어디로 들어오는지에 집중한다. UTM 세팅에 집중한다 너무 중요하다 이게!!

 현상 확인에 초점 해야 한다. 모든 외부 링크에 적절한 UTM을 꼭꼭해야한다!!!!


제일 중요한건!!!!!!!!!!!!!!!!!!! source !!! 

네이버 클릭 초이스나, 카카오스타일!!! --> 이걸 돈내는 단위로!!


네이버는, 웹,앱 키워드 광고가 다르다.

그래서, 소스를 보고 utm 을 하고 돈을 입금하는 대로 나눠라!!!

모든 것은 궁극적으로 액션을 하기 위한 것.


액션을 생각하면서 항상 접근.


캠페인은 같게, 컨텐츠는 다르게


결론은 딱 두가지다.

1. 소스는 돈 내는 단위로

2.캠페인은 같게, 콘텐츠는 다르게


이거 두개만 해도 너무 UTM 잘하고 있는거.


2. 들어온 고객에게 적절한 것을 보여줬는가??

랜딩 최적화.


이탈률은 모두 첫유저로부터 측정 문제 없다.

분석의 첫번째 룰 나누어 본다!!!


세션당 페이지뷰,시간은 구 유저와 신 유저의 혼합의 평균이다........

뜯어봐야된다 그래서, 구유저는 그래도 굴직하게 가고 있는데, 신유저는 개 떨어지고 있을 수도..... 이거는 코호트!!!


네이버 , 페북 정확히 어디에다가 돈을 쓸지 알 수 있다.


코호트를 만든다음에 처음 부분, 체류 시간을 보면 된다. 그러면 첫 페이지에 뭔가 액션을 한다면 확인할 수 있곘지 뭐가 효과있는지



3. 나가서 손님을 잘 호갱하는 방법.

결국 샀는가? 이 부분을 측정.


enhanced commerce . 이거 구글이 강력하게 밀고 있는 기능.

여기에는 이런 개념이 들어가 있다.

노출,상세보기,장바구니,결제시작,결제완료,환불 이런 모든 사세한 스텝이 다 들어가있따.

그래서 좀 코딩이 많이 들어감.


그래서 이건, 개발자가 해야되는 것..근데 이걸 하고 나면

모든 액션이 돈으로 수치화 되서 나온다. 상품 하나하나 매력도도 보인다.

즉, 커머스에서 일어나는 거의 대부분을 모델링 할 수 있다.

근데 이게 커머스만 그런거 아냐. 


블로그라도 

목록뷰 (impression)

상세 글 읽기 (detail)

댓글달기(addcart or purchase)

 가능!!


그래서, 커머스라는 장바구니 ,결제 이런 것들도 우리의 임의의 비즈니스활동에 대응시켜서 할 수가 있다는 것이다. 실제로 이렇게 많이 하고 있다. 

안타깝게 근데 개발자가 좀 도와주긴 해야한다.


페이지값의 쉬운 이해. 땅값이라고 보면 된다. 흥행하는 지역, 포인트가 어디냐.

그러면 여기에 가입이라든지,배너라든지,메세지라든지 이걸 띄우면 되겠쯰.


enhanced commerce 와 자주 만나는 문제는

실제 DB상의 데이터와 ga 데이터 데이터 차이가 나는데 5% 오차면 괜찮음


4.유저취득비용


고객 한명을 얻는 비용을 계산하자. 같은 돈으로 가장 많은 고객을 얻는 방법을 알아내자.


  각 광고 채널에 쓴 돈/얻은 유저수 = cost per acqusition


어떤 매트릭을 쓰느냐에 따라 뭐 여러가지...


5.A/B 테스트. 

여기서부터는 UX의 영역. 어떤 디자인이 결제를 가져오나?

우리나라는 액티브 X 이런거 막 하니까 다 도망가버려. 유저들은 왜 결제과정을 시작하고 중간에 그만둬 버리는 걸까?

결제 과정에서의 A/B 테스트는 굉장히 좋아.


optimizely --> 이거 가입하고 5분만에 쓸수 있다.엄청 좋다.


와 이게 같은 페이진데, 다른 페이지처럼 계속 보이게 하는 그런 테스팅 기능이 있네?

experiment variations 가서 variation #1 ~ 쭉쭉 있는데

여기서 edit text 가면  다르게 뛰울수 있다. 또 move도 넣을 수 있고 resize도 가능.


원래는 a/b 테스트 안을 하나하나 만드는 건 정말 까다로운 일인데

optimizely를 하면..굉장히 직감적이고 쉽게...

그래서 가능하면 이걸 쓰는게 좋다. 이건 배우기 정말 쉽다.메뉴만 클릭 클릭~~


6.소셜 대화율,소셜 전파율


관련한 적절한 메트릭이 없다...

그래서, 4개의 값이 있는데


대화율 : 코멘트가 달리는 비율 conversation rate

박수율 : like달리는 비율 applause rate

증폭률 : share가 일어나는 비율 amplication rate

경제적 가치 economic value


노력 대비, 우리는 어느 매체에 집중해야되냐. 이것도 되지만,

내가 각 매체마다 어떤 성과가 지금 나오고 있느냐

트위터는 어떻고 페이습궁느 어떻고 블로그는 어떻게 이런 것들을 내부 성과평가 할 수 있따


7.브로셔를 받는 행위. 회원가입은 얼마인가?


우리가 바라는 건 결!!!!!!!!!!!!!!!!!!제!!!!!!!!!!!!!!!!!!!!


-------------------------------------------///// -----------

                          노는 시간                                       결제


근데 외부로 보이는 결제는 1번이지만,


이 결제가 이루어지기에 고객은 끊임없이 오 살까? 좀더볼까 ? &*$^#%^$#%^


그래서, 사이트에서 노니는 시간에 사실 집중하는게 더낫다! 요즘 미국에서는 이런 개념이 나오고 있는것!!!!!!!!!!!@@@@@

micro conversion 사이트 가입 첫 포스팅, 이런 것들이 된다


8.오프라인의 활동도 숫자화에 도전한다.

옥외 광고,TV cf..


9.고객 생애 가치


고객 개인이 우리 사이트에 처음 들어와 마지막으로 떠나기 예상하는 시점까지. 우리에게 주는 가치. 개인 개인 고객에 대한 우리 회사에 대한 가치를 측정하는 것.

같은 고객이라도 어떤 고객은 10년동안 계속 사는 고객이고, 어떤 고객은 한번 사고 끝나는 거라면 당연히 전자에 집중해야겠지. 그래서 각 이런 분석에 따라 apporach 가 달라진다.

근데 보통, 이거는 중견기업정도가 되고 history 가 생기면 그때 할 수 있다.


CLV = customer life value. 


그래서 이게 분석의 길이다.


세그멘틱,세그멘틱,세그멘틱 하다보면...

발견한 세크먼트에서 오디언스를 잡아가지고,애드센스를 타켓팅 할 수 있다.

이런 류의 액션을 할떄는 애드센스를 쓸 수 있다.그래서 처음할 떄는 조금 그렇긴 하다.


<이 두가지를 기억해라>

1. UTM 설정해라

2. 원하는 목표를 명확하게 설정. 그 목표값이 보여야 된다.

전환 - 개요 - 목표 - 셋팅


결제 완료,계정만들기 목표를 달리해서 이걸 볼 수 있다. 

그래서, 결제 관련한거나,계정 관련해서 어떻게 그 추이가 변하고 있는지를 알 수 있다.


7월 22일 수요일 3주차 수업

[분석]

-데이터에 대한 시각이 날로 갈수록 깊어지며 넓어지고 있다고 생각한다. T.

-모든 일이 그렇듯, 데이터에서도 목적이 제일 중요하다.비즈니스의 목적. "뭐할라꿍?"

-그렇게 목적이 정해지고 나면 '잘 모으는 것'에 집중할 건지 '잘 지키는 것'에 집중할 건지

-'잘모으는 것'과 관련해서는, 내가 초기 스타트업을 운영할 때,좋은 데이터 습관을 가질 수 있을 것 같다.일일이 처음에 기록하고 그게 계속 쌓이면 이제 시스템화를 하는 것이다.

-단순히 데이터보고, 어 이거 이거네.가 아니라 계속 쪼개면서 심층적인 면을 봐야된다.

-물어야 기록한다.모을 수 있다.무조건 묻는거다.누구한테? 유저한테.

-utm을 광고 단위(돈 투자하는 단위)로 분류를 해놓는 것.그렇게 해놓으면 매체별로 통계화할 수 있고 그리고 각 매체마다 얼마의 돈을 투자해야되는지 인사이트를 잡아낼 수 있다


-그리고, 궁금해졌다... 데이터는 정말 신세계고 엄청 중요하고.. 스타트업 vision까지 영향을 미치면서 피봇팅이 일어나는 건데.. 도대체 경영자는 그러면 데이터 분석과 스타트업의 전반적인 운영 시간 비율을 어떻게 조율해야되는지... 이걸 서하연님(알렉스앤컴퍼니 대표)한테 물어보니깐 자기 철학은 잘하는 사람이 잘하는 걸 해야된다는..





[요약]

오늘은 GA기능에 대해서 많이 얘기할 생각


지도 앱을 생각해보자.


갈곳이 없다면 현재 위치만 누르게 된다.


지도 데이터 = 유저로그

출발점       = 현재상황

목적지      = 원하는 목표

확대축소하며 = 기능을 사용해

경로 찾기 = 액션을 찾는다


이렇게 메타포. 중요한 건 목적!!! 비즈니스 목적을 정하는 것

GA는 목적지를 정하지 않으면 어떤 메뉴들을 돌아다녀야할지 모호해진다.


근데 전국에 사장님은 GA를 모른다...


모든 목적은 크게 2가지로 나뉠 수 있다.


 @@@잘모으기@@@         @@@잘지키기@@@

    (광고,언제낼까,...)          (어떻게 회원가입까지,어떻게 자주 사이트에,결제를 더많이)

이렇게 나눠서 


좋은 질문을 하는게 중요 --> 좋은 프레임 ( 잘모으기 / 잘지키기 )




잘모으기))


어떻게 광고를 잘할까?

"내가 치킨집을 차린다면 어떻게 홍보를 해야될까????"

    찌라시를 돌리자.

 근데 어디에 뿌리지..그림을 후라이드로할까...양념으로할까...

쿠폰도 나눠줄까... 점심에뿌릴까..저녁에뿌릴까...


데이터가 하는 일이 그렇다.(예전에는 그냥 걍 감대로 뿌린다.) 근데 통밥을 데이터를 가지고 객관적으로 , 과학적으로 접근하는거.


물어야 기록한다


어디서 전단지 받아 전화하신 거에요~

-손님마다 물어보고 기록하는 문지기 알바가 필요하다.


웹 -> GA JAVA SCRIPT

앱 -> GA SDK                              ----> GA서버 <----- (분석가)


.js 추적정보 --> 여기다가 html 뭐 갖다붙이면 된대


모든 설명은 ga.js(구 GA)가 아니라 analytics.js(universal analytics)기준...!!!


유니버설은 뭐 iot나 앱 웹 모든 거를 포함. 최근자료들 기준으로 봐라!@@ 2013년 이후!


"GA 코드는 위랑 아래중 어디에 붙이는게 좋나요?" 


위에서 GA로딩을 시작해라...!!! ( 외국 서버기 때문에.. ) 반드시!!

와.. 근데 구글은 백엔드로 GA로딩을 돌려서 동시에 그림그리기랑 진행가능하네.


앱분석 --> 앱의 SDK삽입은 실제 코드에 들어가 컴파일 되야하기에 회사의 개발자님들이 해주셔야..




구글 아날리 들어가면 메뉴가 엄청 많다.그러나 크게 이렇게 나뉜다.

지능형 이벤트,실시간,잠재고객,획득,방문형태,전환


지능형 이벤트

뭔가 요상한 변화를 잡아내는 것


실시간

현재 어디서 왔고 무슨 페이지를 보고 있는 것 뭐하고 이쓴ㄴ지


잠재고객

손님들 자체 특성


획득 

뭘 보고 들어왔는지


방문형태

얘가 들어와서 뭐하는지


전환 

실제 가입했는지,매출을 올렸는지

KPI로 생각하는 지표에 집중


                 

                클릭,세션,사용자

      

*예전에는 클릭을 세었다.


문제발생. 같은 500클릭

A: 50명이 10번씩

B: 2명이 250번씩


그래서,

C: 50명이 100번 클릭하면 돌아다님 ( 근데 사용자수는 A랑 같음)


그러면.... 도대체 어떻게 제대로 세냐....

한번 브라우저 켜서 연속적으로 돌아다니는 것을 하나의 단위로 세자! - 이게 세션


구글에서는 30분이상 떠나면 횟수르 분리시켜버린다.근데 이 시간은 컨트롤 OK.

 

디폴트 채널 그룹


Organic search - 검색결과로 유저가 타오온.

Direct - 북마크나 주소쳐서.

referral - 블로그나 게시판 링크를 눌러온





링크 안에 utm이 없으면 그냥 그대로..

분류를 전부터 매겨주야된다. 어디 경로를 통해 들어오고 있는지

경로 #1 경로#2 경로#3 


충성고객을 잡을떄는 소스/매체에서 

direct/none

naver/organic    이거 카테고리를 충성고객으로


utm 잘 분류해놓기!!!@!@!@!@!@!


소스를 광고매체마다 정하는게 좋다.매체를 성질 단위개념으로 보지말고

돈이 투입되는 단위로.


그래서 외부에 뿌리는 링크마다, utm 소스를 잘 정해줘야겠다라고 잘 생각하면 된다.


새로운 세션 : 한번도 안잡히는 애가 갑자기 들어온.                                

이탈률(굉장히 중요)(bounce rate) : 첫페이지 보고 딱 바로 꺼버린. 


광고의 효과가 좋다는 것은

새로운 세션의 비율을 보고 이탈율이 낮은걸 보고 세션당 페이지수를 본다.


왜 이렇게 UTM에 대해 강조하는 걸까????

"심슨 패러독스"

A 병원 환자수 500/생존자수 290 /치료율 58%

B 병원 환자수 500/생존자수 320 /치료율 64%


누가 더 잘했냐? B


근데 뜯어보면 다르다... 간암,위암 나눠서 보면 진실을 바라볼 수 있다.

나누어 뜯어보면 전체를 볼 때와 다른 진실을 볼 수 있다.


GA에서 나누어 뜯어보는 방법은?? 

큰거에서 ->UTM (수집측면) -> 세그먼트 (데이터 뒤집고 막 하는거) => 이렇게하면 데이터에 대해 80%는 하는거......


세그먼트는 특히 방문형태와 결합될 떄 아주 큰 강점

어떤 조건을 가진 놈이 어떻게 페이지를 걸러가는지. 그런식.


인구통계라는 부분( 잠재고객 카테고리에 들어가면..)

이 방식이, 구글이 이미 미리 프로파링링 해놓은 데이터를 연동시키겠냐느..

그래서 20대,30대,40대 이걸 다 잡을 수 있다. 모바일,데스크탑 으로 나누고 남자,여자, 나이대 비율 나나온다..미쳤네 진짱.. 연령 정보를 주지도 않았는데 구글은 잡아낸다.

인터넷 프로파일링해놨기 때문에 관심도 카테고리까지도 다 잡아낸다..WOW..




1)데이터는 '나누어 볼 때' (심슨 패러독스를 벗어나서) (두들겨 패는거) 의미가 있습니다.

2)뜯어보기와 실험이 결합되면 ->A/B test (짜장면,짬뽕 뿌리고 결과 확인)


*제대로 전단지 만드는 것*


1)광고를 2개 산다.광고 문구를 다르게

2) utm에서 캠페인 같게, 콘텐츠는 다르게 링크를 2개

3)테스팅.


utm, 세그먼트, a/b 테스트 --> 핵심핵심핵심핵심핵심핵심

--> 이게 잘 모으기 과정




@@@잘 지키기@@@

데리고 온 유저들이 만족하고 있을까?


*잊지않고 , 다시오는 유저

-어떤 것이 잊지 않는 것? 주기마다 달라.밥을 파는 것과 이불을 파는 것.

7일 ,14 만에 재방문 유저, 잊지 않고 리텐션을 잡는 툴이 있다.

active user = 단골 손님. 


뭔가 이상하게 발견되면 세그먼트!@!@!@!


숫자를 뜯어보고 해보면 아 설날에는 데스크탑에서 많이 유저가 빠지니까 모바일에 모든 집중을 해야겠다. 모바일 트래픽 신유저 30% 데스크탑 70% 이면, 모바일이 단골손님이 좀 더 많은 것. 그러면 또 여기서 전략이 달라지는거지.


근데 설날에 설날 때문에 유저가 빠지고 있는지 서비스 자체의 질 악화로 빠지는지...??

=> 코.호.트

GA에서 코호트는 동질집단 분석. 1학년 2학년 3학년, 신입생 성적 사례처럼.

1달 사용자는 점점 늘고 있는데 , 2달 사용자부터 줄고 있다. 뭐 이런 세부적인 거를 알 수가 있음.


분석 -> deep down -> deep down -> deep down


단점은............. 과거 어떤 특정 날 기준으로가 안됨.. 오늘날을 기준으로 해서..

그래서 코호트 메뉴는.. 캡쳐를 떠서... 보관해야된다.


* 쉬어가는 코너


추천제외 트래픽 ( 우리 사이트에서 정보를 구입하고 결제를 하려고 페이팔로 가면 이게 서로 다른 액션이라 아니라 같은 액션이라 한데로 묶어줘야한당 ) 


이거진짜 핵심!! 

계정을 만들 때 주의

GA데이터에 대한 억세스 '공유'는 가능하나 '양도'는 불가.

개인 gmail계정으로 GA만들었다가 퇴사할 때 곤란.회사에서 쓴다면 데이터용팀 gmail 만들 것.


공유할떄 주의

사용자 관리가 3개가 있는데, 뒤로갈 수록 권한을 적게주는데, 

첫번째 주는ㄱ ㅔ편하다.


크롬->확장프로그램 ->구글 아날리틱스 debugger 

이걸 쓰면 


다음 주제는 와서 많이 산다 = 궁극적인 골


커머스 사이트 : 상품 많이팔기

게임 sdk : 인앱결제

 뭐 다다르다. 





7월 15일 수요일 2주차 수업


가장 쉽게 데이터 분석으로 접근할 수 있는게 (창업자가) 지표.


그림이 그려질때까지(모양) 머리속에서 착착착 암기! (이 그림↓↓↓)


 플로우들이 있는데, 이것들이 돈과 사람들의 흐름.

 그래서 이 플로우들을 내 비즈니스에 녹여서 유저 몇명이 어디로 흐르고 있고

 이런 것들이 되면 growth hacking의 준비가 되어있는 것.


저번 시간에는 어떤 지표가 중요하고

어떤 지표들이 얽혀있는지 , 그런 것들을 알아봤다.


어떤 경우를 타고 내 책상에 결과물이 왔는지 

(DBA로 부터 아니면 뭐 구글 아날리틱스로 부터)

어떻게 이 지표가 나왔는지 알고 해석하는거랑 모르고 해석하는 거랑 그 힘이 다르다.


FUNNEL 관리.50년 100년동안 사용된 개념인데,

스타트업에서는 그 스타트업 환경에 맞게 이것이 변형되어 진화.


"다운로드 수"( 구글플레이 검색까지 온 것 )( 설치-install 데이터가 아니다)

(근데 우리는 돈주고 예네들 끌어왔는데 도망가네..)(누군지 밝혀내야됨)


다운로드수 -> 앱설치 -> 앱실행 다르다!!!

이 차이들을 (gap이 얼마나 되는지,줄어들고 있는지 , gap을 보는거)


funnel은 다 잡는다고 생각하는게 아니다. 하나씩 잡아간다고 생각.

funnel 관리할 때 추이를 봐야된다! gap이 늘어나고 있는지 줄어들고 있는지의 비율.







KPI ----------> Key Performance Indicator  -------> 이름 안에 3가지를 가지고 있다..!


KEY 핵심이다                          관련어구) 핵심 멤버

(중요하다는 의미보다, 숫자를 말하는거다, 1,2개 2,3개를 뜻하는거다.핵심이다! 이런 말)


이런 맥락이다... 하나의 지표로 핵심 비즈니스를 설명하라!!


PERFORMANCE 성과 실적            관련어구) 일, action


INDICATOR 상태를 알려줌            관련어구 ) 지시약,리트머스



비즈니스에서 사용하는 KPI는 어디에서 산출이 되었고 어떤 로직으로 어떤 경로로 내 컴퓨터로 도달했는지가 중요!

그 경로가 담겨있는 숫자가 KPI.



자신의 비즈니스를 판단할 때 내 숫자를 뽑고나서 내 시장을 보는게 가장....

남이랑 비교하는 건 별로 생산적이지가 않다. 




해적 지표(Startup Metrics for Pirates)

스타트업에서의 분석의 목적은 자금이 바닥나기 전에 올바른 제품과 시장을 결정하는 것.


 A A R R R  (----> growth hacking , 문화 에 영향을 미치는...!)


"Acquisition /ActivationRetentionReferral/ Revenue"

500 스타트업 대표가 창업가들은 이런 과정을 거치더라..




각 단계마다 어떤 지표를 가지고 우리의 단계를 졸업했다고 판단할 것인가? 를 봐야된다.


서비스 관련 지표 리스트 --> ( 저번 시간 그런 개념이다.)


지표를 제대로 뽑기 위해서는... 데이터 분석을 하게되었다..

스타트업에서 데이터 분석을 하는 이유는.. 






Session count (실행 횟수) : 유저들이 몇번 앱을 실행했나

-> 이건 별루. 근데 이건 정말 중요

세켠 카운트를 어떤 시스템에서 어떤 로직으로 산출해서 어떤 경로를 거쳐서 

컴퓨터로 도착했나 .. 


Session time (체류 시간) 앱 실행시작. 체류시간.

유저의 라이프에 얼마나 침투해있나 --> 이것이 의미를 가진다.



우리 유저들은 하루에 우리 앱을 몇분 써더라

한번 키면 몇번 써다라.


예를 들면 위에숫자 밑에 숫자가 같다 ????? 


파란색 막대: 하루에 유저가 몇번 우리꺼 사용하고 있는지.

근데 그래프를 쭉 보면 막대그래프랑 시간이랑 같아지고 이쓴ㄴ데

안좋은 상황..그러니까 업대이트


AU (액티브 유저) : 유니크 광고, 한

WAU 주간 

MAU 월간


 유저 그룹별로(기존,신규) 쪼개라! 기간 합산써라.






 stickiness (점착률,안착률) 개념

(잘 쓰는 개념은 아님..) ->  


stickiness = DAU (나누기) MAU


*일간 방문자가 전체 방문자(월간 기준)중 몇 %되나?


단골 고객이 얼마나 되나~? 이런 숫자라고 생각하면 된다.


stickiness 0.2다 0.3이다 이런게 중요한것보다

어떻게 변화되고, 뭘 했을때 변화됬는지 그런 것들에 집중하는게 좋다.


(TODD SAMPLE / 최세아님 )


stickiness : 광고비를 모시고 가게 안으로 들여왔다.


유저를 유입시키는 것에서 유저를 안착을 시키는 것까지 (서비스 품질을 높여야 하는 상태!)


이 숫자는 몇프로 이하가 위험하다! 이런 건 아니고

내 숫자를 시뮬레이션 돌려서 어떠한 상태다를 점검하는 것. 


-------------------------

 k- factor (인기도라고 볼 수 있을것 같다..)


이 숫자를 계산해서 기계식으로 해봤자 이해가 x 

숫자를 하는게 아니라 지표를 이해하는 것


k-factor가 0.03이면(3%), 100명 당 3명의 유저가 자연스럽게(아무것도 하지 않아도) 증가하는 것을 뜻함.

보통 잘 나가는 앱들을 보면 10% 정도 된다.


k-factor --> viral을 check할때 쓰는 것! 


지표를 가장 이해하기 좋은 방법은 남에게 한국말로 설명하는 것.


설치가 대표적으로 유저 코드.

아니면 최초로 구매한 날짜 


1월1일 설치/1월 2일 설치/1월 3일 설치/ ... / 이런 것들이 유저 그룹들이 상이하게 되는 것.


이렇게 그리다보면, 설치후 몇일 뒤에 주로 유저들이 빠지는지.. 얼마나 살아남아 있는지 그런 것들을 볼 수가 있다.


retention rate --> 돈의 시작.

흐름들은 유저와 돈...


1.Retention Rate(day N Retention 잔존율) -> 보통 이걸 계산하는데 부족.

가장 중요한 건 유저가 설치한 날부터 기준!

설치일 xxxxxxxxxxxxxxxxxxxxxx 설치후 일결과

2.Return Rate (1.결점보완)

3.Rolling Retention (Cohort Retention)(2.랑 거의 비슷)

4.Full Retention(연속 접속율) (게임에서 많이)

5.Ageing Retention(연도 단위로 넘어가는 애니팡 같은 장수앱이 쓰는..)


0

------------


arpu와 arppu 


객단가/ 구매고객 객단가.










--------------------------------------------------------


LTV  (생애가치)

 (--> 펀딩받을 때 보통 frame, 그리고 보통 exit할때도 아주 중요하다.)

 (그래서, 약식을 얼마나 정교하게 하냐, 얼마나 생각하지 못한 factor 를 생각해서ㅏ 관건)



CLTV (고객생애가치)


둘이 똑같은 말. 


가치라는 거는 결국 => 앞으로 쓰실 것까지 미리계산.

재무도 보면 미래가치를 현재가치로 환산.


EX) 쿠폰을 얼마나 뿌릴꺼고, 뿌리면 얼마나 회수될꺼고 그런 걸 다 계산함.

모든 인더스트리에 이런 LTV가 사용된다.

인더스트리별로 LTV 계산하는 산식은 다 다르다. 


유저들이 재방문율 할 그건 retention rate. 


약식으로 그냥 LTV는 계산을 한다.

포도가게에서 아저씨가 포도를 계속 사가서 우리 가게에 나중 매출

(이 손님에 의한) 얼마나 가치 증가를 한다고 했을때

이 아저씨는 어떤 날은 8000원 어떤 날은 10000원 어떤 날은 12000원 근데 

약식으로 그냥 1만원으로 뭐 퉁쳐버리는 식으로 해서 계산을 해나간다고.

그래서 나중에 펀딩이나 엑싯할 때는 이 약식을 얼마나 정교하게 구체화해나갈지가 이제 나중 과제.


숫자가 기준을 만날 때, indicator가 된다.

(왜냐하면 어떤 사람을 만나느냐에 따라 그 해석이 달라지기 때문에)

목표값은 무엇을 언제까지 실행할지 결정하는데 도움을 준다.


만약에 우리가 download를 100,000을 달성한다고 했을 때,달성하고 나면

그 다음에 어떤 action을 생각해볼 수 있다는 것.


예를 들면, 허니버터 치킨을 출시를 했는데, 이 시장의 점유율을 내가

몇프로 달성하고 나면 신메뉴 개발에 들어갈꺼야. 이렇게 구체적으로 접근할 수 가 있다.


단일 업무에는 하나의 kpi (omtm) 가 전략 실행을 위해서는 kpi modeling이 필요하다

다운로드수 ---> 활동유저 수---> 구매유저 수----> 친구 초대 유저수


이런식으로...

------------------------------------------


지표는 활동을 정량화하는 것.

   

한 일을 숫자로 보여주면 사람들의 행동이 왜곡.

즉 , 숫자라는게 사람들에게 던지는 메세지가 powerful 하다.


페이스북이 예를 들면 like 갯수를 카운팅할 때,

초기에는 session time 이 늘어난다( 페이스북 의도)

그러나, 이것이 과연 장기적으로도 이게 유효한가?

어떤 개발자가 facebook demetricator  를 지우고 했는데

(사람들이 좋아요룰 눌렀습니다. (몇개가 아니라) 사람들이 좋아요 갯수에 

집착을 하지 않게되고 콘텐츠에 더 집중을 할 수 있게 되었다. 이런 반응들이 나왔다.






7월 8일 수요일 1주차 수업


[분석]


1.린 스타트업,딜리버링 해피니스 책 읽어봐야지

2.데이터는 정말 너무나도 중요하다 why를 생각해야된다. why

3.일상에 업무들을 다 데이터화 시키고, 데이터적인 사고를 하자

4. mvp -> testing -> learning-> applying

5. 문제해결에 집중하는거다

6.끊임없이 분석하고 학습하고 배우고 적용해야된다.

7.본질적인 상황,문제가 뭔지를 깊게 사고해야한다.

8.무조건 유저를 본다.그들의 행동을 보고 그들의 주변을 본다


[요약]


크게 배운 것은 lean startup,lean analysis,lean thinking,요즘 유행하는 Growth hacking,통계 모형, user cohort, Funnel 에 대해서 배웠다.


스타트업은 데이터를 어떻게 바라봐야할까?


데이터는 이것을 가능하게 해준다. "내가 알고 싶은 답을 손쉽게 획득할 수 있다."

데이터 분석은 궁금한 질문을 내가 가지고 있는 데이터를 가지고 해결하는 것


데이터 분석을 제대로 한다? 

->제대로된 기법이 아니다!

(모든지 how,what이 본질적인 것이 아니라, why에서부터 출발한다는 것.)


데이터 분석은 누구나 할 수 있다.적절한 도구를 사용해서.


*적절한 도구: 1.지표,2.데이터 분석서비스 (유료,무료)(google analytics)


"우리는 지갑을 보면서 돈을 볼 때 어? 은행을 가야되나? 안뽑아도 되나?

이런 데이터 분석을 사실 맨날한다.여기에는 '예측'이 숨어있다."





린 스타트업 프로세스


*린 스타트업이라는 책, 필독서가 아니라 필구매서.근데 꼼꼼히 보는 사람은 없다.

현재는 growth hacking.


LEAN THINKING(1. MVP 만들고 2. USER 물어보고 3.데이터로 확인하고)

의 핵심은 "낭비를 줄인다." 

뭘 줄이는가? (제품 개발에 걸리는) 시간노력


MVP(Minimal Viable Produc) 만들고->살->살->살

최소한의 노력과 개발 공수로 완성할 수 있는 제품

bulid - measure - learn - Loop 

             결국, 진화 (자연)(단세포->인간)


*** 베타버전 출시 했을 때 MVP product

모든 가능한 걸 테스팅 해라.

이때 분명히 끝까지 가져갈 user와 버려야할 user가 생긴다.

분명 이런 stage가 생기는데 버릴 유저는 과감히 버려라.


*** 토니 셰이 자포스

-운동화가 과연 인터넷에 잘 팔릴까?

-길에서 운동화 다 찍었다.사이트 만들고 사고 싶은 분은 여기 이메일

-mvp

-오프라인 가게에 갔고 택배로 보내줬다.


*** 

-내가 생각하는 타켓이 병원쪽에 있다?

그럼 거기에 뿌려라



망설이지 말고 User에게 물어본다

제발!! 근데 당연한건데 안한다.회의를 하면 자기네들끼리 겁나 싸운다

'갑론을박'을 한다.이거 할 시간에 고객들 쓰게하고 고객한테 물어라.

뭘 물어봐야되나? 우리의 과정을 물어본다.그리고 그 과정을 제품에 반영.

고객은 안돼! 하는 엄마같은 사람이 아니다.친절히 다 대답해준다.


LEAN ANALYTICS (지표를 활용해라)

(약간 이런 느낌, 거인 어깨위에 올라타는 것.스마트하게 지표 활용.

stage달성할 때까지 한 지표 활용)


LEAN STARTUP -> LEAN ANALYTICS


"만들기"가 가장 쉬웠어요. (하고나니..)


지표를 찾는 방법

두가지 일 - 유저로그 !

1.우리 핵심 서비스 퍼뜨리는 사람 누구냐

2.이 사람들이 주로 하는 행동이 뭐냐

--> 이렇게 하면 보통 프로젝트 성공





지표로 Growth hacking하기. (실행방법으로 이해하면 된다.) (무서운 방법론)

정의가 다양한데, 목표는 사내 모든 직원들이 그것을 이해하고 성장엔진을 만드는 것


핵심은 마케팅에서 시작했지만 디자인,기획,서비스,개발 이런 부분까지 영향을 미친다.

데이터가 스타트업 비전까지 영향을 미치면 pivoting이 일어난다.유저에 대한 자각.


서하연 "내 서비스안에 자가성장하는 엔진을 만들기 위해 내재화하는 것"

2가지 step(#1,#2)가 필요하다. 


#1 - 성장 방법을 유저로부터 찾아내어 지표화

facebook : 가입 후 10일 이내 7명의 친구를 등록하면 Active user


#2 - 제품 안에 심기

facebook : 친구 추천(빈도,친구 프로필 위치 등)


유저로부터 알아내는 것은 기능이 아니라 지표다.

기능은 60~70% 실패.소음이 심하다

도달해야되는 지점을 보는 것이다.우리의 고민은 여기에 어떻게 도달할거냐.


조직 내에서 유저로부터 알아낸 가장 중요한 내용을 하나의 숫자로

(각 파트의 사람들의 생각이 하나로 모아졌을 때) !! 



ux디자인,기획자,마케터 유저에 대한 인사이트를 보는 시각이 다 달라.


***

마케팅 자동화 VS Growth Hacking


전자는 여러가지 마케팅 결과를 그냥 시스템화.

후자는 강력한 유저를 따라하게 하거나 예네들이 뭐하는지를 밝혀내는 것


*** 15초 동영상 편집 앱

 동영상 보낼때까지의 시간을 측정(send까지 얼마나 걸렸나?)


우리 서비스를 잘 퍼트릴 것 같은 사람인 것 같다

찾아냈다

대학생,돈 별로 없고,보통 2~3명 그룹 잘 지어다니는 것 같다

예측된 데이터는 실제로 확인

심층인터뷰,FGI 


엑셀로 해도 된다! 꼭 해봐라! 





이런식으로 기획안 하는게 중요.

전체 서비스에서 핵심이 되는 step을 찾는 것.기획자 혼자할 수 있는데

또 다같이 party가 참여하면 달라지는 걸 경험한다.




얼마나 실행부터 send까지 걸리는지 체크.

(아까 15초 동영상앱에서 send까지의 시간을 체크하듯이)

처음에 요정도만 체크하면 된다.


요걸 가지고 디자인,기획,개발,회의

"가지도 않다." 여기서

"32.8% 밖에 안되" 

이 두개는 엄청난 차이다.






지금도 우린 하고 있다.

집을 사고싶어!

얼마 벌지?

얼마 쓰지?

얼마 저축?


통계모형이란 세상에 일어나는 현상을 숫자로

재료란 내가 잘 이해하고 있는 숫자들,그리고 그 관계들

-숫자에 대해 잘알고(친숙한 숫자)(내 혈압,내 수입,내 지출)

그리고 그 친숙한 숫자들의 관계




가설(가정과 질문)을 세우자.광고 클릭이 늘어나면 ~할까?

가설을 근데 하나씩 세울 필요 없다.지표 간의 관계가 가설이 된다.

즉 이말은 광고->설치 이렇게 있으면 (광고 클릭이 늘어나면 install 수도 늘어날까?)





 install   ->    New Users

 이 두개는 항상 같지 않다.얼마나 다른지를 체크하주는 것.그 갭이 줄어들고 있는지

반대인지 파악. (*신규유저수는 앱을 실행한 사람,깔고 실행이 안하면 counting 안한다.)




    왼쪽 박스 위에다가 지표를 오려놓고 봐라!

일주일 뒤에 몇명의 유저가 살아남냐 를 보자는게 지금 이 지표.(잔존률)

평균을 봐도 꽤 많은 것들을 볼 수 있다.


이해가 안되는 지표

부서마다 해석이 다른 지표

이걸 clear하게!





지표 활용도 높이기


 all data in aggregate is crap

-합쳐진 데이터는 모두 쓰레기다

-지표는 단 하나의 숫자

-그래서 강력해

-변질확률이 낮아

-조직을 이끌어가는 도구







고속도로 중앙선에 술 취한 사람이 걸어가는 걸 생각해보자

random walk를 하겠지?

평균을 내면 중앙선이 나오는데,그 중앙선에 가기전에 죽어

그래서 평균 기준이 안조아 이런 논리


decompose it (무작정 쪼개지는x)

'"불확실한 상황을 직접적으로 쉽게 관찰 가능한 변수로 분해하라"

-Douglas Hubbard-



보통 이렇게 쪼갠다





 증가하고 있는 곡선을 보면, 어 ? 늘고 있네 하지만, 

1회,2회,3회 보면 1회 결제하는 고객은 늘고 있다.

비즈니스적으로는 안좋은 현상. 왜냐하면 충성팬이 늘고 있는ㄱ ㅔ아니라 

1번 사는 고객이 많아지고 있기 때문에.







USER COHORT

(1.잘게 동일한 얘들로 묶어 2.이들을 장기적 추적)

-> 지표를 쪼개는 두번째 방법

(첫번째는 디멘져로)

(쪼개고 나면 잘게되어 있겠지?)


                    cohort vs segmation

 전자는 동일한 집단이 유지가 되면서 장기간 트래킹하는...

예를들면 1970년 여듸도 출생사람이 10,20,30년이 지날떄 여의도에 주거하는 비율이 어떻게 달라지는지...


후자는 유저속성을 정의(빨간색 입은 유저라고 하면 저번주,이번주 달라진다)


cohort retention -> 한 페이지만 나오는데, 여러 지표를 같이 보면 정말 재밌는 결과가 나온다.


지표를 여러개 비교하면서 앱을 설치한 유저가 날이 지나면서 평균 얼마나 앱을 사용해가고 있느냐.

평균만 구하더라도 정말 의미한 값을 얻을 수 있다.





FUNNEL 관리 (원하는 GOAL을 얼마나 달성하고 있는지)


GATE( 1  ,  2   , 3  ,  4   , 5 )


 벌어지고 있는지,줄어들고 있는지 이런 걸 보는게 중요.


New user에서 놓치는 유저가 진짜 많다.

그 유저를 찾고 싶다!

누군지도 모르고 어떻게 접촉할지 모르겠다.

유저가 a라면 a의 이탈 비율은 생각한 것보다 훨씬 더 많다.








[지원서 관련 내용]


3. D.CLASS 데이터분석교실 수강을 통해 얻고자 하는 것은 무엇이신가요? *


우선, 데이터 전반적인 (실무)인사이트를 얻는 것입니다.저는 데이터를 정말 사랑하는 사람인데 죽을때까지 데이터를 어떻게 사용할지의

초기 베이스라인을 잡는 것이 이 수업에 기본 자세라고 생각합니다.그래서 이 수업이 앞으로 제가 데이터 경영을 하는데 있어서

정말 중요할 것이라고 생각되어 꼭 수강해야겠다고 생각하였습니다.그리고 비즈니스 단계별로 세부적으로 어떻게 데이터를 접근해 나갈지에 대한 깨달음, 그리고 그에 대한 고민을 통해 비즈니스 인사이트를 높이고 싶습니다.


4. 현재 업무를 진행하면서 데이터 분석이 필요하다고 느끼시는 부분이 있다면 어떤 것인가요? *


우선, 유저에 대한 데이터 분석이 가장 필요하다고 느끼고 있습니다.어디에 내 고객이 있고 고객이 어떤 경로(모바일인지,PC인지,태블릿인지)를 통해 사이트에 진입하고 그 고객은 보통 무얼 하는 사람이고 어디에 살며 그런 유저에 대한 총체적 데이터를 분석해야겠다는 필요성을 많이 느끼고 있습니다. 이런 유저에 대한 모든 프로세스들을 데이터화시켜 투명하게 관찰하고 거기서 문제점을 발견하고 해결책을 풀어나가고 싶습니다.어떤 부분의 업무에 특정 데이터 분석이 필요하다고 생각되지 않습니다.모든 업무를 데이터화시키는 것이 목표이고 데이터적으로 접근하고 데이터적으로 사고해서 데이터적으로 해결하는 것이 가장 필요하다고 느끼는 부분입니다.