본문 바로가기

오뚜기의 데이터 분석 이야기

안드로이드 관련 트위터 글 키워드 분석 분석대상 기간 : 3월 1일 ~ 3월 10일간의 데이터 키워드 : 안드로이드 수집 대상 사이트 : tweetrend.kr (트위트렌드 사이트에서 "안드로이드"로 검색해서 나오는 결과 중 3월 1일에서 3월 10일간의 데이터를 모두 카피 앤 페이스트 후 엑셀에서 몇 가지 함수를 돌려 작성자, 작성일, 본문 내용을 분리해서 본문 내용만 키워드 분석기로 돌린 결과입니다.-->주말에 그냥 개인 호기심 발동으로 수작업했습니다..) [원본 Raw Data] sheet1 은 수집된 그대로, sheet2는 가공된 데이터 [키워드 분석 결과 Top 20] [분석 결과에 대한 오뚜기의 주관적 커멘트] 1) 안드로이드는 역시 아이폰의 대항마로서 가장 자주 언급되고 있다는 점 2) 개발자와 개발 관련 이슈가 다음으로 자주 언.. 더보기
해외 온라인 버즈 모니터링 사이트 제가 요즘 하는 일 중 하나는 온라인 버즈 데이터를 수집, 분석하여 분석 보고서를 전달하는 "온라인 버즈 리서치"입니다. 이 온라인 버즈 리서치를 수행하는 데 있어서 몇 가지 중요한 조사 설계 요소가 있는데 그 중 하나가 조사 대상 사이트를 선정하는 일입니다. 왜 이 사이트의 온라인 버즈를 조사 대상으로 삼았느냐에 대한 명확한 근거와 기준이 제시되지 않으면 조사의 신뢰도는 떨어질 수 밖에 없지요. 그런데, 해외 사이트의 경우 이 명확한 근거와 기준을 제시하기 더더욱 어려운 점이 있습니다. 국내 사이트에 비해 순위라든지 방문수라든지 하는 것들이 잘 알려져 있지 않기 때문이지요. 이에 따라 개인적으로 해외 온라인 버즈 중 특히 블로그를 모니터링하기에 적당한 사이트들을 나름의 방문자 수와 랭킹 관련 데이터를 .. 더보기
3. 누적백분률 곡선과 20대 80 법칙[오뚜기의 데이터분석 이야기] 오랜만에 오뚜기의 데이터 분석 이야기 연재 글을 다시 씁니다. 에공.. 그러다 보니 흐름이 끊기는 감이 없지않아 있네요.. ㅎ 그냥 마음이 가는 대로 글 올리렵니다. 오늘은 "누적 백분률 곡선"이랑 이 개념을 활용하여 20대 80대 법칙 증명하기에 대해 이야기 해 보겠습니다. 우리가 자료를 정리할 때 가장 자주 쓰는 방법이 등급을 정하고 각 등급 별 빈도를 표기하는 것입니다. (도수 분포표) 예를들어 어느 학급의 영어 점수를 도수분포표로 나타내면 아래와 같습니다. (아래에서 누적 빈도는 그 등급에 해당되는 빈도를 포함해서 그 이하 또는 그 이상에 있는 모든 빈도를 합친 것이고, 누적 백분율은 누적 빈도를 전체 대비 비중으로 표시한 것입니다.) ----------------------------------.. 더보기
[온라인 버즈 데이터 분석 사례]The sentiment on US Economy from Twitter 출처 : http://lifeanalytics.blogspot.com/2009/10/sentiment-on-us-economy-from-twitter.html economy 라는 키워드로 트윗 글 만 개를 수집해 분석했다고 함.. 아래는 그 분석 결과 이미지... 확대 이미지 보기 --> http://4.bp.blogspot.com/_koDJi0ps7Mw/Su1reGXYLZI/AAAAAAAAAVA/BCysPbZ69zY/s1600-h/econ_webchart.jpg [상기 그래프 보는 법] good, better, advance 와 같은 긍정을 나타내는 단어들은 Positive Sentiment 로 분석 부정 단어들은 Negative Sentiment 로 분석 단어들 간에 선이 굵을 수록 연관성 높음 흥미.. 더보기
[요약 번역 품평 발췌]소셜미디어 마케팅 성과 측정하기... 원글 출처 --> http://www.chrisbrogan.com/measuring-social-media-marketing/ Measurements I’m fond of saying that my favorite measurement is the one with a dollar sign attached. I like helping companies find revenue. Barring that, or around that, we look at different measures for different projects. It depends on what the goals were, and the strategy we used to get there. Here are some sample measurem.. 더보기
2. 데이터 분석 - 마케팅에서 조건부 확률의 의미 [오뚜기의 데이터분석 이야기] Part1 ~ Part2 에서 연달아 변수에 대한 이야기를 다루다 보니... 그냥 제가 질려버려서, 오늘은 잠시 다른 이야기를 해 볼까 합니다. -------------------------------------------------------- 오늘의 주제는 조건부 확률 이야기.. 통계를 공부해 보겠다고 책을 뒤적이다 보면 확률.. 그 중에서도 조건부 확률은 상당히 앞 부분에 배치돼 있습니다. 음.. 그만큼 통계 공부에 있어 기초가 되는 부분이라고 할 수 있을 텐데... 마케팅에 있어 조건부 확률이 중요한 이유는 무엇일까요? 일단, 책에서는 아래와 같이 정의하고 있습니다. 조건부 확률이란? 어떤 사건이 일어난 또는 일어날 조건 하에서, 즉 변화된 표본 공간에서 어떤 사건이 일어날 확률을 말한다. 통계적.. 더보기
1. 데이터 분석 - 시작은 변수 설계로 부터(2) [오뚜기의 데이터분석 이야기] 지난 번 글에서는 변수 기획을 위해 알아야 할 데이터의 유형에 대해 먼저 살펴 보았습니다. 오늘은 이어서 우리 주변에 어떤 데이터들이 있고 이것을 어떻게 변수화 할 수 있는지 살펴보도록 하겠습니다. 특히, 일상적인 주변 데이터보다는 마케팅 관점에서 우리들이 고객에 대해 알고있거나, 알 수 있는 정보들을 정리해보면 아래와 같습니다. 1) Socio-Demographic Data 번역하면 사회-인구통계학적 데이터입니다. 보통 고객이 회원으로 가입할 때 제공하는 성별, 연령, 직업, 주소와 같은 것들이지요. 특히, 주소 데이터는 아파트 이름일 경우 평당 가격으로 환산하여 그 고객의 소득 수준을 가늠해 보는 등 아이디어를 통해 약간의 변환으로 보다 유의미한 분석이 가능해 집니다. 2) Transactional .. 더보기
오바마 선거 캠페인에서의 data crunching 사례 오늘따라 블로깅이 잦다..점심 시간을 틈타 오바마 캠페인을 성공적으로 이끌은 data crunching 의 힘에 관련 된 동영상 시청..financial department, new media department (이메일, 웹사이트) 등의 데이터를 활용해현장 팀이 커뮤니케이션 하는 데 활용..즉, 고객을 모르는 상태에서 접근하는 것이 아니라 약간의 정보라도 가지고 접근"똑똑. 저번에 기부해 주신 20 bucks 정말 감사하구요. 와이프랑 말씀 좀 나눌 수 있을까요? 와이프께서우리 웹사이트에 정보 신청을 해 주셨걸랑요..."중요한 건은 부서 별로 분산돼 있는 데이터를 모아서 활용 방안을 모색했다는 점.두번째 눈여겨 볼 만한 점은 웹사이트 통해서 등록하고 전화 번호를 남긴 사람들에게 접근하는 방식...다양한.. 더보기
1. 데이터 분석 - 시작은 변수 설계로 부터(1) [오뚜기의 데이터분석 이야기] 웹 바닥에서 열심히 로그분석하고 설문지 분석하다가 정식으로 데이터 분석 업무를 해 보겠다고 Analytics 바닥에 뛰어들은지 약 2년이 되어가는 듯 합니다. 짧은 시간이지만, CRM 바닥과 리서치 바닥을 두루 훑고 있네요. 비전문가로서 고군분투하는 모습을 기록에 남기고자 [오뚜기의 데이터 분석 이야기]를 시작합니다. ------------------------------------------------------------------------------------------------- 데이터 분석의 첫 단추는 무엇일까요? 고매한 통계학 박사들이나 분석 전문가들의 의견이 어떨지는 모르겠지만, 제가 현업에 부딪치면서 느낀 것은 여기 저기 산재해 있는 Fact 들과 지식들을 측정 가능한 형태, 즉, 디지.. 더보기