menu

KT  스마트 블로그

검색페이지
  • 카카오톡 공유






구글은 인프라 기술에서 클라우드로 이젠 분석 솔루션으로 확대하고 있음


 포스트 닷컴의 기술 전문 칼럼니스트, 데이브 파인라이브 (Dave Feinleib)가 공개한 빅데이터 업계 지도를 보면, 구글은 인프라(플랫폼)와 분석 툴을 모두 가지고 있음





 


구글은 자체 인프라 개선을 통해 플랫폼 진화 방향 선도


 빅데이터 플랫폼은 빅데이터 기술의 집합체로 기술을 잘 활용하도록 준비 된 환경임

 오픈 소스 하둡(hadoop)의 근간이 된 논문을 발표한 구글은 빅데이터 플랫폼의 대부

 빅데이터 플랫폼 인프라의 발전을 유도한 구글은 데이터 분석 솔루션 개발에 집중


 



구글 대표 빅데이터 활용 사례인 독감 트렌드, 1.0 수준


  미국 질병 통제 예방 센터 데이터와 비교 결과 구글 예측의 신뢰성 높게 평가(NYT 등), 구글은 2008년부터 ‘독감 트렌드’라는 독감 예측 서비스를 선보이고 있음.

  ‘13년초 미 50개주 중 47개에 퍼진 ‘살인 독감’에 대해 구글 트렌드가 질병 통제국(CDC) 수치의 두 배 넘는 예상치를 발표하자, 2009년 논문 발표를 통해 상관 관계를 인정 했던 네이처가 빅데이터 분석 결과가 항상 옳은 건 아님을 인정(Nature, ‘13.2)

 



3V의 특성을 가진 빅데이터 1.0, 2.0으로의 진화 기대


 3V의 진화 방향은 실시간 처리 속도, 처리 방식의 다양화, 관계형 데이터 모델 지원 

 - 구글에서 보듯이, 일괄 처리에 의한 결과 대기 아닌 즉각적 실시간 빅데이터 처리, 분할 병렬 처리 및 병합 후 단순 데이터 처리 아닌 대규모 계산 등의 일반 연산 처리, 스키마 없는 단순 모델 아닌 관계형 데이터 모델 등


 현재의 오픈 소스 하둡의 한계를 일부 극복해 나가는 상용 빅데이터 플랫폼 등장 기대

 






기존 사업에서 기존의 문제들을 해결해 주는 빅데이터


 산업의 효율성을 돕는 빅데이터 (WSJ, 2012. 6.14; 박성민 외 재인용 2013. 4. 10)

- 미국의 유통 업체인 시어스(Sears)는 실시간으로 점포별 재고, 경쟁업체가격, 날씨 예보, 고객 정보 등을 분석하여 최적 가격 책정 및 재고 관리

 



기존 사업에 신규 사업 가능성을 제시해 주는 빅데이터


● 건강(Healthcare)을 돕는 빅데이터 (”Big data in health care hype & hope” 2012)


- 천식 환자를 트래킹 하고 정보를 수집, 이를 활용하는 Asthmapolis (천식나라)

 : 모바일 센서를 천식 흡입기에 부착하고 iOS/ Android 앱을 통해 증상, 시간, 위치를 모니터링. 제공자는 위험 환자 식별 외에 역학 연구 및 공중 보건에 활용할 수 있는 실시간 데이터를 수집


- SNS를 통한 질병 관측 지도를 보여주는 Sickweather (아픈 날씨)

 : SNS를 스캔하여 질병 발생을 추적하고 날씨 예보처럼 사용자들에게 예보해 줌. 사용자들은 자신의 지역에 어떠한 일이 일어나는지를 입력할 수도 있고, 저렴한 가격으로 약품 광고를 지원 (현재 영어권만 지원 중)

 



신규 서비스 경쟁, 신규 아이디어를 제시하는 빅데이터 자료

 

● 사회 생활, 남녀 만남 등을 돕는 빅데이터 (함유근,채승병, 빅데이터 경영을 바꾸다 2012)

 - 태그드닷컴은 특히 관계 정보 데이터를 분석, 실시간 맞춤형 데이팅 서비스를 제공. 

   2004년 시작하여 2011년 현재, 220개국, 3억의 멤버를 가지게 됨 (2008년 흑자)

  서비스는 새로운 사람들과의 만남에 초점, 소셜 게임, 가상의 선물 등을 활용하게 함







빅데이터 1.0 한계를 극복하게 하는 빅데이터 2.0 요소


● 딜로이트 애널리틱스 연구소의 바이브카난드(Vivekanand) 교수 등은 단순히 빅데이터를 수집하고 이해하는 빅데이터 1.0 에 머무르지 않고 기업의 의사 결정 과정에 적극적으로 통합 해 내는 빅데이터 2.0으로 나아갈 때 기업이 희망하는 가치를 얻어낼 수 있다고 주장



 자료: Big data 2.0 by Deloitte(2013)

빅데이터 1.0 가치는 원하는 대상을 전수 분석해서 분류하고 이해하는 기본 특징에서 온다.


[빅데이터 2.0의 핵심 3대 요소]

바이브카난드(Vivekanand) 등은 빅데이터 2.0 3대 핵심 요소 제시

1)Shaping customer behavior :

고객 행동에 거꾸로 영향을 미치는 것. 빅데이터 1.0에선 고객 소리를 분석해 호불호를 판단했다면, 2.0에서는 기업이 통제하는 전략 수단이 고객 행동에 미치는 영향을 분석, 거꾸로 고객 행동을 통제할 수 있다. 

2)Creation of new product or service : 

신상품/서비스를 창출. 기업이 데이터 분석을 통해 얻어낸 인사이트는 내부 효율성 제고 이상으로 추가적 기회를 만들어 낼 수 있다.

 3)Ecosystem view of data : 

생태계와 같이 데이터 범위를 확장. 빅데이터 분석 가치는 기업 외부에 널려 있는 데이터를 매우 공격적으로 결합해 인사이트를 넓혀가는데 있으며, 데이터 보유 주체간의 윈윈 모델로 데이터 범위 확장이 가능하다.



딜로이트가 제시한 빅데이터 2.0 사례인 컴포트델그로


 싱가폴의 택시 회사인 `컴포트델그로(ComportDelGro)`는 빅데이터 1.0 ->2.0 가치 실현

 기존 사업 기존 문제점 해결은 1.0 수준이며, 고객 행동 개선, 신사업 창출은 2.0에 속함





콜센터 기반으로 일일이 고객의 택시 호출에 대응하던 것을 차량 GPS와 고객 위치 데이터를 결합 한 빅데이터 분석으로 실시간 자동 매칭에 성공. 이를 통해 이 회사는 연간 2천만 건 호출을 처리. 문제는 그 후 발생. 빅데이터 기반 호출 시스템을 위해 6천만 달러가 투자됐고, 유지 보수 비용도 만만치 않았지만 수요가 따라 주지 않아 효과 미미



1) Shaping customer behavior : 기업의 전략적 수단이 고객 행동에 미치는 영향을 분석해 거꾸로 고객 행동을 통제한 이 기업은 고객 호출이 지역, 시간별로 달라지는 패턴을 분석, 이에 기반해 요금 체계를 변동.

2) Creation of new product or service : 데이터 분석을 통해 얻어낸 인사이트를 내부 효율성 제고 외에 추가적 사업 기회 창출에 활용 시간별 호출 이력과 운행 이력을 결합하고 실시간 GPS 데이터를 통합해 만들어 진 교통 혼잡 예측 모형은 자사 차량에 제공되어 `싱가폴에서 가장 빠르게 목적지로 이동하는 택시` 라는 평판을 만들었고, 다른 회사에도 제공되는 단일 상품 역할을 하게 됨.

3) Ecosystem view of data : 기업 외부에 널린 데이터를 공격적으로 결합해 인사이트를 넓혀가는데 있다고 본 이 기업은 데이터 보유 주체 간 윈윈 모델로 데이터 범위 확장


빅데이터2.0 : 1) 고객 행동을 개선 시킨 사례 : 넷플릭스

● 비용 절감 목적의 예측 분석 결과가 고객에게 혜택이 된 사례로 분석치가 넷플릭스의 셀링 포인트가 됨. 고객이 과거에 대여한 영화 목록과 시청한 영화에 부여한 평점 등의 데이터를 분석하는 영화 추천 시스템인 시네매치 (Cinematch) 개발


- 넷플릭스는 이를 기반으로 매출의 80%를 추천에 의해 발생시켜 효율성 증대 (1.0)

- 고객은 개인별 맞춤형 영화 콘텐츠를 제공 받게 되면서 더욱 적극적으로 이를 활용 (2.0)

- 크라우드 소싱으로 개발자에게 더 나은 빅데이터 분석 툴 공모

- 고객 선호 작품 특성을 파악 해 흥행 작품 기준 마련 




빅데이터2.0 : 2) 신상품/서비스 창출 사례 : 스티치픽스


미국의 스타트업 ‘스티치픽스 (Stitch Pix)’는 빅데이터 분석을 통해 소비자들에게 맞춤형 패션 스타일을 제안, 즉 온라인 퍼스널 스타일링 서비스를 제공.-일반 소비자들이 자신의 스타일을 잘 모르고, 옷 고르는 것을 어려워 한다는 점을 착안해 추천 서비스를 창출. 빅데이터 분석을 통한 추천 결과에 소비자들의 만족도가 생각보다 높지 않다는 점을 발견. 


즉, 아무리 많은 데이터를 분석하고, 훌륭한 추천 알고리즘을 만든다 해도 사람의 취향을 100% 맞춘다는 것은 어려운 일임을 인식.이 때문에 이 회사는 분석 엔진이 내놓는 추천 결과에 100% 의존하지 않고, 분석 결과와 스타일 리스트의 큐레이션을 병합해 추천 목록을 만든다. 특히 단순히 추천에서 끝나는 것이 아니라 1벌의 옷을 주문한 고객에게 5벌의 추천 옷을 보내고, 고객이 선택한 옷을 제외한 나머지 4벌의 옷을 회수하는 전략.추천 엔진 개발의 목적이 엔진 구축 자체가 아님을 시사 스티치픽스의 경우 100% 빅데이터 기반 접근법을 취하는 것이 아니라, 빅데이터가 실행을 위한 보조




빅데이터 2.0 : 3) 데이터의 범위를 확장한 사례 : 윔블던


2012년 6월 25일 윔블던 대회 등장한 IBM 슬램트래커는 예측 분석 기술로, 실시간 진행 상황 파악은 물론, 주요 상황과 전환점, 그 배경을 시각적으로 파악케 하는데 도움을 줌


- 슬램트래커 내 탑재 된 '키 투 더 매치(Keys to the Match)'는 과거 대회 기록, 실시간 데이터를 동시 활용, 시합에 임하는 선수의 최우선 과제 제시 

- IBM 제공 세컨드 사이트는 움직임 추적 기술로 클라우드에 선수 움직임이 기록된 후 분석 및 시각화해 신속하게 제공됨








빅 데이터 2.0의 3대 핵심에 주목한 한류 경쟁력 강화 방향


● 고객 행동에 거꾸로 영향을 미치게 하라 (Reshape & recreateCustomer behavior)

- 빅데이터 활용에서 나온 가장 큰 인사이트는 주위를 돌아 보고 내 고객에게 가치를 제공하는 것이며, 고객의 시각에서 봐야 함

- 대표 미디어 기업은 넷플릭스와 아마존 -> 한류 플랫폼에 적용

- 온라인 외에 오프라인과도 연계 가능 -> 한류+ 테마파크/호텔

ex) 월트디즈니 월드파크앤리조트는 테마파크, 호텔 재방문 유도


● 분석 결과를 토대로 신상품과 서비스를 개발하라 (Create new product & service)

- 데이터 트래픽이 몰리는 곳을 발견하여 전략적 포지셔닝이 가능

- 대표 산업군은 통신, 미디어, 엔터테인먼트 영역이며 고객 관련 360도 각도의 데이터 수집이 요구됨(프로필, 거래, 온라인 이용) ->콘텐츠 이용 데이터 수집으로 한류 날씨 등 신규 BM 개발

ex) 싱가폴 통신 업체 연합과 신문 업체 연합 간 제휴로 LBS 광고


● 비즈니스 인사이트 축적을 위해 데이터 범위를 확장해 나가라 (Extend data source)

- 데이터에 대한 생태계적 시각 및 협력이 데이터 확장성에 필요

- 기업간 협력 모델 : 한류기업+ 미디어 플랫폼, 자동차 플랫폼

- 기업과 공공 기관간 협력 모델 : 한류 기업+ 기상청, 교통 기관

- 산업내 이해 당사자간 협력 모델 : 음악 제작사+작가 협회+SP

- 공공 데이터 개방이 전제되어야 함 (실시간 센서 데이터 중요)


디지에코 원문 보기(click)





  • KT 멤버십
  • 디바이스
  • 추천 VOD
  • 5G Today
상단으로 이전 페이지로