데이터 분석을 효과적으로 사용한 기업 3가지
2000년대 중반부터 미국 IT 기업을 중심으로 빅 데이터를 비즈니스에 활용해 성공한 기업이 주목받기 시작했습니다. 이런 기업들은 사람들의 행동이나 결과를 나타내는 방대한 데이터에서 그전까지 알지 못했던 상관관계를 발견해 가설을 세우는 데 성공했습니다. 많은 사용자의 기호 정보와 행동 정보를 축적한 다음 어떤 사용자와 비슷한 행동을 하는 사용자들의 기호 정보를 바탕으로 그 사용자의 기호를 추측하는 방법을 사용했습니다. 다른 기업보다 먼저 활용하기 시작한 기업은 아마존입니다. 아마존은 사이트를 찾아온 사용자의 속성과 구매 행동, 검색, 페이지뷰, 상품 평가 등의 정보를 분석해서 사용자의 기호 성향을 계산한 다음 구입할 확률이 높은 상품을 추천하는 알고리듬을 구축했습니다. 공급망의 재고 관리에 대해서도 과거 이력 데이터를 바탕으로 판매 추이를 예측했습니다. 고객이 원하는 물건을 재고가 없어 판매 기회를 놓치는 사태를 최소화했고 불필요한 재고를 줄이려는 노력을 기울였습니다. 이런 노력을 뒷받침하기 위해서 아마존은 머신러닝 분야에서 잘 알려진 상품 기반 협업 필터링 기술을 사내에 적용했습니다. 머신러닝은 컴퓨터가 기존의 샘플 데이터에서 유용한 규칙이나 법칙 등의 패턴을 식별하고 학습해서 새로 입력되는 데이터에 대해서도 예측을 실시하게 만드는 기술입니다. 유행 등의 정보를 반영하는 외부 데이터를 결합한 분석 처리 프로세스를 개발했습니다. 이는 곧 아마존이 세계에서 가장 큰 온라인 쇼핑 사이트로 성장하는데 크게 일조했습니다. 아마존의 롱테일 전략이 더 중요합니다. 롱테일 전략이란 상위 20퍼센트가 전체 매출의 80퍼센트를 차지한다는 파레토의 법칙에서 유래했습니다. 낮은 수익성 때문에 외면당하는 하위 80퍼센트의 상품에 주목하는 전략을 말합니다. 롱테일이라는 이름은 파레토의 법칙을 그래프로 나타냈을 때 80퍼센트의 제품이 차지하는 부분이 긴 꼬리처럼 생긴 데서 유래한 단어입니다. 아마존의 상품 기반 협업 필터링은 거의 팔리지 않는 아이템에 대해서도 유사 척도를 통해 잘 팔리는 다른 아이템과의 유사성을 연산해 추정할 수 있습니다. 아마존은 구매량이 매우 적어서 눈에 잘 띄지 않는 아이템도 잠재 고객에게 추천할 수 있습니다. 또한 아마존은 보관 장소를 한 곳으로 모으면서 롱테일을 형성하는 틈새 상품의 재고도 보유할 수 있게 되었습니다. 많은 소매점에서 언제 팔릴지 모르는 상품의 재고를 쌓아 둘 공간이 없다는 고민을 하지 않게 되었습니다. 그로 인해 오프라인 매장에선 팔리지 않는다고 여겨졌던 틈새 상품까지 판매하는 롱테일 전략을 구사해서 관심을 끌었습니다. 미국 플로리다에 있는 디즈니월드는 카네기 멜론 대학과의 인턴십 제도로 유명합니다. 수많은 예비 엔지니어와 데이터 사이언티스트들이 월트 디즈니의 이매지니어링 센터에서 어린아이들의 꿈을 실현해주기 위해 노력하고 있습니다. 디즈니월드의 혼잡함을 해결하기 위해 수학적 모델이나 알고리즘을 이용해 효율적인 의사 결정을 돕는 과학적 기법을 이용합니다. 오퍼레이션스 리서치의 대기 행렬 이론을 이용해서 긴 줄의 심리적인 스트레스를 완화하는데 데이터 분석을 활용하고 있습니다. 대기 행렬 이론은 고객이 계산대 앞에서 줄을 서서 기다리지 않고 서비스를 받을 확률, 행렬의 평균적인 길이, 서비스의 평균 시간 등을 계산하는 이론입니다. 대기 시간이 주는 스트레스를 해결하고자 고객의 동선을 미리 읽고 혼잡해질 기미가 있는 놀이 시설의 동선에 미키마우스 같은 브랜드 캐릭터를 적절하게 배치했습니다. 과도한 혼잡을 피하고 공원 내 놀이 시설의 가동률이 통계적으로 일정할 수 있도록 적절히 제어하면서 만족도를 떨어트리지 않고 공원을 운영하는 방식의 하나로 이루어지고 있습니다. 최근에는 공원을 찾아온 사람에게 지급되는 손목 띠에 전파를 이용한 개체 식별 단말기와 스마트폰용 애플리케이션을 연동시켜서 공원 내 레스토랑을 예약하거나 놀이 시설 예약 시스템을 이용할 수 있게 되었습니다. 디즈니는 개인화된 고객 정보를 효과적으로 활용해서 고객에게 감동적인 서비스를 제공하고 차별화된 고객 경험을 제공하려는 노력을 진행하고 있습니다. 매직밴드에는 결제 기능과 호텔 열쇠를 대신하는 기능이 들어있습니다. 그러므로 지갑 등의 귀중품을 가지고 다닐 필요도 없습니다. 앞으로 이런 시스템이 본격적으로 도입되면 여기에 축적된 데이터로 디즈니월드 핵심 고객의 충성도를 더욱 높이기 위한 정책을 만드는데 활용될 예정입니다. 세계 최대의 소매 유통 체인인 월마트는 오랜 기간에 걸쳐서 모아 온 엄청난 판매 데이터와 날씨나 기온 등의 기상 조건, 고객이 구매하는 상품의 조합을 분석했습니다. 이를 통해서 상품 매입과 진열을 최적화했고 매출 증대에 성공한 예로 알려져 있습니다. 페이스북 사용자는 친구의 생일 정보를 얻을 수 있는 소셜캘린더라는 애플리케이션이 있습니다. 이 애플리케이션을 운영하는 회사를 인수했습니다. 그들이 축적한 데이터를 효과적으로 사용하기 위함입니다. 데이터를 분석해서 유의성 높은 구매 촉진 방법인 생일 등의 라이프 스타일 이벤트를 확실히 포착해서 온라인상에서 고객과 접점을 갖습니다. 이를 통해 고객의 시점을 폭넓게 파악하는 전략을 지향함으로써 아마존에 대항하고 있습니다. 그 외에도 소셜 미디어의 활용, 재고 최적화를 위한 분석, 센서 데이터 활용 등이 앞으로 효과적인 수단이 될 것으로 파악됩니다. 비즈니스 이외의 영역에도 재미있는 사례가 있습니다. 구글은 사용자가 입력하는 수백억 개의 검색어와 정부가 공개한 계절성 인플루엔자의 통계 정보를 예측 모델로 분석한 결과 인플루엔자가 유행하는 지역을 실시간으로 특정할 수 있음을 증명했습니다. 또한 2012년 미국 대선에서는 통계 전문가가 다중 회귀 분석 예측 모델을 만들어서 50개 주의 선거 결과를 전부 적중시켰습니다.