운용 최적화
실천과 검증을 반복하며 시행착오를 통해서 업무의 시점에서 운영을 최적화하고 고도화하는 작업이 필요합니다. 지역 특성과 실제 매출 데이터를 대조해서 지역 특성에 따른 인기 상품 예측 모델을 구축했습니다. 거기에 물류 정보를 가미해서 재고 관리비를 압축할 수 있도록 선형 계획법으로 최적화한 일별 배송 계획을 만들자고 제안했습니다. 이를 토대로 가설 만들기를 시작했습니다. 집약 단위를 시간별 판매 실적에서 일별 판매 실적으로 수정했습니다. 목적인 배송 계획 최적화를 착지점으로 작업을 진행할 경우에 시간대 예측은 의미가 없다고 판단했습니다. 데이터 항목 정의의 형식과 단위 검토, 분석 대상 테이블을 생성하기 위해 원천 시스템의 조사와 데이터 추출 의뢰 등을 진행했습니다. 초기 이행 데이터 대상 테이블의 선정이나 배열 변화 처리와 이행 검증 등 여러 부서와 조정할 필요가 있는 작업도 진행했습니다. 출력되는 결과의 타당성을 확인하고 피드백을 계속해서 각 부서에 대한 조정 사항을 정리하는데 힘을 쏟기도 했습니다. 이런 작업들을 거쳐서 다변량 해석 소프트웨어의 데이터 프로시저를 사용했습니다. 지역이나 채널별 발주량의 월간, 일간 추이를 바탕으로 분포의 큰 틀을 확인해서 시험 검증을 통해 각 배송 창고의 재고 최적화 분석 효과를 반복해서 측정했습니다. 프로젝트팀은 전국의 배송 패턴을 즉일 배송, 격일 배송, 주차 배송, 발주시마다 배송 등을 분류하는 것이 타당하다고 판단했습니다. 네 가지 패턴의 특성에 따라 배송 계획을 세우고 현장의 실천을 통해 효과가 있는지 계속 검증했습니다. 이 모델이 전부라고 생각하지 않고 지속적으로 손을 보면서 새로운 이론을 도입하려고 노력했습니다. 데이터 분석은 여러 사람의 힘이 모일 때 성립하는 작업입니다. 모델은 하나의 판단 기준에 불과하지만 경험과 감만으로는 이끌어 낼 수 없는 힘이 있습니다. 처리 엔진의 통계적 유의성이 인정되고 배송 계획이 실무적으로 큰 이익을 가져다준다는 결론에 이를 수 있었습니다. 유의성을 시험하기 위해 현장으로 갔습니다. 데이터와 현장의 식견을 바탕으로 구축한 가설을 현장에서 시행하며 가설의 타당성과 방법에 대한 검증을 거듭해야 합니다. 운용을 최적화하는 과정에서도 현장을 중요시해야 합니다. 데이터 분석의 목적은 데이터와 현장의 식견을 바탕을 과제 해결을 위한 가설을 세우고 그것을 실행 가능한 현실적인 답을 반영해서 정량적인 효과를 최대한 높이는 데 있기 때문입니다. 가설을 현장 운용에 반영할 때 중요한 것은 현장의 경험치나 감 같은 암묵지를 데이터 분석으로 증명된 형식지로 보충한다는 생각입니다. 분석팀과 현장이 하나가 되어 최적화된 새로운 업무 프로세스로 도착지점에 도달해야 합니다. 어느 고객이 회사에서 로지스틱 회귀 분석의 매출 고객 타깃 모델을 도입했는데 현장에서 활용되지 않아 난감하니 도와달라고 요청한 일이 있습니다. 조사를 진행해 보니 회사의 인사 평가 제도는 전적으로 상품을 판매한 수량만을 평가에 반영하고 있었습니다. 매출 고객 타깃 모델의 분석 결과는 단품 판매로 끝내지 않고 고객의 속성에 맞춘 접근법이 유용함을 보여줬습니다. 그러나 인사 평가 제도에 반영하지 않아서 현장에서 활용되지 않았던 것입니다. 대표적인 개선책으로는 단순히 단품 판매 건수로 평가하는 것이 아니라 판매 후 지원이나 새로운 서비스 등 부가 가치를 높이지 못하면 가중 평균을 적용해 평가를 낮추는 등의 방법이 있습니다. 운용의 최적화로 연결할 방법을 생각하지 않으면 현장의 의식은 쉽게 바뀌지 않습니다. 데이터 분석 프로젝트에 관여할 때 반드시 인사 평가 제도를 바꾸도록 제안합니다. 관리 프로세스 자체를 바꿔야 할 경우도 생깁니다. 검증과 개선의 사이클은 끝없이 진행되어야 합니다. 예측 모델이나 업무 프로세스는 아무리 시간과 노력을 부어도 운용하는 과정에서 다시 만들거나 재검토를 진행해야 합니다. 예측 모델을 시스템화해서 현장에 도입하는 데 성공했으면 검증과 개선의 사이클을 돌리는 과정에 들어가게 됩니다. 작은 성공에 안주해서 개선하려는 의욕을 잃어버리거나 시원치 않은 결과가 나와 프로젝트 자체가 산으로 갈 때가 있습니다. 도착점인 경영 과제의 해결에 가까이 다가가기 위해서 목표는 KPI를 달성해 가면서 새로운 과제를 찾아내서 개선으로 연결해야 합니다. 데이터나 예측 모델, 시스템, 조직, 운용 중에 어딘가에 문제가 있다고 인식해야 합니다. 변화가 심한 비즈니스에서 하나의 모델이 아무 문제없이 가동되기는 쉽지 않습니다. 검증을 통해서 작은 수정을 진행하면서 프로젝트가 올바르게 진행될 수 있도록 지원해야 합니다. 데이터 분석팀과 현장이 서로 협력하면서 사태를 좋게 이끌어야 함은 당연한 말입니다. 장기적으로는 머신 러닝이나 정답 데이터를 활용해서 예측 모델의 정확도를 자동으로 향상하는 기술 기반의 확립을 시야에 둬야 합니다. 프로젝트를 단계적으로 확대해 나가는 방법도 계속 검토해야 합니다. 데이터 분석의 성과가 나타나면 주위에는 파급 효과가 생깁니다. 회사 차원의 프로젝트로 성장하면 경영 과제의 해결이라는 최종 목적지에 도착할 수 있습니다. 계속되는 데이터 분석 그 자체가 힘이 되는 시점입니다. 지속적으로 데이터의 결과를 현장에 반영해서 수정하는 태도야 말로 진정한 데이터 사이언티스트가 지녀야 할 중요한 덕목이라고 할 수 있습니다. 앞으로 데이터 분석을 기업 경영 과제 해결을 위해 도입하고자 하는 회사나 실무자들은 항상 이를 유념하여야 할 것입니다.