BOOK(IT, 데이터분석)

데이터 문해력 (part 1,2)

nova-unum 2022. 7. 14. 12:58

데이터 문해력  - 카사와기 요시키 지음, 강모희 옮김

 

1. 앞으로 필요한 건 데이터 문해력 : 분석보다 활용

 

중요한 것은 앞으로 자신에게 필요한 기술이 무엇인지 아는 것

 "기계에 맡길 수 있는 일", "맡기는 편이 더 나은 일", "기계가 할 수 없는 것", "사람이 해야 하는 것"을 구별하고 , 후자를  닦아 자신에게 필요한 형태로 효과적으로 활용해서 최대한의 결과물을 창출하는 것을 목표로 삼는 것입니다.

 

데이터 활용에 필요한 3가지 

생각하고  (1) 분석 전에 문제 및 목적을 정의하고 가설을 구축 -> Input

작업하고 (2) 분석을 위한 기술과 지식

생각한다 (3) 분석 결과에 대한 해석 및 스토리 구축 IOO -> Output

 

반드시 습득해야 하는 기술이 무엇인지 다시 확인한다.

'작업한다'라는 부분은 바로 기계가 사람보다 압도적으로 빠르고 정확하게 처리 가능한 내용입니다.

사람이 가치를 창출할 수 있는 것은 '생각'의 부분, 즉(1)과 (3)에 해당됩니다.

 

이 책에서는 (1)과 (3)을 고부가가치 기술을 가진  '데이터 문해력(literacy)'이라고 정의하고, 이를 깊이 있게 파고들고자 합니다.

 

데이터를 먼저 보지 마라  - 데이터 안에 답은 없다

 

"이 그래프를 통해 무엇을 말할 수  있을까요"? 가 아니라, 

"이 그래프를 작성한 사람은 (그래프 작성 전에) 무엇을 말하고 싶었을까요?

 

전자는 '데이터와 그래프 중심의 사고'를 전제로 한 질문으로 누군가가 만든 데이터와 그래프를 읽어내는 것만 추구하는 것입니다. 후자는 '목적 사고력'이라 할 수 있습니다. 데이터 작업 전에, 애당초 무슨 말을 하고 싶은지(무엇이 알고 싶은지)를 생각해보고 이에 필요한 데이터를 활용해 작업을 진행하는 접근 방식입니다. 

 

"당신이 무엇을 알고 싶은지, 이를 알게 되면 무엇을 하고 싶은지, 이를 위해서는 어떤 데이터(지표)가 필요한지" 이를 구체적으로 생각하는 것이 무엇보다도 중요합니다.

 

'알고 싶은 것, 

말하고 싶은 것(목적)

해결하고 싶은 것(문제)이 명확해야 한다.

 

"데이터 안에는 해답 따위가 존재하지 않는다."

(1) 데이터를 적절하게 분석하면 문제와 목적, 결론이 나올 것으로 생각한다(이것은 본래 분석자 스스로가 생각해야 하는 것)

(2) 눈앞의 데이터를 적절히 가공하면 뭔가 유용한 정보를 얻을 수 있을 것으로 생각한다. 아무것도 안 나오게 되면, 분석 방법에 문제가 있다고 생각한다.

 

미래에 정말 필요한 지식이란?

 고등학생이나 대학생처럼 미래에 가치 있는 성과를 내고 살아남기 위한 무기를 습득할 필요가 있는 사람과 이를 가르치는 선생님들은  '방법론이나 지식'또는  '그 활용법'중 어떤 것이 필요한지 먼저 확인하는 것이 중요합니다. 예를 들면 글로벌 환경에서 필요한 소통을 할 수 있을 것이 목적인 경우 영어 단어와 문법만을 공부해서 과연 목적 달성이 가능할까?라는 질문과 같습니다.

 단어와 문법은 최소한으로 공부할 필요가 있으나 더 중요한 능력은 바로 그것을 제대로 구사해서 소통할 수 있어야 한다는 것입니다. 그러한 능력을 키우겠다고 단어와 문법만 더 파고든다면 결국은 실현할 수 없습니다. 

 

책에서 말하고자 하는 데이터 활용 프로세스

목적/문제정의 : (겉으로 드러난 현상) -> 목적 및 문제를 정의 -> 지표를 결정 -> 

현상파악/평가 : 현재 상태를 파악 -> 평가

원인 : 원인을 분석

방법 : 해결 방안을 모색


2. 올바른 데이터로 올바른 문제를 풀고 있는가?

목적 사고력 : 목적에 맞게 문제와 데이터를 연결하기

 

데이터 활용에 실패하는 두 가지 이유!

. 주요 원인 1 : 풀고자 하는 문제가 명확하지 않다.

 - Are you solving the right problem?

. 주요 원인 2 : 정의한 문제와 사용하는 데이터가 일치하지 않는다.

- Are you using the right data?

 

데이터 활용의 성공과 실패를 가늠하는 정반대의 접근법

. 무엇을 어떻게 해야 할지 전혀 모르는 사람

. 데이터 분석에만 시간을 할애하는 사람

데이터를 가공한다 -> 데이터에서 무엇을 알 수 있을지 생각한다.

'이 데이터 어떻게 분석할까' 를 생각하는 사람은 How-to(방법론)만을 생각하는 상태로, '수단'에 지나지 않는다. 

. 데이터에서 필요한 정보를 획득할 수 있는 사람.

. 데이터 분석을 효율적으로 하는 사람

데이터에서 무엇을 알 수 있을지 생각한다 -> 데이터를 가공한다. 

 

풀고자 하는 문제가 명확하지 않다.

 - Are you solving the right problem?

'어딘가에는 절대적인 정답과 진리가 있고 그것을 어떻게 찾아낼 수 있을까'라는 생각에 빠져 있을 수 있다.

그런데 이런 사고방식으로는 현재와 미래에 통하지 않는다는 것이 큰 문제이다. 자신이 알고 있거나 생각해낸 것뿐만 아니라, 광범위하고 객관적인 주장을 합리적으로 전달할  수 있는 효과적인 도구(무기)가 바로 데이터입니다.

절대적인 정답이 존재하지 않을 때, 여러분은 자신의 생각을 무엇으로 논리적이고 객관적으로 상대방에게 전달하고 이해시킬 수 있을 까요? 자신의 결론으로 이끌어 내는 이야기를 만드는 능력이 앞으로 더욱 중요해진다는 것은 더 말할 필요도 없습니다.

가장 먼저 해야 하는 작업은 '목적과 문제에 대한 정의'

데이터 활용에서 먼저 해야 하는 작업은 '목적과 문제를 정의하는 ' 것입니다.

. 나는 무엇을 알고 싶은가

. 나는 무엇을 해결하고자 하는가

이 두 가지를 명확히 하는 것에서부터 활용 프로세스는 시작합니다.

목적과 문제를 정의할 때 확인해야 할 포인트 두 가지

포인트 1 : 사용된 언어가 구체적이고 명확한가?

무엇이 문제이며 구체적으로는 어디 사는 누가 어떤 식으로 곤란에 처해 '문제'가 발생한 것인지, 이점을 명확하게 해야 합니다. 

 정답은 없습니다. 그러나 자신이 무슨 말을 하고 싶은지 구체적으로 정의하는 것은 데이터를 활용할 때의 필수 조건입니다. 왜내하면, 문제를 정의하는 방법에 따라서 활용하게 될 데이터가 달라지기 때문입니다. 자신이 말하고 싶은 것이 구체적으로 정해지지 않은 상태에서 작업을 진행하게 되면, 어떤 데이터를 사용했느지에 따라 각각의 문제에 영향을 줄 뿐만 아니라, 결과물에서도 가장 중요한 전체적인 스토리 구조가 모호해지게 됩니다. 

포인트 2 :  '문제' , '원인' ,  '해결 방안' 을 구분하고 있는가?

. '문제'가 무엇인가

. 그 문제를 일으키는 '원인'은 무엇인가

. 그 원인에 대한 '해결 방안'은 무엇인가

'해결방안'은 문제를 일으키는 '원인'을 규명해서 이에 대한 '방안'을 적절하게 마련하는 것입니다. 

목적 및 문제를 정의 할 때 주의할 점 3가지

문제 -> 원인 -> 해결 방안

 

'문제 정의'에 대한 사례

(A) 인재 파견 회사 사례에 대한 토론

"사무직 제안이 많은 회사라는 이미지 때문에, 제조업종 관련 인재풀 확보가 어렵다"

"보유했던 양질의 인재가 점점 직접 채용이 되는 바람에, 인재 풀이 점점 줄어들고 있다"

 첫 번째 정의를 보면, '제조업종 관련 인재 확보가 어렵다'라는 '문제'와 '사무직 관련 제안이 많은 회사라는 이미지가 생겼기 때문에 '라는 문제의 '원인' 이 섞여 있습니다. 데이터라는 객관적인 정보를 이용해서 '문제'의 '원인'을 규명하고 그 해결 방안을 수립하고 자 하는데, 시작도 하기 전에 주관적인 자신의 추측(사무직 관련 제안이 많은 회사라는 이미지가 생겼다)을 가지고 원인을 단정짓는 것은 바람직하지 않습니다. 

 '제조업종 관련 인재 확보가 어렵다'라는 말보다 구체적으로 어떤 문제가 일어나고 있는지 제시하는 것이 더욱 명확한 문제 제기입니다. 예를 들어, '제조업종 관련 채용 정보를 많이 올리고 있는데 그 수요를 충족시킬 인재가 충분하지 않아서 기회 손실이 막대하다'라는 것은 어떨까요?

 이 경우 제조업 관련 채용 정보 수를 자사의 인재 풀 수와 비교하고 이를 다른 업종과 다시 대조해본다면 듣는 사람도 '그게 문제군요!라고 말할 수 있습니다.

그리고 '인재 풀이 점점 줄어들고 있다'라는 것은 겉으로 드러나는 형상에 지나지 않습니다. 우리 눈에 보이는 현상으로 인해 어떤 곤란한 점이 있는지, 무엇이 '문제'인지 명확히 하지 않는다면 상대방을 제대로 이해시킬 수 없습니다.  이 상태로 진행하게 되면 그저 '인재 풀 수'의 추이를 그래프로 보여준 다음, '보세요, 하락하는 것이 문제네요'라는 결론에 도달할 수밖에 없습니다. 

(B) IT 기업 사례에 대한 토론

"인재 부족으로 효율적이고 효과적인 영업 활동을 못 하고 있다."

"작업 효율화를 높여 구조 조정을 하고 싶다."

 첫 번재 정의에 따라 '효율적이고 효과적인 영업 활동으르 못 하고 있다'를 '문제'로 설정한 경우, 그 문제 정의 안에 이미 '인재 부족'이라는 '원인'이 뒤섞여 있습니다. 그런데 그 원인이란 것이 현시점에서는 '가정'이나 '가설'에 지나지 않습니다. 스스로가 그 원인이 가정이라는 것을 인식하고 그 이외의 원인을 찾아보고자 한다면 큰 문제가 되지 않습니다만, 대체로 그렇지 않다는 것이 필자의 생각입니다.

 그리고 '문제'란 대체 무엇일까요? '효율적이고 효과적인 영업 활동을 못 하고 있다'라는 것이 가장 곤란한 점일까요?

'효율적이고 효과적인 영업 활동을 못 해서 '어떤 곤란한 점이 생겼는데 제시하지 않는다면 상대방은 그 문제의 심각성을 알 수 없습니다. 

 '문제'란 '수주 수가 급감했다'이며, 그 '원인'은 '고객 상담 및 대응부실'일 것입니다. 그러면, 원인에 대한 '해결 방안'은 '효과적이고 효율적인 영업 활동'이라는 구조가 성립됩니다. 어떤 것이 옳고 그른 것인가 따지지 말고, 일단 머릿속으로 이러한 삼자 관계를 정리하고 이해할 필요가 있습니다. 그리고 무엇을 '문제'로 삼고, 어떤 데이터를 활용할지 결정해가는 것이 중요합니다. 

 두 번째 정의인 '작업 효율화를 통해 구조 조정을 하고자 한다'의 경우에도 대동소이합니다. '작업 효율화'란  '구조 조정'이라는 '목적'을 위한 '해결 방안'입니다. 방안을 제시하는 것 자체가 문제라는 말이 아니라, 목적과 문제를 정의하는 시점에서 이미 결론을 내버리는 것이 위험부담이라는 뜻입니다. 

 구조 조정을 하는 수단이 비단 ' 작업 효율화'만 있는 것은  아닙니다. 만약 문제를 해결하기 위한 접근 방식을 취하고 있다면, '구조 조정이 예정대로 진행되지 않는다'를 '문제'로 설정하고  그 '원인'에 대해 생각해본 다음, 그 원인 중 하나에 대한 '해결 방안'으로서 '작업 효율화'를 제시하는 것이 자연스럽고 알기 쉬운 흐림입니다.

 그 외에도 '구조 조정'을 '목적'으로 설정하고, 효과적인 '해결 방안'을 몇 가지 제안한 다음(그중 하나가 '작업 효율화'), 그 타당성과 효과 등을 데이터로 나타내는 것도 가능하다. 

 문제를 정의하는 시점에서 구체적인 '원인'을 규명하고 '방안'을 수립하는 것은 불가능하며, 이는 데이터를 활용해서 나중에 할 일입니다. 물론 가설이나 가정을 세우는 것 자체는 좋지만, 자신의 편견이 들어가게 되면 상황을 정리하기가 어렵기 때문에 가급적 피하기 바랍니다. 

(c) 물류 기업 사례에 대한 토론

"유연한 근무 환경을 도입하기 위해 필요한 내용을 제안하고자 한다."

 '유연한 근무 환경을 도입하기 위해'라는 목적이 나타나 있으니 언뜻 괜찮아 보입니다. 그럼 만약 이 상태로 데이터 활용 프로세스에 들어간다면, 어떤 문제에 직면하게 될까요? 자율 출근제, 유연근무제 등을 도입한 기업의 데이터, 재택이나 원격 근무를 활용 중인 IT 기업의 데이터 등을 먼저 살펴보게 되리라 생각합니다. 혹은 은퇴한 사람이나 다양한 경력을 가진 임직원으로 구성된 조직의 시스템, 도입사례 등을 보고 효과를 설명할 수도 있을 것입니다.

 '유연한 근무 환경'이란 어떤 것인지 명확하지 않은 상태에서 구체적인 데이터를 활용하기란 매우 어렵습니다. '유여한 근무 환경'이란 말 속에는 시간의 유연성, 임직원 채용의 유연성, 역할과 평가제도의 유연성 등 다양한 요소가 포함되어 있습니다. 어떻게 정의하느냐에 따라 사용할 데이터도 달라지며, 조사할 사항 또한 바뀌게 됩니다.

'구체적인 데이터를 이용해서 상대방에게 자신의 생각을 전달한다'라는 목표에서 알 수 있듯이, 말과 표현의 구체성은 매우 중요합니다.

 

연습 문제와 피드백 예시

반년 전부터 시설 전체의 이용자 수가 급감하고 있습니다.

인터넷에서 이용을 촉진하기 위한 프로모션을 적극적으로 하고 있습니다만, 아무래도 효과가 없는 것 같습니다. 그리고 우리 지역인 북부 시설이 남부 시설보다도 상황이 좋지 않습니다.

이용자가 줄어들어서, 수입도 감소하고 있습니다.

데이터를 활용해서 분석할 '문제'는 어떤 것이 있을까요?

ⓐ이벤트 효과에 문제가 있다.

확실히 이벤트 효과에도 문제는 있어 보입니다. 그렇지만 이벤트가 효과적이지 않기 때문에 어떤 문제가 발생하고 있습니까? 그것이 해결해야 할 '문제'이며 이벤트 효과 자체가 그 '원인'이라고 볼 수 있을까요?

ⓑ북부 시설이 어째서 남부보다 안 좋은지 원인을 규명할 필요가 있다.

결과적으로는 이 원인을 알아보는 작업에 착수하게 될지도 모릅니다.  하지만 만약 남북의 차이를 생겨나게 한 원인을 알았다고 했을 때, 그 결과로 무엇을 해결하고자 하는지 명확하게 말할 수 있습니까?  그 원인을 규명하는 것 자체가 '목적'이나 '문제'가 될 수는 없습니다. 그것은 중간 과정이며 방법론에 그쳤다고 볼 수 있지 않을까요?

ⓒ수입 감소가 문제이다.

최종적으로 해결해야 할 문제로서, 매우 좋은 관점이라고 생각합니다. 다만 단어의 정의가 충분히 구체적입니까? '수입'이란 무엇입니까? 그것은 '매출액'을 말하는 것인지, 아니면 '이익'을 말하는 것인지요? 더 자세히 말해서, '순이익'을 가리키는지, '매출 대비 수익률'을 가리키는지요? 너무 세세한 지적이라고 느낄 수도 있지만, 만약 그 문제를 데이터로 증명해 달라고 요청받으면, 어떤 데이터를 활용해샤 할지 혼란스럽지 않을까요?

ⓓ이벤트 내용을 구체적으로 조사해서 점검할 필요가 있다.

자세히 조사한다는 것은 '해결 방안'을 강구한다는 뜻입니다. 그럼 그 '해결 방안'은 어떤 '원인'을 해결하고자 하는 것일까요? 그 '원인'은 어떤 '문제'에 대한 것인지, 전체적인 구조가 정리되어 있습니까?

ⓔ 이용자 수 감소가  문제이다.

이용자 수를 의도적으로 '문제'로 설정하는 것은 일리가 있습니다. 다만, 이 경우 그러한 의도가 있다는 것이 대전제가 됩니다. 만약 최종적으로 해결하고자 하는 것이 '이익 감소'라고 한다면, '이용자 수 감소'는 문제에 대한 '원인'이 되어 버립니다. 어느 쪽을 '문제'라고 생각하십니까?

'데이터를 활용했지만, 정보가 효과적으로 도출되지 않는다.', '데이터 분석을 능숙하게 할 수가 없다'라는 고민도 그 원인을 분석 방법이나 통계에 있는 것이 아니라 대체로 앞선 예와 같이 불충분하고 부적절하게 문제를 정의했기 때문에 발생합니다. 일반적인 문제 해결이나 논리적 사고와 같이 데이터가 사용되지 않을 때에도 본질적으로 같습니다. 

문제를 설정할 때, 항상 자신에게 되물어봐야  합니다.

나는 문제를 명확하게 정의해 풀고 있는가? Are you solving the right problem?

정의한 문제와 사용하는 데이터가 일치하지 않는다.(Are you using the right data?)

 

'지표 불일치 ' 문제 : 와키마치 고등학교 사례

 

주제 : '우리 도시의 지역 진흥과 이슈 해결' 

결과물 A : 순유입률(취업)추이 ,  도쿠시만현 총 취업자 수 그래프

데이터 중심? 목적 중심?

기존 데이터와 그래프를 전부 사용한다면 ' 데이터 중심'이 되며 '데이터를 통해 무엇을 말할 수 있는가'를 열거하게 될 뿐입니다. 데이터 중심으로 분석 작업을 진행하게 되면 억지로 데이터와 결론을 연결 짓는 결과가 되기 일쑤입니다. 결과물을 본 사람도 '결국 무슨 말(결론)이 하고 싶었던 것인지 모르겠다'고 고개를 내저을것입니다.

 

결과물 B : 연금 재정이 불안정 -> 20-30대 정규직 감소 , 국민연금보험료추이, 민간급여실태통계조사결과(평균 수입)  그래프

목적과 문제, 결론이 데이터와 일치하고 있는가?

개별 데이터가 정확하고 객관적이라고 하더라도, 전체 이야기의 연결부를 주관적인 상상으로 만들어버리면 데이터의 객관성과 설득력을 살리지 못하게 됩니다.

 

결과물 C : 농업 후계자 부족, 농가세대원 수, 농업취업자 수, 기간농업종사자 수 동향(판매농가)

표현이 적절한가?

'부족'과 '감소'는 전혀 다른 개념입니다. '부족'이라고 한다면, 수요에 비해 공급이 충족되지 않은 상황으로, 증가와 감소는 상관없는 애기입니다.  공급이 만약 감소했더라도, 수요가 충족되었다면 부족이라고 할 수 없습니다. 말하고자 하는 결론이 만약 정말로 '부족'이라면, 수요와 공급, 양쪽 데이터를 제시해서 이야기해야 합니다. 

 

결과물 A,B,C 는 모두 다음과 같은 공통점을 갖고 있습니다.

①  기존에 있는 그래프를 전제로 결론을 내려 한다.(문제 설정과 주제 파악에 익숙하지 못한 학생이 빠지기 쉬운 오류)

② 앞선의 사고 전개 과정에서 주관적인 해석이 개입한다.

 

'지표 불일치' 문제 : 요코하마 국립대학의 사례

 

주제 : 캠퍼스에 있는 학생 식당 중, 제1 식당의 질을 평가하려 한다.

어떤 지표를 수집하는 것이 좋을까요?

단어 정의가 명확하고 구체적인가?

여기서 말하는 '질'이란 무엇일까요? 예를 들어, '맛', '가격','입지조건','청결함' , '다양한 메뉴'등 여러 가지 해석이 있을 수 있습니다. 그렇다면 '질'이란 단어를 그대로 사용하면 안 되겠죠.  여기선 정답은 없습니다. 합리적인 정의를 제시해서 설득력을 얻는 것이 중요합니다.  

일단 이 주제의 배경에는 '학생 식당'이라는 전제가 있습니다. 경제적으로 여유 있는 편이 아닌 일반 학생에게는 아무래도 '가격'의 우선순위가 높을 것입니다. 수업을 받는 강의실과 식당 사이의 거리가 멀다면 두 군데를 왕복하는 것만으로 시간이 허비되기에  '입지 조건' 또한 학생에게 중요한 항목입니다. 

이처럼 짐작이나 추측이 아니라, 논리적인 설명을 통해 이용할 지표를 결정해야 합니다. 지표를 무조건 하나만 정해야 하는 것은 아닙니다. 필요하다면 복수의 지표를 이용해서 '질'을 나타내고, 더욱 입체적인 평가 결과를 도출할 수도 있을 것입니다. 익숙해서 무심코 사용하는 단어나 표현은 특히 주의해야 합니다.

결론(목적과 문제)과 활용된 데이터가 일치하는가?

강의실과 학생 식당의 '거리'를 평가하려면 어떤 지표가 필요할까요? '킬로','미터' 등과 같은 실제 측정된 지표뿐만 아니라, 도보로 몇 분 걸린다 등의 '시간'지표도 후보가 될 수 있습니다. '다양한 메뉴'를 생각해보겠습니다. 이 경우 '다양함'을 구체적으로 정의할 필요가 있습니다. 단순히 가짓수로 파악한다면, 활용할 지표는 메뉴의 종류와 숫자로 나타낼 수 있지만, 계절이나 요일별로 메뉴가 바뀐다는 것이 다양함이라면, 메뉴의 변경 빈도 등을 지표로 정해도 좋을 것입니다. 

 

도출된 결과를 효과적으로 제시하려면 어떻게 해야 할까?

결론을 도출하는 프로세스와 프레젠테이션 순서

결론을 도출하는 프로세스

(1)  평가 지표 및 기준을 결정  : 어떤 요소와 지표가 더욱 목적에 부합하는가?

(2) 적합한 데이터 및 그래프를 선택 : 어떤 데이터 형태와 그래프가 효과적인가?

(3) 결론 : 결국 무슨 말을 할 수 있는가?

프레젠이션 순서

(3) 결론 : 결국 무슨 말을 할 수 있는가?

(1) 평가 지표 및 기준을 결정 : 어떤 요소와 지표가 더욱 목적에 부합하는가?

(2) 적합한 데이터 및 그래프를 선택 : 어떤 데이터 형태와 그래프가 효화적인가?

 

비즈니스 현장 사례 분석

사외와 관계된 문제

사례1 ~ 5는 고객 응대 개선과 이벤트 효과 등의 회사 외부와 관련된 업무를 진행할 때 자주 발생하는 사례입니다.

사례1

결론 :  고객 불편사항에 대한 개선이 이루어지지 않고 있다.

지표 : 클레임 수

먼저 결론으로 나타내고자 하는 것, 즉 '문제'가 명확한지 확인해봅시다. 사례 1은 표현만 두고 보면 특별히 문제없어 보입니다.  그럼 이를 문제로 설정한 사람의 상황을 살펴보도록 하겠습니다. 과연 풀고자 하는  '문제'가 '개선되지 않은 것'일까요?  '클레임 수'를 지표로 정한 것 자체가, 개선되지 않은 '문제'의 '원인'을 '클레임 수에 의한 것'이라고 단정했을 가능성이 큽니다.  

'개선되지 않는 것'이 '문제'인지, '클레임이 많은 것'이 문제인지를 본인이 먼저 명확히 하는 것이 중요합니다. '개선이 잘되지 않고 있다'라는 문제를 직접적으로 드러내는 지표는 클레임 수 대비 개선 수(비율)등이 적절하리라 생각합니다.  그리고 그 '원인'을 따져볼 때는 , 클레임 수와 고객 응대 인원, 효율 등과 관련된 지표를 살펴보면 좋을 것입니다.

 

사례2

결론 : 광고에 대한 반응이 적다

지표 : 문의 수

'광고에 대한 반응'을 좀 더 구체적으로 정의해아 합니다. 지표로 설정한 '문의 수'는 반응의 일부만을 나타낸다고 볼 수 있습니다. 지표로 설정한 '문의 수'는 반응의 일부만을 나타낸다고 볼 수 있습니다. 다만, 문의가 많다고 반응이 좋다거나, 적으면 나쁘다거나 하는 것은 적절하지 않습니다.  예를 들어, 문의 중 대다수가 광고 내용이 불명확하기 때문에 들어왔다면 반응과는 별개의 문제이기 때문이다. 

 

사례3

결론 : 직원 채용이 한 인재 파견 회사에만 치우쳐 있다.

지표 : ???

풀어야 할 문제가 무엇인지를 어떻게 정의하면 될까요? 현재 드러난 현상은 '하나의 인재 파견 회사에만 치우쳐 있다는'것입니다. 그런데 그 탓에 어떤 곤란한 점이 생겼으며, 풀고 싶은 '문제'는 무엇인지가 명확하지는 않습니다. 따라서 어떤 지표를 사용하는 것이 좋은지 물어봐도 딱히 답을 하기가 어렵습니다. ' 한 회사에만 치우쳐 있는 상황'을 어떻게 데이터로 나타낼지에만 초점을 맞추고 있기 때문입니다. 

 먼저 '한 회사에 치우쳐 있기 때문에 어떤 문제가 생겼는지'를 명확히 하고 이를 '문제'로 정의해야  활용할 데이터를 적절히 선택할 수 있습니다. 예를 들어, '비슷한 경력을 가진 사람만 지원하고 있다'라거나 '그 회사의 경영 상황이 지원자 수의 변환에 크게 영향을 끼치고 있기 때문에 때 충분한 인력을 확보하기가 어렵다'등을 들 수 있습니다.

사례4

결론 : 광고 매체 선정으로 고심 중이다.

지표 :???

'선정으로 고심'하느라 어떤 '문제'가 발생했는지 명확히 할 필요가 있습니다. 예를 들어, '개인의 재량으로 선택하기 때문에 광고 효과가 제각각'이라거나  '애당초 선정 기준이 없다', '광고가 목표로 설정한 타깃에 충분히 도달하지 못했다'등, 문제를 어떻게 설정하는냐에 따라 활용할 지표는 완전히 달라진다. 현재 발생하고 있는 현상을 구체적인 '문제'로 설정해야 다음으로 넘어가는 것이 수월해집니다.

 

사례5

결론 : 고객 만족도(CS)향상

지표 : CS 설문조사 점수

'고객 만족도 향상' 자체가 최종 목적이 되는 경우는 거의 없습니다. '고객 만족도 향상'이라는 '수단'을 통해 '무엇을 실현하고자 하는가?', 바로 그것이 최종 목적이 됩니다. 하지만 최종 목적이 불명확한 일은 비일비재합니다. B2B기업들은 고객 만족도 조사를 정기적으로 실시하고 '고객 만족도 향샹'을 연간 목표로 정하곤 합니다.  그런데 '고객 만족도가 향상되면 수주 금액이 증가하는 것인가요?'라고 물어보면, '확인된 바 없습니다.'라는 답변을 받습니다. 원래대로라면, 최종 목적이 명확하고 그 '실현 수단'이 '고객 만족도 향샹'이라는 인식이 필요한 것임에도 불구하고, '수단'으로서의 '고객 만족도 향상'만을 무작정 추구하는 것입니다. 

고객 만족도가 높을 경우(개선한다면)매출이나 고객 방문 등에 어떤 영향이 있을지 조사해서 고객 만족도 향상에 대한 목적을 명확히 하는 것이 '데이터 활용'의 첫 시작입니다. 그러고 나면 영향을 파악하는 데 필요한 'CS 설문조사' 항목에 어떤 것이 들어갈지 정할 수 있게 됩니다. 내용에 따라서 전년도와의 비교와 항목 간 비교, 경쟁사와의 비교 등이 필요할 수도 있습니다. 또한 경우에 따라서는 작성한 설문 항목이 부적합했다는 것을 알게 될 수 도 있습니다.

사내에 존재하는 문제

사례 6-8은 직장에서 문제가 될 수 있는 유급휴가 소진, 시간 외 근무, 업무 인수인계 등에 해당하는 사례

사례6

결론 : 유급 휴가 일수 개선

지표 : 유급 휴가 신청 상황, 시간 외 근무 현황

목적으로 설정한 '유급 휴가 일수 개선'의 경우, 어떻게 하면 '개선'되는지 분명하지 않습니다. 예를 들어 '연간 유급 휴가 일수가 전체적으로 적기 때문에 전사적으로 휴가 일수를 평균 3일 늘리고자 한다.' 라거나 '부서에 따라 유급 휴가 일수에 차이가 있어, 형평을 기하기 위해 평준화하고자 한다'등이 되겠습니다. 구체적으로 표현하지 않으면 해석이 크게 달라지고, 이에 따라 지표를 선정하는데 영향을 미치게 됩니다. 

또한 지표로 정의한 '시간 외 근무 현황'의 경우, 분석 과정(특히, 원인 분석 단계)에서 필요하게 될 수도 있으나, '유급 휴가 일수 개선'이라는 '문제'를 직접적으로 나타내는 지표로서는 부적절합니다. 왜냐햐면, 이미 '유급 휴가 신청 문제를 일으킨 원인 시간 외 근무다'라고 그 시점에서  '원인' 을 단정했기 때문입니다. 그러면 '문제'와 '원인'이 동시에 제한되어 시야가 좁아지고, 데이터만으로 작업을 진행할 우려가 있습니다.

사례7 

결론 : 담당자 의존 업무 증가

지표 : 임직원 퇴직 및 이직 데이터

 

담당자 의존 업무란, 특정 담당자만이 업무 내용을 이해하고 평가하고 있어서 다른 사람에게 인수인계가 쉽지 않은 업무를 말합니다. 이 경우, '담당자 의존' 상태를 직접적으로 나타내기 어렵기 때문에 다른 방식을 생각해봐야 할 것입니다. 예를 들어, '담당자 의존 업무'라는 말을 '특정 담당자가 교체 없이 3년 이상 종사하고 있는 업무'라고 정의하게 되면, 업무별 담당자 지속 기간에 대한 데이터를 취하여 지표로 삼으로 좋을 것입니다. 

 다른 정의를 내린다면 지표 또한 변하게 됩니다. 정의에 따라 달라지긴 합니다만, 본 사례에서 선택한 지표인 '임직원 퇴직 및 이직 데이터'는 '담당자 의존 업무' 실태를 나타내기에는 거리가 좀 있어 보입니다. '보다 문제와 관련 있는 '데이터를 고려해야 할 필요가 있으며, 동시에 '문제'에 대해 구체적으로 정의를 내려야 할 것입니다. 

 

사례8

결론 : 시간 외 근무 시간이 적절한가?

지표 : 월평균 시간 외 근무 시간

'적절'이나 '개선'등의 단어는 이곳저곳에서 많이 보게 됩니다. 무슨 말이 하고 싶은지 누구나 어느 정도 짐작은 가능합니다만, 지표로 구현하기에는 충분하지 않습니다. 이것은 전형적인 사례 중 하나입니다. '시간 외 근무 시간이 적절'이라는 말은 어떤 상황을 가리키고 있는 것일까요? '시간 외 근무 시간이 0', '월간 시간 외 근무 시간 합계가 일정 시간 이내', '연간 시간 외 근무 시간이 평준화되어 있다', '부서별 시간 외 근무 시간이 평준화되어 있다', '특정 개인에게 시간 외 근무시간이 편중되어 있지 않다'등, 얼마든지 해석의 여지가 많습니다. 

'목적'과 '문제'에 대한 정의가 충분하지 않다고 말할 수밖에 없습니다. 이를 명확히 정의하지 않은 상태에서 무작정 관련 있어 보이는 '월평균 시간 외 근무 시간' 데이터를 그래프로 나타낼 경우, 현황 파악은 가능할지 몰라도 목적을 달성하기 위해 필요한 것이 무엇인지는 전혀 알 수 없을 것입니다.

지자체 및 행정과 관계된 문제

사례9와 10은 자자체나 행정기간에서 주로 다루는 사례

사례9

결론 : 공립 유치원 대가 아동 수를 0으로 만들고자 한다.

지표 : 아동 수 추이

'목적'은 그 내용이 명확합니다. 동시에 '현재 대기 아동 수가 0인지 아닌지'가 목적의 성패 여부를 고려하는 기준이 됩니다. 다만, 정말 이를 목표로 삼아도 될지 확인할 필요는 있습니다. 예를 들어, '대기 아동 수를 3년 이내에 올해보다 30% 줄인다'라는 목적을 설정하는 게 더 현실적일 수 있습니다. 

어쨌든 '대기 아동 수를 0 으로 한다'는 것이 '목적'이라면 이에 대한 상황을 평가하는 직접적인 지표가 '아동 수 추이'는 아닐 것입니다. 이 부분을 조금 더 신중히 생각한다면, '아동 수 추이'를 그래프로 만들고 '대기 아동 수'문제를 연결 짓는 실수는 하지 않을 것입니다.

아동 수의 증감이나 많고 적음을 파악하는 것이 '대기하는 아동 수가 0 이라는 목표까지 얼마나 근접했는지'를 나타내지는 않습니다. 그럼에도 '우리 지역은 아동 수가 늘어나고 있다'라는 그래프가 있다고 해서 '대기 아동 수 0 달성은 어렵다'라는 결론을 내린다면, 숫자를 효과적으로 사용한 주장이 아닐뿐더러 논리도 성립하지 않습니다.

 좀 더 효과적일 수 있는 지표로, '지역 내 모든 시설 중, 대기 아동 수가 0인 시설 수 및 그 비율'이 적절한 예시가 될 수 있습니다. 그리고 직접적이지 않지만 '시설 수 대비 아동 수'도 지표로 활용 가능합니다.

사례10

결론 : XX 시설 평균 이용 횟수를 주 2회 이상으로 만들고자 한다.

지표 : 사용자 만족도, 기존 대비 신규 이용자 수

'사용자 만족도'를 지표로 설정한 시점에 이미 '원인'과 '해결 방안'을 단정하고 있다는 뜻입니다. 즉, '사용자 만족도가 낮기 때문에(원인), 이용 빈도가 낮다'라거나  '사용자 만족도를 높이면(해결방안), 이용 빈도가 높아질 것이다'라는 식으로, 시작 전부터 스토리를 만들고 단정한 것입니다. 이 상태로  진행한다면, 만족도 데이터등에서 자신이 상상한 시나리오에 맞는 정보만 취사선택하여 예정된 결론을 제시하는 데 그칠 것입니다. 

또한, 수집한 데이터에서 자신이 상상한 시나리오에 맞는 정보가 보이지 않을 경우, 원하는 정보가 없어서 고민에 빠질 것이 뻔합니다. 둘다 '데이터 활용'을 제대로 못 하는 전형적인 사례입니다. 

'기존 대비 신규 사용자 수'라는 지표는 문제를 세분화해서 살펴볼 수 있다는 점에서 착안은 나쁘지 않습니다. 다만, 그런 세분화나 분해를 하기 전에 '현재 상황을 어떻게 데이터로 나타낼 것인가'라는 질문에 대해 답변할 수 있는 지표를 먼저 생각해야 합니다.

예를 들어, '주 2회 이상 이용하는 시설이 몇 개 정도 있으며, 전체 중 몇 퍼센트를 차지하는가'와 같은 지표를 통해 현재 상황을 파악할 수 있습니다. 그 결과를 살펴본 뒤, 그럼 어떤 종류의 시설이 목적을 달성하는지, 어떤 사용자가 많이 이용하고 있는지 등의 관점으로 파고드는 것이 좋습니다

일단 현재 직면한 '문제'를 어떻게 나타낼지에 대한 관점으로 지표를 고려하시 바랍니다.

 

더 나은 목적. 문제를 정의하기

정답은 존재하지 않습니다. 어떻게 고치면 목적과 문제의 정의가 보다 개선되고 적절한 데이터 선택이 가능할지, 여러분 스스로가 구체적으로 생각해보야야 할 것입니다.  이과 같은 훈련을 반복하게 되면, 여기서 지적한 것과 같은 부분을 다음번에는 고칠 수 있으며, 서서히 역량이 향상될 것입니다. 

실제로 스스로 진행할 때, 목적이나 문제로서 '내가 말하고자 하는 바는 무엇인가?' 가 명확하다는 것을 전제로 다음과 같이 자문자답하길 바랍니다.

나는 올바른 데이터(지표) 를 활용하고 있는가?

예를 들어, 오늘 처음 만난 외부인이나 제3자에게 데이터를 보여주면서, '제 고민은 이것입니다', '이것이 문제입니다.','이것으르 이해해주시면 좋겠습니다'라고 말할 때, 어떤 데이터를 활용하겠습니까? 이에 대해서만 생각하면 됩니다.

                                       목적 및 문제

             (무슨 말을 하고 싶은가, 말해야 하는가) -> 둘 이상의 해석이 나오지 않도록, 구체적으로 표현하고 정의하였는가?


                                                                       적합한가?

                                  데이터 및 지표

Are you using the right data?