BOOK(IT, 데이터분석)

데이터 문해력(Part7,8)

nova-unum 2022. 7. 21. 13:50

데이터 문해력  카시와기 요시키 지음, 강모희 옮김

 

7  '데이터로 문제를 해결할 수 있다'는 착각

시야 확대력 : 데이터로부터 시야를 넓히는 힘

 

데이터 안에는 답이 없다고 생각하라

단순히 데이터를 보는 방식이나 분석 방법론, 통계 지식만 갖고서는 객관적인 문제 해결에 전혀 도움이 되지 않는다는 것을 이해하셨으리라 생각합니다. 이와 동시에 꼭 필요한 것은 눈앞에 있는 데이터에 의존하지 않고 스스로 목적과 문제를 정의해 필요한 데이터나 분석 범위를 얼마나 넓은 시야로 디자인할 수 있는가이다. 

'이것이 당신이 알고 싶어 하는 것인가요'라면서 데이터가 자동으로 제시해주는 것이 아닙니다.

여기서 말하는 '디자인'이란, '목적과 문제를 정의하는 것', '이를 위해 필요한 데이터와 지표를 설정하는 것', 그리고 ' 그 데이터를 어떻게 분석해야 문제의 정보를 효과적으로 얻을 수 있는지 분석하는 것'에 대해 고려한 다음 데이터를 활용해 수행할 작업의 설계도를 그리는 것을 말합니다.

데이터를 다루는 기술을 익히려면 극복해야 할 것들

문제를 푼다 = 반드시 존재하는 하나의 정답을 어떻게 찾아낼 것인가?

앞선 내용이 절대적으로 맞는 것처럼 교육받아온 사람이라면 정답이 있는지 없는지 알 수 없고, 정답이 하나가 아닐 수도 있고, 무엇이 정답인지 결국 알 수 없는 이런 상황이 견딜 수 없는 것입니다.  '데이터 속에 분명 존재할 터인 정답을 찾아내야 한다'라는 발상을 가진 사람일수록 더 납득할 수 없거나 더 어려워질 것이입니다.

가장 적합한 해답을 찾기 위한 논리적인 사고방식이란

분석 담당자로서 여러분이 원하는 것은 과연 눈앞에 있는 데이터 A ~ C를 짜 맞추어 만들어낸 좁은 범위의 결론인가요?

아니면 ,  근본적인 과제에 대한 가장 적합한 해답인가요?

비즈니스 실무에서라면 두말할 것 없고, 일반적인 문제해결에서도 '근본적인 과제에 대한 가장 적합한 해답'일 것입니다.

분석 범위와 이용해야 할 데이터를 적절히 논리적으로 검토한 프로세스

그럼 눈앞에 있는 데이터에 제한되지 않는 적절한 프로세스란 무엇일까요?

그것은 각 과제의 데이터를 다루기 전에, 넓은 안목으로 전체를 가장하는 것입니다.

이 '가정'은 일번적으로 '가설'이라 하며, 목적과 문제에 대하여 데이터를 다음 사항에 유의하여 생각하는 것을 가리킵니다. 

■ 어떤 범위, 어느 시점의 정보(데이터)가 필요한가?

■ 어떻게 처리, 가공해야 할 것인가?

말한 것과 같이, 이 시점에서는 눈앞의 데이터에 구애받지 않아야 합니다. 즉, 다음 프로세스가 가설 수립에 필요합니다.

'데이터 → 가설(데이터에 기반한 가설 수립)'이 아니라,  '가설 → 데이터'

데이터 분석은 자신이 수립한 가설을 객관적, 논리적으로 검증하기 위한 것이라 할 수 있습니다. 

지금까지 소개한 데이터 활용 전체 프로세스 중, 어떤 시점에 '가설을 거쳐 검증'이라는 개별 작업이 필요한지 확인해보도록 하겠습니다. 

데이터 활용 전체 프로세스(왼쪽)중 가설 수립과 분석 작업

목적/문제정의  A (겉으로 드러난 현상) 가설 수립 작업
B 목적 및 문제를 정의 어떻게 데이터를 활용하고, 처리할지 가설을 수립한다
C 지표를 결정
현상파악/평가 D 현재 상태를 파악 데이터1 데이터2 데이터3 데이터N
E 평가 분석작업
원인 F 원인을 분석 . 결론과 관련이 없는 결과가 나올 수도 있음
. 필요에 따라 가설을 다시 생각해봐야 함
방법 G 해결 방안을 모색 결론 도출

처음부터 범위(데이터)를 넓게 설정하면 분석 범위 자체도 넒어지므로, 수집해야 할 정보나 결과를 놓칠 위험이 줄어듭니다. 물론 설정 범위가 넓으면 데이터 확인 시 작업량이 늘어날 수는 있으나, 가장 적합한 해답에 이르기 위해서는 어쩔 수  없는 부분이라고 생각합니다. 

실제로는 분석하면서 중간중간 결과를 확인하며 가설을 수정하거나 새로운 데이터를 추가해야 하는 경우도 발생합니다. 중요한 것은 분석에 활용할 데이터와 그 범위를 얼마나 넓게 설정할 것인가 입니다. 

(1) 이 문제는 어느 정도 범위의 데이터가 필요한가?

(2) 이 데이터는 어떤 관점으로 바라봐야 하는가?

앞헌 두 사항에 대해 논리적이고 폭넓은 시야로 고찰해야 합니다. 

시야를 넗히면 분석의 폭도 넓어진다

예컨대, 직장에서의 시간 외 근무 문제에 대한 데이터 분석을 진행한다고 하겠습니다.

어떤 사람이 이 문제는 '직원'(작업 효율과 속도 등 개인의 능력이나 의욕과 같은 질적 측면)과 '업무량'의 두 측면을 분석해야 한다고(즉흥적으로) 가설을 수립했습니다. 이렇게 하면 나름대로 두 가지 데이터로부터 뭔가 문제에 대한 힌트를 찾을 수도 있을 것입니다. 

두 사람의 차이점은, 고객의 불만 대응 등으로 말미암아 시간외 근무가 늘어났다는 가능성을 고려했는지 아닌지에 있습니다. 즉, 이 직장에서의 시간 외 근무 문제를 '임직원, '업무량', '고객'이라는 세 축으로 정리해서 전체상을 내려다보고 분류하는 것을 통해, 분석 범위가 넓어지고 분석할 영역이 명확해진 것입니다. 

논리 사고로 문제를 구조화한다

그럼 당면한 과제에 대한 범위나 분석 영역을 어떻게 하면 누락 없이 적절히 판별할 수 있을까요?

유감스럽지만 이 질문에 대한 마법 같은 정답은 없습니다. 무작정 머릿속에 떠오르기를 기다린다고 되는 것도 아니고, 혼자 끙끙거린다고 답이 나오는 것도 아닙니다.

마법 같은 정답은 없지만, 필자가 생각하는 최선의 접근 방식은 '논리적 사고(로지컬 씽킹)'입니다. 여기서 말하는 '논리적 사고'란 문제를 구조화하고 정리하면서 생각하는 것을 가리킵니다.

논리적 사고를 통해 문제를 구조화한 결과

시간외 근무가 많다 회사 내부문제 업무 문제 양적 문제
질적 문제
사람 문제 양적 문제
질적 문제
회사 외부문제 고객 문제

 

시간 외 근무 문제에도 논리적 사고를 적용한다면, 데이터 수집과 분석 전 단계에 다음과 같은 구조화가 가능할 것입니다. 색칠된 부분이 구조화를 통해 알게 되는 것입니다. 

이 그림처럼, '업무량'뿐만 아니라 업무 배분과 내용 등, '업무의 질' 측면도 살펴봐야 한다는 것을 알게 됩니다. 마찬가지로, '업무 역량(질)뿐만 아니라, '인원수(양)'또한 문제가 될 수 있다는 가설이 수립가능합니다. 

구조화해서 정리하게 되면, 즉흥적으로는 생각할 수 없는 것을 알게 될 가능성이 커집니다. 그리고 '왜 이 데이터를 사용해서 분석했는가'라는 질문에 대해서도 논리적인 설명이 가능해집니다. '항상 쓰던 데이터라서'라는 대답에 비한다면 하늘과 땅만큼의 차이입니다.

'보이지 않던 것'을 보이게 만드는 힘

그럼 구조화에 기반한 논리적 사고는 어떻게 습득할 수 있을까요?

물론 논리적 사고의 기초를 공부하는 거에서 출발한다고 생각합니다. 하지만 논리적 사고란 내용이나 기술만 이해해서는 소용이 없습니다. 여러 차례 시행착오를 거치면서 경험치를 쌓고 자신의 상상력을 키워나가가야 합니다.

다만 아무 단서도 없이 시행착오만 거듭하는 것은 효율적이지 못합니다. 어느 정도 기법을 익히고 나서 직접 사용해보는 것이 효과적이고 효율적이라 생각합니다. 

짝찟기

'시간 외 근무 문제'에 대해 다시 한번 생각해 볼까요?

'회사 내부 - 회사 외부','양 -질'이라는 서로 반대되는 '짝짓기' 카테고리와 콘셉트를 잡게 되면, 자신이 떠올린 아이디어에 '대응'이 되는 콘셉트 상자를 만드는 셈이 됩니다.

그렇게 하면, 상자에서 구체적으로 해당하는 것이 무엇인지(시간 외 근무 문제의 경우, 고객 문제 및 인원수 등), 파악하기 쉽습니다. 동시에 그것이 논리적으로 어떤 부분에 위치하게 될지도 구조 속에서 확인하여 제시할 수 있습니다. 

여기서 전체를 구조화할지(가능한지) 아닌지가 중요한 것이 아닙니다. 물론 구조화가 가능하다면 이상적입니다. 하지만 구조화하는 것 자체를 목적으로 하면 안 됩니다. 문제의 구조화 작업만 해도 상당히 어렵다고 느껴져서 힘이 다하기 일쑤기 때문입니다. 데이터 분석도 시작하기 전에 작업이 중단되면 본말전도입니다.

먼저 자신이 생각한 아이디어와 수집된 데이터를 통해 알 수 있는 것들을 늘어놓고,

이에 '대응'하거나 '반대'되는 아이디어에는 무엇이 있을까?

에 대해 생각해보는 것입니다. 그리고 이를 통해 시야를 확대하는식의 접근법을 취해보는 것입니다.

여러분도 자신의 주변 사례 중에 현재 보이는 것과 생각난 것들에 대해 '짝짓기'를 열거해보시기 바랍니다. 실제로는 자신에게 보이는 것이나 생각하는 것이 한 측면에 지나지 않는다는 것을 알게 될 것입니다.

짝짓기 콘셉트란

                   아이디어 1에서 아이디어 2가 파생(짝짓기 콘셉트)

아이디어1    ↔   아이디어2

(콘셉트 예:질) (콘셉트 예:양)

 '아이디어 1'은 '무작정 생각한 것'이나 '항상 활용하는 데이터에서 도출한 것'등을 말합니다.

하지만 그렇게 우연히 생각나거나 떠어른 것이 전부라고 생각하면 오산이라고 설명한 바 있습니다.

그 정보(아이디어 1)를 기점으로 다른 아이디어(아이디어 2)를 떠올리는 것이 짝짓기입니다.

■ 개인 - 조직

■ 방법론(하는법) - 의식(의욕)

■ 있다(그렇지만 할 수 없다) - 없다

 

자기부정

여기서 소개하는 기법도 짝짓기의 파생형이라 할 수 있습니다. 

바로 자신이 떠올린 아이디어를 일부러 부정하는 것입니다. '만약 XXX가 아니라면?'이라고 자신에게 되묻습니다. 처음 떠오른 아이디어를 고집하지 말고, 일르 부정하는 행동을 통해 다른 아이디어를 강제로 도출하는 방식입니다.

1) 생각해 낸 원인의 아이디어
방문 고객이 줄어든 것은 홍보 회수를 줄였기 때문이다. 
2) 자기 부정
아니, 홍보 횟수의 문제가 아니라면 뭐가 있을까?
(즉, 홍보 횟수를 늘려도 문제가 해결되지 않는다면 어떤 다른 원인이 있을 수 있을까?)
3) 다음 아이디어

홍보 횟수를 늘려도 문제가 해결되지 않는다면, '홍보가 고객에게 도달하지 않았을' 가능성이 있는 것은 아닐까?
그렇다면 홍보 횟수는 관계가 없을지도 모른다.
4) 다시 한번 자기 부정
그럼 홍보 횟수를 늘리고, 그것이 고객에게 잘 도착하고 있다고 가정하고,
그런데도 방문 고객이 줄어든다면 어떤 원인을 생각할 수 있을까?
5) 또 다른 아이디어
홍보 내용에 문제가 있다(어필이 부족하다, 이해하기 어렵다)는 가능성이 생각할 수 없는 것일까?

이러한 사고 과정을 반복하면서 아이디어의 가능성을 늘려가는 것입니다. 다만 편향이 강한 사람일수록 '내 생각이 틀림없다'라는 편견으로 인해 자기 부정을 실천하기 어렵습니다. 일단 자기 생각을 중립 위치에 놓고, 원점에서 합리적으로 사고해야 시야가 넓어집니다. 

 

지금 그리고 앞으로 필요한 '살아남는 능력'이란

반복해 말하지만, '정답 찾기'를 하지 말아야 합니다. 데이터 분석에 정답은 없습니다. 그렇지만, 어느 쪽이 더 흐름과 논리성에 맞고, 알기 쉬운지와 같은 상대적인 좋고 나쁨은 복수의 결과물을 비교해보면 알 수 있습니다. 

'어딘가에 있는 정답을 찾으로 간다'라는 식의 생각은 학교 시험에나 해당하는 이야기이며, 실제 사회와 실제 문제는 전혀 그렇지 않습니다.

스스로 정답에 대해 고민하고, 이를 합리적으로 논할 수 있다.

바로 이것이 기계가 할 수 없는, 인간만 가능한 가치 생성 기술입니다.

데이터 문해력이란, '데이터에서 무언가를 읽어내는 능력'이 아니라 '스스로 정답에 대해 고민하고 데이터를 무기 삼아 합리적으로 논할 수 있는 능력'이라고 생각합니다. 

그런 의미에서 '데이터'는 어디까지나 도구에 불과합니다. 그 도구는 논리적 사고라는 기반이 있어야 비로소 활용할 수 있는 것입니다.

'데이터'와 '분석'이 각각 단독으로 존재하면 아무 일도 일어나지 않습니다. 

 

8 개인과 조직의 데이터 활용 능력을 높이는 방법

실행력 : 문해력을 실현하는 힘

 

데이터를 활용할 '환경'은 적절한가요?

아무리 '필요한 프로세스'와 '이론'을 숙지하고 있더라도, 이를 실현하려면 시간이 필요합니다. 지금까지 소개한 내용은 전부 '이버튼을 누르면','이러한 프로세스대로 따라 하면 '곧바로 답이 나오는 것이 아닙니다.

나름의 결론을 도출하려면 작업 전에는 아이디어 발상과 이에 대한 검증, 작업 후에는 총정리하는 과정이 필수불가결합니다. 하지만 이를 알면서도 잘하지 못하는 주된 이유는, 

시간을 확보할 수 없는 환경

에 있습니다. 

이를 해결하지 않은 상태에서, '내용은 이해했을 터이니 이후는 자신의 노력에 따라 성과가 나올 것'이라 기대하는 것은 현실적이지 못합니다.

잘 나가는 개인과 조직은 무엇이 다른가

공통점 1: 선생님과 팀장, 파트장 등의 리더쉽, 책무로 확립되다

공통점 2: 목적이 명확하다

공통점 3:'생각'과 '작업'의 차이와 가치를 이해한다

공통점 4:결과물을 적절하게 평가할 수 있는 사람이 있다