본문 바로가기

분석이야기/Columns

분석, 어떻게 할 것인가? - (4) 추상화하기


이제 추상화의 단계입니다. '시카고의 피아노 조율사는 몇 명일까?' 이런 문제에 대해 기초적인 지식과 논리적인 추론만으로 짧은 시간내에 답을 내는 방법을 '페르미 추정'이라고 합니다. 이탈리아계 미국인 물리학자인 엔리코 페르미(Enrico Fermi, 1901~1954) 가 물리량 추정에 뛰어났고 그가 학생들에게 이런 문제를 자주냈다고 해서 붙여진 이름입니다. 게스티메이션(Guestimation) 또는 브레인 티저(Brain Teaser)라고 불리기도 합니다. 정답이 없고 수없이 많은 다양한 형태로 문제를 낼 수 있으며 지원자의 사고력을 측정하는 데에 유용하여 마이크로 소프트, 구글 등에서 면접문제로 활용하기도 합니다. <사진 : wikipedia>


우리나라의 전봇대는 모두 몇 개인가?

문제를 하나 내보겠습니다. "대한민국의 전봇대는 모두 몇 개인가?" 사전지식이 필요하겠지요. 한국의 면적은 약 100,000제곱킬로미터 입니다. 군대를 나오신 분들은 아시겠지만 전봇대는 대략 70m간격으로 가정합니다. 또 한 가지 사실을 우리는 알고 있습니다. 국토면적의 70%는 산으로 이루어져 있다. 이제 대충 감이 오시나요? 이 정보로 대한민국이 직사각형이라고 가정하면 아래와 같이 모형을 만들어 낼 수 있습니다.


전봇대 수 = 환산면적 * 1제곱킬로미터당 전봇대수


앞서 전봇대는 70m에 한개 간격으로 있다고 가정했으므로 1제곱킬러미터당 전봇대 수는 약 200개입니다. 서울 및 6대 광역시의 면적은 약 6,000제곱킬로미터 입니다. 그럼 나머지 시도는 약 24,000제곱킬로미터라고 할 수 있습니다. 그런데 2010년 인구주택 총조사에 따르면 우리나라는 약 4,850만명의 총 인구중 2,237만명이 서울을 포함한 6대광역시에 살고 있습니다. 따라서 이 지역에 전봇대는 나머지지역보다 2배정도 많다고 가정하겠습니다.


계산해보면 서울 및 6대 광역시 233만개, 나머지 지역 483만개로 총 716만개 정도의 전봇대가 있다고 추정할 수 있습니다.



실제로 한전에서 공개한 자료에 따르면 콘크리트 주 825만여개, 목주 300여개, 강관주 33만여개로 총 858만여개가 있다고 하니 완전히 그릇된 추정은 아닙니다. 정답을 내는 것이 중요한 것은 아닙니다. 보이지 않는 것을 보이는 모습으로 바꾸어 내고 그 결과를 추정해 보았다는 것이 더 중요합니다. 이것이 추상화의 묘미입니다. 가설설정에서도 말씀드렸다시피 전혀 엉뚱한 결론이 나왔다고 생각하면 다시 모델을 만들고 또 추정해 보면 됩니다. 모델이 정교해질 수록 점점 더 해답에 가까워 짐을 느낄 수 있습니다.


추상화의 끝판왕, 지하철 노선도

하나만 더 추상화의 예를 들어 보겠습니다. 지하철 노선도를 한 번 보시죠.


이 이미지 하나에 서울 곳곳에 가장 빠르게 도달할 수 있는 모든 정보가 다 들어있습니다. 우리가 지하철을 탄다는 것은 어딘가의 목적지로 향한다는 것입니다. 여기에서 문제는 각 역간의 거리와 방향보다는 우리가 내려야 할 역과 그 역에 가장 빨리 도달할 수 있는 방법입니다. 그런 의미에서 지하철 노선도는 더 없이 좋은 추상화의 예입니다. 각 노선의 색깔, 지나가야 할 역의 개수, 갈아타는 횟수 등을 통해 어림수로 목적지에 도착할 때 까지 걸리는 시간을 추정해 볼 수 있는 것이지요. 이렇듯 우리 일상의 모든 것들이 그 목적에 따라 추상화 할 수 있습니다. 어떤 변수를 사용해서 어떤 모델을 만들어내느냐가 관건입니다.