본문 바로가기

it

(35)
프로그래밍과 생각근육 그가 저술한 책은 모두 읽습니다. 신간이 나오면 오직 그 이름만으로 사서 읽어봅니다. 그런 사람이 몇 있습니다. 경영컨설턴트, 전략가, 경영사상가인 일본의 오마에 겐이치가 그 중 한 명입니다. 그는 20세기가 자동차나 TV시대였다면 21세기는 구글의 시대라고 단언합니다. 21세기의 진정한 가치는 보이지 않는 것에 있다고 주장합니다. 상상력은 사실(Fact)와 수치(Figure)로 입증해 현실화 할 수 있을 때 그 가치가 배가된다고 합니다. 이런 능력을 그는 구상력이라고 부릅니다. 21세기에는 '제 4의 물결'이 필요하다며 구상력을 핵심 컨셉이라고 이야기 했습니다. 구상력의 원천은 사람의 생각입니다. 근력운동을 통해 몸의 근육을 단련하듯이 생각훈련을 통해 뇌의 근육 역시 꾸준히 단련할 필요가 있습니다. 블..
[R프로그래밍] R을 이용해 바차트(막대그래프)와 히스토그램(도수분포표) 정복하기 "히스토그램과 바차트의 차이는 무엇인가?", 이 질문에 바로 대답할 수 있으신가요? 히스토그램은 우리말로 하면 도수분포표입니다. 반면, 바차트는 우리말로 막대그래프입니다. 이름만 다를 뿐 그게 그거 아닌가 할 수도 있겠지만 그 쓰임에는 분명한 차이가 있습니다. 히스토그램(이하 도수분포표)은 분포(Distribution)을 표현하는데 사용하는 반면 바차트(이하 막대그래프)는 데이터를 분류(Category)하는데 사용됩니다. 아래 그림을 살펴보시죠. 올해 책을 30권 읽었다고 가정해 보겠습니다. 이 읽은 책에 대한 데이터를 정리하는 방법은 여러가지가 있을 것입니다. 소설, 인문학, 경영서, IT, 예술 등과 같이 장르별로 읽은 책의 권수를 정리 할 수도 있고, 책의 가격대를 비교해 볼 수도 있습니다. 전자는..
[R프로그래밍] 몬테카를로 시뮬레이션으로 원주율(π) 구하기 몬테카를로 시뮬레이션이란 난수를 이용한 시뮬레이션을 여러 번 반복하여 문제의 근사해를 구하는 방법을 말합니다. 수소폭탄의 개발자인 스타니스와프 울람이라고 하는 폴란드계 미국인 과학자에 의해 모나코의 유명한 도박도시 몬테카를로의 이름을 본따 만들어진 것입니다. 수학이나 물리학에 주로 사용되며 엔리코 페르미가 중성자의 특성을 연구하기 위해 이 방법을 사용하기도 하였습니다. 지난 포스팅에서 시뮬레이션의 기본인 난수생성방법을 알아보았습니다. 여기서는 시뮬레이션이 정의와 프로세스, 그리고 R을 이용해 몬테카를로 시뮬레이션을 R로 구현하는 방법에 대해 이야기 하겠습니다. 시뮬레이션의 정의와 프로세스 위키피디아에는 '시뮬레이션은 실제로 실행하기 어려운 실험을 간단히 행하는 모의실험을 뜻한다'라고 정의되어 있습니다. ..
무한도전에서 배우는 탐정의 기본자질 무한도전에 국내 최초의 프로파일러 표창원 교수가 나왔습니다. 여기서 '무도 탐정 사무소 특집'편을 위해 멤버들에게 탐정의 기본자질, 추리하는 법, 수사기업 등을 교육시켰습니다. 탐정의 자질을 참고하면 분석에도 도움을 줍니다. 표창원 교수가 말하는 탐정의 자질 5가지를 살펴보겠습니다. 탐정은 '추리'를 업으로 합니다. 표창원 교수는 추리를 '알고 있는 것을 통해 알고 싶은 것을 찾는 과정'이라고 이야기 합니다. 탐정의 다섯 가지 기본자질 표창원 교수는 올바른 추리를 위해서는 다섯 가지 기본자질이 필요하다고 이야기합니다. 1. '어린이'처럼 끊임없이 질문하라 2. '백지'인것 처럼 선입견 없이 추리하라 3. '엄한 처'처럼 샅샅이 캐물어라 4. '뜨개질'하듯 알고있는 것과 알지 못하는 것을 이어라 5. '영..
[R프로그래밍] 시뮬레이션의 기본 - 난수생성 동전이 하나 있다고 생각해 보겠습니다. 우리는 동전을 던지면 앞면과 뒷면이 나올 확률이 1/2이라는 것을 알고 있습니다. 그런데 앞면이 계속 나올 때도 있고 뒷면이 계속 나올 때도 있습니다. 동전을 무수히 많이 던지면 앞면과 뒷면이 나오는 횟수는 1/2에 근접해 갈 것입니다. 사진: glennharper 실제로 수없이 많이 동전을 던져 결과를 기록하는 것은 어려울지 모르지만 컴퓨터를 이용하면 쉽게 풀 수 있습니다. 이렇게 어떠한 현상이나 사건에 대한 모형을 만들어 가상으로 수행함으로써 실제 상황에 대한 결과를 예측하는 것을 시뮬레이션이라고 합니다. 동전을 던졌을 때 앞면이 나오는 것을 1, 뒷면이 나오는 것을 0라고 가정하겠습니다. 그럼 동전을 여러번 던지면 아래와 같은 수열을 얻을 수 있습니다. 1 0..
넷플릭스, 영화추천의 비밀과 상관계수 넷플릭스의 최근 성장세가 무섭습니다. 넷플릭스는 지난해 4분기 4,840만달러(약 515억원)의 순이익을 기록했습니다. 이는 2013년 전체 순이익의 43%입니다. 북미시장에서의 비디오 스트리밍 서비스 역시 전년비 7%포인트 상승하며 압도적인 1위를 차지하고 있습니다. 주가역시 올해들어 고전하는 양상을 보이다 지난 1월 22일 실적발표 후 급반등했습니다. [넷플릭스의 2013년 분기별 순이익, 자료: 비즈니스위크] [북미시장의 비디오 스트리밍 서비스 점유율, 자료:statista] [넷플릭스의 최근 1년간 주가 현황, 자료: Yahoo Finance] 넷플릭스는 잘 알려진 바와 같이 영화추천기능을 가진 미국의 온라인 DVD서비스 업체입니다. 1997년 리드 헤이스팅스(Wilmot Reed Hastings..
[R프로그래밍] 한국인의 평균키와 몸무게로 회귀분석하기 키가 큰 부모를 둔 자녀들은 키가 클 확률이 높을 것입니다. 그렇다면 세대가 거듭될 수록 키는 무한히 커질까요? 그렇지는 않습니다. 19세기 영국의 화학자인 프랜스시 골턴(Francis Galton, 1822~1911)은 키가 큰 부모들이 낳은 자식들이 키가 점점 더 커지지 않고, 다시 평균으로 회귀한다는 경향을 보고 '회귀(regression)'라는 개념을 사용했습니다. 통계학에서는 '평균으로의 회귀(regression toward mean)'라고 부릅니다. 회귀분석의 개념과 유형 회귀분석은 하나 또는 그 이상의 독립변수(설명변수, 예측변수, 통제변수등으로 불리기도 함)가 한 단위 변할 때, 종속변수에 미치는 영향력을 예측할 때 주로 사용하는 통계분석 기법입니다. 독립변수는 입력 값이나 원인을 말하며,..
데이터베이스 즐겨찾기 본 페이지는 한국데이터베이스진흥원의 '데이터베이스 및 데이터베이스 기술분류 표준안'을 참고하여 분류 데이터베이스운영기관 주요정보 Weather Underground- - 전 세계의 날씨를 기상지도와 함께 제공 The World FactbookCIA - 세계의 역사, 인구, 정부, 경제, 교통 등의 정보 Creative CommonsFlickr - Flickr Creative Commons 라이센스 이미지 제공 Data.gov미국정부 - 미국연방정부에서 발행하는 데이터의 집합 UN data UN - 인구, 교육, 경제, 사회개발 등에 대한 데이터의 집합 데이터베이스 운영기관 주요정보 국가통계포털(KOSIS) 통계청 - 국내 인구, 가구, 환경, 교통, 금융, 고용, 교육 등 통계정보 언론재단(Kinds) ..