본문 바로가기

코드이야기

(20)
[SQL] 작업도구와 데이터 준비하기 데이터베이스는 우리 생활에 아주 밀접하게 관련되어 있습니다. 은행거래기록, 카드사용내역, 도서 정보, 날씨정보 등 우리가 사용하는 대부분의 자료는 데이터베이스의 형태로 존재합니다. 이런 데이터베이스를 관리하는 시스템을 RDBMS라고 하는데 오라클, MySQL, Access 등이 모두 RDBMS입니다. 이는 테이블과 각 테이블사이의 관계로 구성되어 있습니다. 테이블에서 데이터를 추출하기 위해 SQL(Structured Query Language)이라는 언어를 사용합니다. SQL을 사용하기 위해 SQL작업도구와 연습용 데이터베이스를 설치하는 방법을 알아보도록 하겠습니다. SQL 작업도구 설치하기 SQL을 작업할 수 있는 도구는 여러가지가 있습니다. TOAD, SQL Developer 등이 주로 사용됩니다. ..
[파이썬] 시퀀스 자료형의 기초 문자열, 리스트, 튜플 같은 자료형을 시퀀스(Sequence) 자료형이라고 합니다. 시퀀스 자료형에 포함된 각 객체는 순서를 가지고, 인덱스(Index)를 사용하여 참조할 수 있습니다. 파이썬에서 문자열(String)은 작은 따옴표 ' '나 큰 따옴표 " "로 묶어 표시하고, 리스트(List)는 대괄호 [ ], 튜플(Tuple)은 소괄호 ( )로 묶어 표시합니다. 각 자료형은 고유한 특성들을 가지기도 하지만, 공통적으로 적용되는 특성들이 있습니다. 인덱싱(Indexing) 인덱싱이란 시퀀스 데이터에서 오프셋(Offset)으로 하나의 객체를 참조하는 것을 말합니다. 여기서 인덱스는 정수이며, 0에서 부터 시작합니다. 1이 아니라 0에서 부터라는 것을 잊지 마세요. 예를 들면 다음과 같습니다. >>> a =..
[파이썬] 문자열 메서드 활용하기 데이터 분석을 위해서는 원시 데이터를 가공하는 능력이 중요합니다. 파이썬에서 제공하는 리스트, 문자열 메소드와 for문을 통해 리눅스의 'etc/passwd'파일에서 사용자 id만을 추출하는 방법을 살펴 보겠습니다. 만약 리눅스를 사용하고 있다면, 'etc/passwd'파일을 열어보시기 바랍니다. 아래와 같은 형식으로 되어 있을 것입니다.root:x:0:0:root:/root:/bin/bash bin:x:1:1:bin:/bin:/sbin/nologin daemon:x:2:2:daemon:/sbin:/sbin/nologin adm:x:3:4:adm:/var/adm:/sbin/nologin lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin sync:x:5:0:sync:/sbin:/bi..
IPython Qtconsole과 Notebook 설정하기 파이썬을 처음 설치하고 IDLE을 실행하면 콘솔형태로 파이썬 코드를 작성하고 실행 할 수 있습니다. 그런데 기본적으로 제공하는 편집기를 사용하다 보면 불편함이 많습니다. 그래서 나에게 맞는 개발환경 구축을 위해 여러 방편들을 찾기 시작하게 됩니다. Eclipse에서 Pydev를 사용하기도 했고, Wing IDE라고 하는 파이썬에 최적화된 IDE를 사용하기도 했습니다. 그러나 이제는 IPython의 Qt Console과 Notebook에 정착했습니다. 가볍고, 편하고, 강력하기 때문입니다. Python을 활용한 Data분석을 위해서는 최고의 도구라고 생각합니다. IPython에 대한 자세한 내용은 ipython.org에서 확인할 수 있습니다. 여기서는 IPython을 처음 설치한 후 필요한 몇가지 설정사항..