티스토리 뷰

데이터를 분석함에 있어서 데이터의 종류를 이해하는 것은 어찌보면 당연하다.
따라서, 먼저 파이썬에서의 자료형(Data Type)에 대해 확인해 보자.

1. 변수의 선언

파이썬에서의 변수의 값을 지정 할 때는 다른 프로그래밍 언어와 유사하게 "="을 사용한다.
한편, 자료형에 대해 엄격한 JAVA 나 C와는 달리 파이썬에서는 변수 선언을 위해 자료형을 엄격하게 구분하지 않는다.

x = 5
desc = "compound interest"

위 구문의 의미는 x라는 변수에 5라는 값을 담는다는 것이며, desc라는 변수에 "compound interest"라는 값을 담는 다는 의미이다.

직접적인 자료형 자체로 연산이 가능함에도 불구하고 (예를 들면, '5 + 10'과 같은) 변수를 사용하는 이유는 자료가 반복될 때 그 자료의 변경이 있는 경우 최소한의 변경으로 수정이 가능하기 때문이다. 물론 그 이외에도 다양한 효용이 있다.

2. 자료형

1) 정수 (int or Integer) : 소수점을 가지지 않는 수
예) 100, -10, 0

2) 실수 (float, or Floating point) : 소수점을 가지는 수
예) 1.10, -0.8

3) 문자열 (str, or String) : 문자 또는 문자의 집합. 작은따옴표(') 혹은 큰따옴표(")로 정의할 수 있다.
예) "Hello, world", 'Data Analysis'

4) 불리언 (bool, or Boolean) : 참과 거짓, 두가지 값을 가지는 논리값. 첫 글자가 대문자 임을 유의.
예) True, False

파이썬에서 자료를 확인하고 싶은 경우는 아래와 같이 type( ) 함수를 통해 확인이 가능하다.

x = 5 print(type(x)) RESULT --- <type 'bool'>
3. 다른 자료형 간의 연산

자료형의 연산은 기본적으로 피 연산자(Operand)의 자료형에 따라 다르게 연산이 된다.
가령, int 간의 연산 '3 + 4'는 그 결과가 '7'이 된며, str 간의 연산 "Hello " + "world"는 그 결과가 "Hello world"가 된다.

그렇다면 이 피연산자가 다를경우에는 어떻게 해야 할까.
아래 구문을 살펴보면, 문자열과 정수의 연산을 출력하고자 하는 것으로 보인다.

saving = 100 result = 200 print("I started with $" + savings + " and now have $" + result + ". Awesome!" RESULT --- TypeError: Can't convert 'int' object to str implicitly

이와 같은 연산에 대해 자료형의 선언이 엄격한 프로그래밍 언어를 습득한 사람들은 문제가 없을 것이라고 생각하겠지만,
파이썬은 자료형의 선언이 엄격하지 않으므로 문자열과 숫자의 연산은 오류를 출력하게 된다.

따라서 우리가 원하는 결과를 얻기 위해서는 아래와 같이 변경이 필요하다.

print("I started with $" + str(savings) + " and now have $" + str(result) + ". Awesome!" RESULT --- I started with $100 and now have $200. Awesome!

위 구문에서 보는 것과 같이 정수형 변수인 saving과 result를 str( ) 함수를 통해 문자열로 바꾸는 작업이 필요하다.
이후에 올바른 결과를 출력하게 된다.

이와 유사하게 자료를 지정한 형식으로 바꾸기 위해서는 아래와 같은 함수를 사용한다.
- int( ): int 형으로 변경
- float( ): float 형으로 변경
- bool( ): bool 형으로 변경


공지사항