1. 파일 호출, 호출시 데이터 분할
import pandas as pd #판다스 호출, 타이핑 귀찮으니 'pd'로 요약해서 사용
df = pd.read_csv('../data/파일명.확장자') #파일 호출,
df = pd.read_csv('../data/파일명.확장자', sep='\t') # 파일의 모양에 따라 구분자를 설정
sep='\t' # 열이 탭으로 구분됐을 경우
sep='|' # 열이 | 으로 구분됐을 경우
sep=',' # 열이 ,(쉼표)로 구분됐을 경우
이 예제 에는 gapminder 라는 txt 파일을 사용했다. 파일을 열어 확인해보니 탭 형식으로 데이터가 나뉜것이 보인다.
jupyter notebook에서 위의 설명처럼 판다스를 호출하고, 파일이 탭 구분자로 이루어졌음을 써준 뒤 출력했다.
2. 불러온 데이터 확인하기
df.head() # 가장 앞의 5행을 출력
df.tail() # 가장 뒤의 5행을 출력
df.shape() # 몇 행, 몇 열인지 출력
df.columns # 데이터가 갖고 있는 행 출력
df.dtypes # 'd'types다. 각 행이 갖고있는 데이터 속성을 출력
type.df # 데이터의 자료형을 출력(파이썬 기본 메서드라 다른 코드들과 모양이 다름)
df.info() # 파일의 속성(df인지 series인지 등), 인덱스 길이, 열 갯수와 종류,
# 데이터 타입 등 다양한 내용을 한번에 보여줌
1. head( ) : 가장 앞의 5행을 출력
2. tail( ) : 가장 뒤의 5행을 출력
3. shape( ) : 몇 행, 몇 열인지 출력
4. columns : 데이터가 갖고 있는 행 출력
5. dtypes : 각 행이 갖고있는 데이터 속성을 출력
6. type( ) : 데이터의 자료형을 출력(파이썬 기본 메서드라 다른 코드들과 모양이 다름)
7. df.info( ) : 파일의 속성(df인지 series인지 등), 인덱스 길이, 열 갯수와 종류, 데이터 타입 등의 내용을 한번에 보여줌
'코딩 > 판다스(pandas)' 카테고리의 다른 글
[Pandas] 2. 데이터 추출하기, 특정 행/열 보기 (0) | 2022.02.25 |
---|