9chan
데싸겅부
9chan
전체 방문자
오늘
어제
  • 분류 전체보기 (51)
    • 코딩 (48)
      • 구름 (42)
      • 백준 (0)
      • 프로그래머스 (0)
      • 주피터 (3)
      • 판다스(pandas) (2)
    • 수학 (1)
    • 주절주절 (0)

블로그 메뉴

  • 홈
  • 태그
  • 방명록

공지사항

인기 글

태그

  • 파이썬
  • 프로그래밍
  • 1단계
  • M1
  • 구름
  • 맥북
  • 인코딩
  • 한글
  • 코딩
  • 다운로드
  • 맥

최근 댓글

최근 글

티스토리

hELLO · Designed By 정상우.
9chan

데싸겅부

[Pandas] 1. 데이터 불러오기, 확인하기
코딩/판다스(pandas)

[Pandas] 1. 데이터 불러오기, 확인하기

2022. 2. 25. 14:50

1. 파일 호출, 호출시 데이터 분할

 

import pandas as pd #판다스 호출, 타이핑 귀찮으니 'pd'로 요약해서 사용
df = pd.read_csv('../data/파일명.확장자') #파일 호출,

df = pd.read_csv('../data/파일명.확장자', sep='\t') # 파일의 모양에 따라 구분자를 설정

sep='\t' # 열이 탭으로 구분됐을 경우
sep='|'  # 열이 | 으로 구분됐을 경우
sep=','  # 열이 ,(쉼표)로 구분됐을 경우

이 예제 에는 gapminder 라는 txt 파일을 사용했다. 파일을 열어 확인해보니 탭 형식으로 데이터가 나뉜것이 보인다.

 

jupyter notebook에서 위의 설명처럼 판다스를 호출하고, 파일이 탭 구분자로 이루어졌음을 써준 뒤 출력했다.

깰-끔

2. 불러온 데이터 확인하기

df.head()  # 가장 앞의 5행을 출력
df.tail()  # 가장 뒤의 5행을 출력
df.shape() # 몇 행, 몇 열인지 출력
df.columns # 데이터가 갖고 있는 행 출력
df.dtypes  # 'd'types다. 각 행이 갖고있는 데이터 속성을 출력 
type.df    # 데이터의 자료형을 출력(파이썬 기본 메서드라 다른 코드들과 모양이 다름)
df.info()  # 파일의 속성(df인지 series인지 등), 인덱스 길이, 열 갯수와 종류, 
           # 데이터 타입 등 다양한 내용을 한번에 보여줌

 

1. head( ) : 가장 앞의 5행을 출력

2. tail( ) : 가장 뒤의 5행을 출력

3. shape( ) : 몇 행, 몇 열인지 출력

4. columns : 데이터가 갖고 있는 행 출력

5. dtypes : 각 행이 갖고있는 데이터 속성을 출력 

 

6. type( ) : 데이터의 자료형을 출력(파이썬 기본 메서드라 다른 코드들과 모양이 다름)

7. df.info( ) : 파일의 속성(df인지 series인지 등), 인덱스 길이, 열 갯수와 종류, 데이터 타입 등의 내용을 한번에 보여줌

'코딩 > 판다스(pandas)' 카테고리의 다른 글

[Pandas] 2. 데이터 추출하기, 특정 행/열 보기  (0) 2022.02.25
    '코딩/판다스(pandas)' 카테고리의 다른 글
    • [Pandas] 2. 데이터 추출하기, 특정 행/열 보기
    9chan
    9chan

    티스토리툴바