728x90
반응형
* 본 포스팅은 한국품질재단에서 주최하는 인공지능 개발자 양성사업 교육과정 복습 용도로 포스팅되었습니다
* Pandas
- 파이썬 진영에서 R언어에 대응해서 만든 데이터 분석 라이브러리 패키지입니다.
- numpy 기반 구현
- 대부분 api 계승
- 파이썬 데이터 분석 라이브러리
- 자료구조
- Series
- DataFrame
import numpy as np
import pandas as pd
- Series
- Series는 데이터를 넣어서 생성
- class 라고도 함
- 자료구조이며, 2개를 성분으로 가진다
- Series = 데이터(필수, 배열) + 인덱스 정보(옵션)
- 차원 -> 1차원
a = pd.Series( [1,2,3,np.nan, 6, 8])
a
- shape, dtype, ndim 확인
a.shape, a.dtype, a.ndim
- DataFrame
- DataFrame = 데이터(필수) + 인덱스(옵션) + 컬럼(옵션)
- 차원 -> 2차원 (엑셀, csv, DB 테이블 데이터)
- DataFrame = Series + Series +...
- DataFrame(2d(차원))을 인덱싱(차원축소)하면 => Series(1d(차원))
# 재료
# 1. 데이터
datas = np.random.randn( 7,4 )
# 2. 인덱스 -> 가로기준,row => 7
indexs = pd.date_range('20210517', periods=7)
# 3. 컬럼 -> 세로 기준, col => 4
cols = list('ABCD')
#DataFrame 생성
df = pd.DataFrame( datas, index=indexs, columns=cols )
df
728x90
반응형
'Python' 카테고리의 다른 글
[파이썬] 파이썬 배열의 특징, 슬라이싱, 인덱싱 (0) | 2021.06.03 |
---|---|
[파이썬] 파이썬, Numpy 사용해보기 (0) | 2021.06.02 |
파이썬 웹 크롤링으로 데이터 획득하기(파이썬 초보) (0) | 2021.05.31 |
백준[11021번] :: A+B-7_파이썬(Python)공부 (0) | 2021.02.16 |
[Python 기초 : 수 나타내기] (0) | 2021.02.15 |