[Pandas] 데이터 분석을 위한 판다스 사용법 - 2. 데이터 선택 : 행과 열 선택하기
2023. 7. 5. 22:54
반응형
Pandas
파이썬에서 데이터 분석에 많이 이용함, 3가지 형태의 자료 구조와 연산 지원
연산
- 데이터 선택
- 데이터 가공
- 데이터 분석
- 데이터 편집
데이터 선택
원하는 영역의 원소를 선택하는 연산
- Column, Value 확인하기
- 열(컬럼) 데이터 선택
- 행(로우) 데이터 선택
- 원하는 범위 데이터 선택
- 조건 데이터 선택
- 필터 데이터 선택
1. Column, Value 확인하기
df = pd.DataFrame(
np.random.rand(10, 4),
index = pd.date_range('2000-12-31', periods=10, freq='D'),
columns = ['A', 'B', 'C', 'D']
)
df
1-1. 전체 인덱스 확인하기
df.index
1-2. 전체 컬럼 확인하기
df.columns
1-3. 데이터프레임 정보 확인하기
df.info
2. 열 데이터 선택하기
2-1. 컬럼 라벨로 직접 선택하기
# 열 선택(컬럼 라벨로 직접 선택하기)
df[['A', 'C']]
2-2. loc로 선택하기
컬럼 라벨 이름을 통해 선택하는 방법이다.
# loc로 열 선택
df.loc[:, ['A', 'C']]
2-3. iloc로 선택하기
컬럼 인덱스를 통해 선택하는 방법이다.
# iloc로 열 선택
df.iloc[:, 0:2]
# iloc로 열 선택 [ start : end : step ]
df.iloc[:, 0:3:2]
3. 행 데이터 선택하기
3-1. 인덱스 범위로 직접 선택하기
df[0:1]
df['2000-12-31':'2001-01-07']
3-2. loc로 선택하기
인덱스 이름(범위)을 통해 선택하는 방법이다.
df.loc['2000-12-31']
df.loc[['2000-12-31', '2001-01-07']]
df.loc['2000-12-31': '2001-01-07']
3-3. iloc로 선택하기
행의 인덱스 번호를 통해 선택하는 방법이다.
df.iloc[0]
df.iloc[0:2] # <-> 열 선택 df.iloc[:, 0:2]
df.iloc[0:5:2]
4. 원하는 데이터 범위(행+열) 선택하기
4-1. loc를 통한 선택하기
df.loc['2000-12-31', 'C']
df.loc[['2000-12-31', '2001-01-07'], ['A', 'C']]
df.loc['2000-12-31':'2001-01-03', 'B':'C']
4-2. iloc를 통한 선택하기
df.iloc[3:6, 1:3] #[행, 열]
df.iloc[[3, 6], [1, 3]]
반응형
'Data Science > 데이터분석 (Spark)' 카테고리의 다른 글
[Pandas] 데이터 분석을 위한 판다스 사용법 - 6. 데이터 편집 (0) | 2023.07.06 |
---|---|
[Pandas] 데이터 분석을 위한 판다스 사용법 - 5. 데이터 분석 (0) | 2023.07.06 |
[Pandas] 데이터 분석을 위한 판다스 사용법 - 4. 데이터 가공 : 자료구조와 원소 변경하기 (0) | 2023.07.05 |
[Pandas] 데이터 분석을 위한 판다스 사용법 - 3. 데이터 선택 : 조건과 필터 (0) | 2023.07.05 |
[Pandas] 데이터 분석을 위한 판다스 사용법 - 1. 자료구조 (0) | 2023.07.05 |