[Pandas] 데이터 분석을 위한 판다스 사용법 - 2. 데이터 선택 : 행과 열 선택하기

2023. 7. 5. 22:54
반응형

Pandas

파이썬에서 데이터 분석에 많이 이용함, 3가지 형태의 자료 구조와 연산 지원

 

연산

- 데이터 선택
- 데이터 가공
- 데이터 분석

- 데이터 편집



데이터 선택

원하는 영역의 원소를 선택하는 연산

  1. Column, Value 확인하기
  2. 열(컬럼) 데이터 선택
  3. 행(로우) 데이터 선택
  4. 원하는 범위 데이터 선택
  5. 조건 데이터 선택
  6. 필터 데이터 선택

 

1. Column, Value 확인하기

df = pd.DataFrame(
    np.random.rand(10, 4),
    index = pd.date_range('2000-12-31', periods=10, freq='D'),
    columns = ['A', 'B', 'C', 'D']
)

df

 

1-1. 전체 인덱스 확인하기

df.index

 

1-2. 전체 컬럼 확인하기

df.columns

 

1-3. 데이터프레임 정보 확인하기

df.info

 

 

 

2. 열 데이터 선택하기

 

2-1. 컬럼 라벨로 직접 선택하기

# 열 선택(컬럼 라벨로 직접 선택하기)
df[['A', 'C']]

 

2-2. loc로 선택하기

컬럼 라벨 이름을 통해 선택하는 방법이다.

 

# loc로 열 선택
df.loc[:, ['A', 'C']]

 

 

2-3. iloc로 선택하기

컬럼 인덱스를 통해 선택하는 방법이다.

 

# iloc로 열 선택
df.iloc[:, 0:2]

 

 

# iloc로 열 선택 [ start : end : step ]
df.iloc[:, 0:3:2]

 

 

 

3. 행 데이터 선택하기

 

3-1. 인덱스 범위로 직접 선택하기

df[0:1]

 

df['2000-12-31':'2001-01-07']

 

 

3-2. loc로 선택하기

인덱스 이름(범위)을 통해 선택하는 방법이다.

df.loc['2000-12-31']

 

df.loc[['2000-12-31', '2001-01-07']]

 

df.loc['2000-12-31': '2001-01-07']

 

 

3-3. iloc로 선택하기

행의 인덱스 번호를 통해 선택하는 방법이다.

df.iloc[0]

 

df.iloc[0:2] # <-> 열 선택 df.iloc[:, 0:2]

 

df.iloc[0:5:2]

 

 

 

 

4. 원하는 데이터 범위(행+열) 선택하기

 

4-1. loc를 통한 선택하기

 

df.loc['2000-12-31', 'C']

 

df.loc[['2000-12-31', '2001-01-07'], ['A', 'C']]

 

df.loc['2000-12-31':'2001-01-03', 'B':'C']

 

 

4-2. iloc를 통한 선택하기

 

df.iloc[3:6, 1:3] #[행, 열]

 

df.iloc[[3, 6], [1, 3]]

반응형

BELATED ARTICLES

more