우당탕탕 개발일지

데이터프레임 정의, 열과 행 선택 본문

데이터 분석

데이터프레임 정의, 열과 행 선택

민아당긴아 2024. 10. 25. 00:19

데이터 직무 과제테스트 준비하느라 데이터프레임 문법 복습하기..

데이터프레임 정의

df = pd.DataFrame(
	{딕셔너리}
)

 

간단하게 df.info(), df.describe() 함수를 통해 데이터프레임에 대한 요약본을 볼 수 있다.

 

슬라이싱

슬라이싱을 통해 열 또는 행의 일부를 선택해서 추출한다.

열 선택

df[선택할 열]

선택할 열이 두 개 이상인 경우 리스트 형식으로 써주기

df['name']
df[['name', 'height']]

행 선택

df[비교 연산자를 이용한 조건 표현식]

# 예
df[ df['sex'] == 'M' ]
df[ df['age'].isin([25,33]) ]
df[ (df['sex'] == 'M') & (df['height'] >= 160.0) ]
df[ (df['age'] <= 30) | (df['height'] < 160.0) ]

행과 열 선택

df.loc[행 선택 조건, 열 선택 조건]

df_1 = df.loc[ (df['height'] >= 170.0) , 'name']
df_1

인덱스 숫자를 사용하여 슬라이싱하려면 df.iloc을 사용해주면 된다.

범위를 설정해주고 싶으면 :을 사용하면 된다.

참고로 인덱스는 0부터 시작한다.

df.iloc[3,1]
df.iloc[3,1:3]

 

pd.Series

데이터프레임을 구성하는 하나의 행 또는 열은 시리즈란 형식으로 저장된다.