데이터 분석
데이터프레임 정의, 열과 행 선택
하고파
2024. 10. 25. 00:19
데이터 직무 과제테스트 준비하느라 데이터프레임 문법 복습하기..
데이터프레임 정의
df = pd.DataFrame(
{딕셔너리}
)
간단하게 df.info(), df.describe() 함수를 통해 데이터프레임에 대한 요약본을 볼 수 있다.
슬라이싱
슬라이싱을 통해 열 또는 행의 일부를 선택해서 추출한다.
열 선택
df[선택할 열]
선택할 열이 두 개 이상인 경우 리스트 형식으로 써주기
df['name']
df[['name', 'height']]
행 선택
df[비교 연산자를 이용한 조건 표현식]
# 예
df[ df['sex'] == 'M' ]
df[ df['age'].isin([25,33]) ]
df[ (df['sex'] == 'M') & (df['height'] >= 160.0) ]
df[ (df['age'] <= 30) | (df['height'] < 160.0) ]
행과 열 선택
df.loc[행 선택 조건, 열 선택 조건]
df_1 = df.loc[ (df['height'] >= 170.0) , 'name']
df_1
인덱스 숫자를 사용하여 슬라이싱하려면 df.iloc을 사용해주면 된다.
범위를 설정해주고 싶으면 :을 사용하면 된다.
참고로 인덱스는 0부터 시작한다.
df.iloc[3,1]
df.iloc[3,1:3]
pd.Series
데이터프레임을 구성하는 하나의 행 또는 열은 시리즈란 형식으로 저장된다.