우당탕탕 개발일지
데이터프레임 정의, 열과 행 선택 본문
데이터 직무 과제테스트 준비하느라 데이터프레임 문법 복습하기..
데이터프레임 정의
df = pd.DataFrame(
{딕셔너리}
)
간단하게 df.info(), df.describe() 함수를 통해 데이터프레임에 대한 요약본을 볼 수 있다.
슬라이싱
슬라이싱을 통해 열 또는 행의 일부를 선택해서 추출한다.
열 선택
df[선택할 열]
선택할 열이 두 개 이상인 경우 리스트 형식으로 써주기
df['name']
df[['name', 'height']]
행 선택
df[비교 연산자를 이용한 조건 표현식]
# 예
df[ df['sex'] == 'M' ]
df[ df['age'].isin([25,33]) ]
df[ (df['sex'] == 'M') & (df['height'] >= 160.0) ]
df[ (df['age'] <= 30) | (df['height'] < 160.0) ]
행과 열 선택
df.loc[행 선택 조건, 열 선택 조건]
df_1 = df.loc[ (df['height'] >= 170.0) , 'name']
df_1
인덱스 숫자를 사용하여 슬라이싱하려면 df.iloc을 사용해주면 된다.
범위를 설정해주고 싶으면 :을 사용하면 된다.
참고로 인덱스는 0부터 시작한다.
df.iloc[3,1]
df.iloc[3,1:3]
pd.Series
데이터프레임을 구성하는 하나의 행 또는 열은 시리즈란 형식으로 저장된다.
'데이터 분석' 카테고리의 다른 글
데이터프레임 groupby 함수 정복하기 (0) | 2024.10.25 |
---|---|
데이터프레임 새로운 열 만들기 (0) | 2024.10.25 |
데이터프레임 정렬, 열/행 제거, 열 이름 바꾸기 (0) | 2024.10.25 |
[BDA 7기 데이터분석 중급반] 3주차에 써보는 스타트 글 (0) | 2023.09.18 |