[240920] 데이터다듬기#7 - 판다스 데이터프레임 변경 (3)
1. 데이터프레임 합치기 (Concat) => '인덱스 값'을 기준# 가로로 합치기 (axis=1) # 실무에서 쓰일 일은 많이 없음. pop = pd.concat([pop01, pop02], join='outer', axis=1) pop = pd.concat([pop01, pop02], join='inner', axis=1) # 세로로 합치기 (axis=0) pop = pd.concat([pop01. pop02], join='outer', axis=0) pop = pd.concat([pop01. pop02], join='inner', axis=0) => 인덱스 값이 중복되므로 인덱스를 초기화 pop.reset_index(drop=Ture, inplace=True) 2. 데이터프레임 합치기 (Merge)..
2024. 9. 21.
[240920] 데이터다듬기#6 - 판다스 데이터프레임 변경 (2)
1. 결측치 처리 (info(), isna(), isnull(), notnull(), isna().sum()) - 결측치는 NaN 값으로, 누락된 데이터를 처리하기 위한 전처리 작업이 필요함. - 제거를 하거나, 다른 값(평균값, 최빈값 등)으로 채워야 함. 1) 결측치 찾기# info() df.info() # Non-Null Count를 확인하여, Null 값을 찾는다. # isna(), isnull(), notnull() df.isnull() # Null 값을 True나 False로 반환 (결측치를 True로 반환) # isna().sum() df.isna().sum() # 열의 결측치 개수 확인 2) 결측치 제거 (dropna())# dropna() df.dropna(axis=0, inplace=T..
2024. 9. 21.