본문 바로가기

IT60

[240920] 데이터다듬기 #5 판다스 데이터프레임 변경(1) 학생때 열심히 공부하라는 말 좀 들을걸.. 지나고나서야 깨닫습니다..ㅠ 1. 열 이름 변경 1) 일부 열 이름 변경 : rename() 메서드 ex) total_bill_amount => total_bill male_female => sex 2) 모든 열 이름 변경 : colunms 속성 변경tip.rename(columns = {'total_bill_amount':'total_bill', 'male_female':'sex'}, inplace=True) tip.columns = { 바꾸려는 열 이름 모두 } 2. 열 추가# tip이라는 데이터프레임에 # final_amt 열 추가: final_amt = total_bill + tip tip['final_amt'] = tip['total_bill'] + t.. 2024. 9. 21.
[240913] 데이터다듬기#4 - 판다스 데이터프레임 집계 집계된 데이터에 대한 분석 방법을 배웠다.그래프를 그려 시각화하는 것도 배웠는데 드디어 뭔가 공부했던 것들이 눈 앞에 실현되는 기분이라 뿌듯하였다. 들어가기 앞서 연속값, 범주값의 용어에 대한 설명을 들었다.집계기준이 될 범주값과, 집계 대상 열이 되는 연속값 (합,평균등 집계)은데예를 들어 OOO별 OOO값 처럼 OOO별이 범주값, OOO값이 연속값이다. 1. 데이터 집계'day'별 'tip' 의 합을 알고 싶으면tip.groupby(by='day', as_index=False)[['tip]].sum()tip.groupby(by='day', as_index=False)as_index=True가 디폴트 값이며,as_index=True 'day'가 인덱스값이 되어 열이 1개가 됨 ==> 시리즈로 나타남.a.. 2024. 9. 13.
[240913] 데이터다듬기#3 - 판다스 데이터프레임 조회 데이터프레임을 조회하기 위한 방법들import pandas as pd import numpy as np import matplotlib pyplot as plt import seaborn as sns- 가장 기본적인 라이브러리 불러오기 - 처음엔 어케 안보고 적나 했는데, 쓰다보니 정말 외워지게 되었다!! 1. 특정 열 조회더보기 df.loc[ 행, 열 ]열을 조회할 때는 df.loc[:, [열이름1, 열이름2...] 형태로 조회할 열 이름을 지정한다.보통 행보다는 열을 많이 조회하게 되는데원래라면 열 부분은 생략할 수 있지만, 행 부분을 생략할 수는 없다. 하지만 자주 사용하다보니 편의를 위해서 행 부분과 loc를 생략하여 조회할 수 있다.df[열이름]으로 조회# total_bill 열 조회 # tip.. 2024. 9. 13.
[240912] 데이터 다듬기 #3 판다스 데이터 프레임 탐색 더보기들어가기전, 익숙해져야 할 것들- head(): 상위 데이터 확인- tail(): 하위 데이터 확인- shape: 데이터프레임 크기- index: 인덱스 정보 확인- values: 값 정보 확인- columns: 열 정보 확인- dtypes: 열 자료형 확인- info(): 열에 대한 상세한 정보 확인- describe(): 기술통계정보 확인1. 앞, 뒤 일부 데이터, 크기 확인# 상위 10개 행 데이터tip.head(10)# 하위 3개 행 데이터tip.tail(3)# 인덱스 확인tip.index# 값 확인tip.values# 열 확인tip.columns# 열 자료 형 확인tip.dtypes# 열 자료형, 값 개수 확인tip.info()# 기술 통계tip.describe()** 여기선 아마 info.. 2024. 9. 12.