본문 바로가기

IT61

[240912] 데이터 다듬기 #3 판다스 데이터 프레임 탐색 더보기들어가기전, 익숙해져야 할 것들- head(): 상위 데이터 확인- tail(): 하위 데이터 확인- shape: 데이터프레임 크기- index: 인덱스 정보 확인- values: 값 정보 확인- columns: 열 정보 확인- dtypes: 열 자료형 확인- info(): 열에 대한 상세한 정보 확인- describe(): 기술통계정보 확인1. 앞, 뒤 일부 데이터, 크기 확인# 상위 10개 행 데이터tip.head(10)# 하위 3개 행 데이터tip.tail(3)# 인덱스 확인tip.index# 값 확인tip.values# 열 확인tip.columns# 열 자료 형 확인tip.dtypes# 열 자료형, 값 개수 확인tip.info()# 기술 통계tip.describe()** 여기선 아마 info.. 2024. 9. 12.
[240912] 데이터 다듬기 #2 판다스 데이터프레임 생성 데이터프레임이란? - Pandas 사용 목적이 데이터프레임을 사용하기 위함. - 보통 csv, 엑셀 파일 또는 DB에서 읽어 옴. 1. 데이터 프레임   (1) 라이브러리 불러오기 (**라이브러리 숙지 필수)import pandas as pdimport numpy as npimport matplotlib.pyplot as altimport seaborn as sns# matplotlib.pyplot과 seaborn 모두 시각화를 위한 라이브러리로,# matplotlib.pyplot은 classical 하지만 손이 많이 가고 (수동),# seaborn은 다루기 좀 더 쉬운 느낌이다. (자동)   (2) 리스트로 데이터프레임 만들기stock = [[94500, 92100, 92200, 92300], .. 2024. 9. 12.
[240912] 데이터 다듬기 #1 Numpy(넘파이) 더보기하나를 배우면 다른 하나를 자꾸 잊어버리게 된다. 이제 슬슬 헷갈리는 단계에 접어든듯..그날그날 복습은 물론, 이전에 배웠던 파이썬 함수, 리스트 등등도 꾸준히 공부해야할 것 같다ㅠ.ㅠ 지금까지 데이터 다루기를 배웠었는데, 오늘부터 3주차까지는 데이터 다듬기를 배우게 된다.후에 데이터 분석의 정확성과 모델의 성능을 높이기 위해 데이터를 처리하고 정제하는 과정으로, 아주 중요한 단계!파이썬에서는 pandas와 numpy를 사용하여 수행할 수 있다.Numpy란?Python이 수학적 연산을 보다 효과적으로 할 수 있게 만드는 패키지이다.배열을 작성하여 계산을 위한 빠르고 효율적인 방법을 제공하는데,특히, 다른 데이터형을 포함할 수 있는 리스트와 달리, Numpy 배열은 배열 내 모든 데이터 종류가 동일(.. 2024. 9. 12.
[240911] 파이썬 #11 - 이메일 보내기 **필수로 외워야 하는 것은 아니고, 알아두자는 목적으로 작성.((1단계)) : 필요한 라이브러리 불러오기# 라이브러리를 불러오기import smtplibfrom email.mime.text import MIMEText((2단계)) : 이메일 보내기 준비# smtp 주소s = smtplib.SMTP('smtp.gmail.com', 587)# TLS 보안 시작s.starttls()# 로그인 인증s.login('내가 가진 구글 계정', '보안 암호')((3단계)) : 이메일 내용 구성# 본문msg = MIMEText('''이거 파이썬으로 메일 보낸거당참말참말 대다나징얼렁 칭찬해줘''')# 제목msg['Subject'] = '우리집 고양이는 복실 고냥'((4단계)) : 이메일 보내기# 메일 보내기s.sendm.. 2024. 9. 11.