본문 바로가기
파이썬/데이터 분석

[240930] 데이터 분석 #7 이변량 - 숫자 vs 범주

by 황오독 2024. 10. 1.

1. 시각화

sns.kdeplot(x=feature, data=data, y=target, common_norm=False)

두 그래프가 떨어져 있을 수록 차이가 크다고 봄.

sns.kdeplot(x=feature, data=data, y=target, multiple='fill')

 

2. 수치화

=> 따로 없고, 그래프로 해석하면 됨.

ex) 위 그래프를 보면 평균 사망율(빨간선)을 기준으로,

      25-39세 사망율이 평균보다 크고, 60-80세 사망율이 평균보다 크다는 것을 알 수 있다.