본문 바로가기

머신러닝5

[머신러닝-지도] 성능평가 * 어떻게 평가할 것인가?* 분류 모델 평가- 0인지 1인지를 예측하는 것- 실제 값도 0과 1이고, 예측 값도 0과 1임- 하지만 0을 1로 예측하거나 1을 0으로 예측할 수 있음- 예측 값이 실제 값과 많이 같을 수록 좋은 모델이라 할 수 있음- 정확히 예측한 비율로 모델 성능을 평가=> 정확도를 높여라!!* 회귀 모델 평가- 회귀 모델이 정확한 값을 예측하기는 사실상 어려움- 예측 값과 실제 값에 차이(=오차)가 존재할 것이라 예상함- 예측 값이 실제 값에 가까울 수록 좋은 모델이라 할 수 있음- 예측한 값과 실제 값의 차이(=오차)로 모델 성능을 평가=> 오차를 줄여라!!  1. 회귀 모델 성능 평가- 우리가 실제로 예측하고 싶은 값, Target, 목푯값- 이 값과 비교해 우리 모델의 성능을 평.. 2024. 12. 16.
[머신러닝-지도] 머신러닝 소개 1. 머신러닝에 대한 이해(1) 학습 방법에 따른 분류지도 학습(Supervised Learning)- 입력 데이터와 해당 데이터의 정답(라벨)이 주어진 상태에서, 모델이 이를 학습하여 새로운 데이터의 결과를 정확하게 예측하도록 만드는 학습 방식비지도 학습(Unsupervised Learning)- 정답(라벨)이 없는 데이터에서 패턴, 구조, 군집을 찾아내어 데이터의 특성을 분석하거나 유사한 그룹을 형성하는 학습 방식 강화 학습(Reinforcement Learning)- 에이전트(강화학습을 수행하는 주체)가 환경과 상호작용하며 행동에 따른 보상을 받아 최적의 행동을 선택하고, 이를 통해 목표를 달성하는 정책을 학습하는 방식 (2) 과제에 따른 분류분류 문제(Classification)- 주어진 데이터를.. 2024. 12. 15.
[머신러닝(비지도)] #3 - Anomaly Detection (이상 탐지) ## 들어가기전 Anomaly Detection은 지도학습인 Classification과 같은 문제유형으로,모델을 만들고, 정상(normal)과 비정상(abnormal)을 평가한다.하지만 대체로 비지도학습에 가까운데,그 이유는 비정상 (Abnormal) 데이터가 너무 부족하기 때문이다.또한 그나마 있는 데이터도 Class를 대표하기 어렵다.=> 따라서, 정상(Normal) 데이터를 가지고 어디까지가 정상인지 추정한다. 1. 이상탐지의 몇 가지 Challenge (1) Label을 어떻게 확보할 것인가?   - 보통, Normal Data는 자동으로 수집하고, Abnoraml Data는 수동관리하는 경우가 많음   - 비지도 학습이지만, 모델을 평가하려면 Label이 필요함. (2) 낮은 성능 문제   -.. 2024. 10. 22.
[머신러닝(비지도)] #2 - Clustering_241021 1. K-means  (1) KMeans 함수 사용   - k : n_clusters   - n_inti : 초기값은 무작위 지정하여 결과가 조금씩 차이가 남.                 - 지정된 회수 만큼 수행하여 가장 좋은 군집모델 선택                 - 'auto' 데이터 크기와 군집 수에 맞게 적정하게 지정 (권장사항)   - 학습 시 x만 입력# K means 학습model = KMeans(n_cluster=2, n_init='auto')model.fit(x)# 예측pred = model.predict(x)  (2) 클러스터 개수(k) 지정   ① Inertia value : 군집화가 된 후에, 각 중심점에서 군집의 데이터 간의 거리를 합산한 값     - 값이 작을수록 군집화.. 2024. 10. 21.