본문 바로가기
미니 프로젝트

[240923] 1차 미니 프로젝트 (1)

by 황오독 2024. 9. 24.

KT 에이블스쿨 입교 후, 첫 미니 프로젝트를 진행하였다.

이틀로 진행되었는데, 이틀 모두 전원이 모두 참석한 조는 우리 조밖에 없었다!.!

특히나 우리 조에서는 인천에서 오시는 분이 있었는데.. 아침 여섯시에 기상한다고 하셨음ㄷㄷ

 

어쨌등가 아침일찍 버스를 타고 탄방역 옆에 있는 KT 타워에 도착하였다. (우리 교육장은 13층이었다.)

 

첫 프로젝트의 주제는 '소비자 구매 패턴 분석을 통한 고객 이탈 예측' 이었다.

정리되지 않은 고객, 판매 Raw 데이터로 Null 값을 제거하고, 이탈고객을 레이블링을 하는

데이터 가공 및 전처리 실습이었다.

 

개별 실습을 15시까지 진행하고, 후에 조끼리 코드를 공유하며 서로 배워갔다.

맞게 풀었는지 한번더 풀어보려고 했는데, 15시까지 꽉꽉 채워풀어버림.ㅠㅠ

다 풀긴했지만 너무 빠듯한 시간이었다.

 

조별 실습 시간이 되어 코드를 공유하였는데, 푼 사람 모두 row, column 수가 달라서 혼란스러웠다.

 

특히나 내가 가장 어렵고 헷갈렸던 부분은 merge() 함수에서 how='inner'와 how='left' 였다.

 

둘이 뭔가 비슷한 느낌이라서, 어떤 상황에 inner를 써야하는지, 어떤 상황에 outer를 써야하는지 헷갈렸다.

 

근데 우리 조의 에이블러님께서 그림까지 보여주셔서 진짜 기똥차게 설명해주셔서 이해가 됐다.

 

강사님이 후에 주신 답지와 비교했을때 자꾸 결과가 틀렸던 이유가 바로 left와 inner 때문이었다닝

 

 

=> 에이블러님께서 보여주신 그림처럼 피피티로 만들어보았다.

=> 간단하게 inner의 경우 공통된 칼럼만, outer는 상관없이 모두, left는 왼쪽 기준, right는 오른쪽 기준으로 뽑아내는것

=> 확실히 그림으로 보니까 이해가 잘 되었다.

 

그래서 마지막에 merge를 썼을때 left를 써야하는데 inner로 쓰다보니 칼럼 개수가 안맞았던 것..

 

처음 개념을 접할 때는 inner랑 left가 비슷한 의미로 넘어갔었는데

프로젝트를 진행하면서 확실히 개념을 짚게 되어서 너무 좋았다.

 

ps. 점심은 구내식당에서 먹었는데 전망이 너무 좋았당 푸항항:)