본문 바로가기

IT60

6091 : [기초-종합] 함께 문제 푸는 날(설명)(py) 문제더보기온라인 채점시스템에는 초등학생, 중고등학생, 대학생, 대학원생,일반인, 군인, 프로그래머, 탑코더 등 아주 많은 사람들이 들어와 문제를 풀고 있는데,실시간 채점 정보는 메뉴의 채점기록(Judge Status)을 통해 살펴볼 수 있다.자! 여기서...잠깐..같은 날 동시에 가입한 3명의 사람들이 온라인 채점시스템에 들어와 문제를 푸는 날짜가매우 규칙적이라고 할 때, 다시 모두 함께 문제를 풀게 되는 그날은 언제일까?예를 들어 3명이 같은 날 가입/등업하고, 각각 3일마다, 7일마다, 9일마다한 번씩 들어온다면, 처음 가입하고 63일 만에 다시 3명이 함께 문제를 풀게 된다.갑자기 힌트?왠지 어려워 보이지 않는가?수학에서 배운 최소공배수를 생각한 사람들도 있을 것이다. 하지만, 정보에서 배우고 경험.. 2024. 10. 1.
6088 : [기초-종합] 수 나열하기1(py) 문제어떤 규칙에 따라 수를 순서대로 나열한 것을 수열(sequences)이라고 한다.예를 들어1 4 7 10 13 16 19 22 25 ... 은1부터 시작해 이전에 만든 수에 3을 더해 다음 수를 만든 수열이다.이러한 것을 수학에서는 앞뒤 수들의 차이가 같다고 하여등차(차이가 같다의 한문 말) 수열이라고 한다. (등차수열 : arithmetic progression/sequence)수열을 알게 된 영일이는 갑자기 궁금해졌다."그럼.... 123번째 나오는 수는 뭘까?"영일이는 프로그램을 만들어 더 큰 수도 자동으로 계산하고 싶어졌다.시작 값(a), 등차(d), 몇 번째인지를 나타내는 정수(n)가 입력될 때n번째 수를 출력하는 프로그램을 만들어보자. 내 코드a, d, n = map(int, input().. 2024. 10. 1.
[240930] 데이터 분석 #7 이변량 - 숫자 vs 범주 1. 시각화sns.kdeplot(x=feature, data=data, y=target, common_norm=False)sns.kdeplot(x=feature, data=data, y=target, multiple='fill') 2. 수치화=> 따로 없고, 그래프로 해석하면 됨.ex) 위 그래프를 보면 평균 사망율(빨간선)을 기준으로,      25-39세 사망율이 평균보다 크고, 60-80세 사망율이 평균보다 크다는 것을 알 수 있다. 2024. 10. 1.
[240930] 데이터 분석 #6 이변량 - 범주 vs 범주 1. 교차표pd.crosstab(data[feature], data[target])normalize = 'columns' / 'index' 로 열 기준으로 할 것인지, 행 기준으로 할 것인지 정할 수 있다. 2. 시각화mosaic(data, [feature, target])plt.axhline(data[target].mean(), color = 'r') 3. 수치화 : 카이제곱검정 (실제데이터와 기대빈도의 차이값)- 자유도 (범주의 수 - 1)의 약 2배보다 크면, 차이가 있다고 봄.- 교차표로 집계하여 저장 후, 카이제곱 검정을 진행한다.table = pd.crosstab(df[feature], df[target])spst.chi2_contingency(table) 2024. 10. 1.