💻STUDY/BOJ

[BOJ] 2108. 통계학 (Python)

coldNoodlePigeon 2022. 2. 4.
  • 코딩 초보

2108. 통계학

 

수를 처리하는 것은 통계학에서 상당히 중요한 일이다. 통계학에서 N개의 수를 대표하는 기본 통계값에는 다음과 같은 것들이 있다. 단, N은 홀수라고 가정하자.

  1. 산술평균 : N개의 수들의 합을 N으로 나눈 값
  2. 중앙값 : N개의 수들을 증가하는 순서로 나열했을 경우 그 중앙에 위치하는 값
  3. 최빈값 : N개의 수들 중 가장 많이 나타나는 값
  4. 범위 : N개의 수들 중 최댓값과 최솟값의 차이

N개의 수가 주어졌을 때, 네 가지 기본 통계값을 구하는 프로그램을 작성하시오.

 

첫째 줄에 수의 개수 N(1 ≤ N ≤ 500,000)이 주어진다. 단, N은 홀수이다. 그 다음 N개의 줄에는 정수들이 주어진다. 입력되는 정수의 절댓값은 4,000을 넘지 않는다.

 

첫째 줄에는 산술평균을 출력한다. 소수점 이하 첫째 자리에서 반올림한 값을 출력한다.

둘째 줄에는 중앙값을 출력한다.

셋째 줄에는 최빈값을 출력한다. 여러 개 있을 때에는 최빈값 중 두 번째로 작은 값을 출력한다.

넷째 줄에는 범위를 출력한다.

 


import sys
from collections import Counter 

n=int(sys.stdin.readline())
lst=[]
for _ in range(n):
    k=int(sys.stdin.readline())
    lst.append(k)
lst.sort()

#산술평균 
print(round(sum(lst)/n))

#중앙값 
print(lst[n//2])

#최빈값 
count=Counter(lst).most_common(2)
if len(lst)>1:
    if count[0][1]==count[1][1]:
        print(count[1][0])
    else:
        print(count[0][0])
else:
    print(count[0][0])

#범위   
print(max(lst)-min(lst))

시간초과가 될까봐 sys.stdin.readline()을 사용했다. 

리스트에 각 값들을 for반복문을 이용하여 입력해주었고

산술평균의 경우 round()를 통해 반올림하여 출력하도록 하였다. 중앙값은 어차피 입력되는 값의 개수가 홀수이므로 n//2를 통해 인덱스에 접근하도록 해주었다. 

 

최빈값의 구현이 조금 어려웠는데, collections의 Counter를 import 하여 사용하였다. 

Counter(리스트).most_common(불러올 최빈값의 개수) 를 통해 2개를 가져오도록 한다. (동일한 수의 최빈값이 있을 경우 두번째로 작은 값을 출력하도록 하기 위해서) 

만약 리스트의 len이 1보다 크면, 만약 빈도값이 같을 경우 두번째로 작은 값을 (count[1][0])을 출력하고, 그게 아니라면 그냥 최빈값을 출력한다. len이 1일 경우 count[0][0]을 출력한다. (어차피 값이 하나이므로) 

 

범위의 경우 가장 큰 값과 가장 작은 값을 빼면 되므로 max와 min을 사용하여 빼준 것을 출력하면 된다. 

 

 

'💻STUDY > BOJ' 카테고리의 다른 글

[BOJ] 1193. 분수 찾기 (C)  (0) 2022.02.06
[BOJ] 2750. 수 정렬하기 (C,Python)  (0) 2022.02.05
[BOJ] 1260. DFS와 BFS (Python)  (0) 2022.02.03
[BOJ] 10866. 덱  (0) 2022.01.30
[BOJ] 11866. 요세푸스 문제 0  (0) 2022.01.30

댓글