IQR이란? (InterQuartile Range) IQR는 상위 75% 지점의 값과 하위 25 지점의 값 차이를 의미한다. boxplot을 이용하여 간단하게 이상치(Outlier)를 찾고 제거할 수 있다. 위 그림은 boxplot을 정리한 그림이며 IQR과 Q1, Q3, 그리고 이상치의 범위를 구할 수 있다. 이상치(Outlier) 구하기 이상치의 범위를 풀어서 설명하면 Q1 - 1.5 x IQR 보다 작고 Q3 + 1.5 x IQR 보다 커야한다. 극단적인 데이터가 많아 이상치 때문에 데이터 시각화가 어려울 경우 이상치를 제거하고 시각화를 진행하면 된다. 데이터셋은 경상북도 코로나 확진자 수 현황을 이용했다. import pandas as pd df = pd.read_csv('경상북도_시군별 코로나 ..
분류 전체보기
넘파이란? 넘파이는 행렬이나 대규모 다차원 배열을 쉽게 처리할 수 있도록 지원하는 Python의 라이브러리이다. 넘파이는 데이터 구조 외에도 수치 계산을 위해 효율적으로 구현된 기능을 제공한다 (출처: 위키백과) 배열 생성 import numpy as np d1 = np.array([1, 2, 3, 4]) d1 >> array([1, 2, 3, 4]) 가장 기본적인 넘파이의 배열 생성이다. 첫번째 줄은 numpy를 간단하게 쓰기 위해 사용한다. 사실 없어도 되지만 편의성을 위해 거의 규칙처럼 np로 사용한다. np.array() 를 이용해 괄호 안에 배열을 넣어주면 간단하게 생성이 가능하다. 자료형 확인 type(d1) >> numpy.ndarray ndarray는 N-Dimension array 즉 N..
·취미
서론 본인이 참가했던 대회는 제11회 화성시복싱협회장배 생활체육 대회이다. 사실 그렇게 큰 대회는 아니고.. 말 그대로 생활 체육 대회이다. 물론 선수를 준비하는 꿈나무 친구들도 여럿 참가했지만 그런 친구들은 대부분 중학생, 고등학생이었다. 참가한지 시간이 꽤나 지났지만 기록하고 싶기에 작성한다...!! 미리 스포하자면.. 20대부 -60kg 2전 2승으로 금메달을 걸게되었다 !.! 오전 8시 출발 혹시나 지장이 갈까 간단하게 요기를 한 후 체육관으로 출발했다. 매일 가던 체육관이었지만 그 날따라 체육관이 어색했다. 약 20명의 사람이 모였고 관장님이 오신 후 같이 운동하던 형님 차를 얻어타 출발했다. 간단하게 대화를 나눴다. "이기던 지던 그냥 뭐 경험하는거죠~"라고 말했지만 마음 속으로는 굉장히 떨렸..
·알고리즘
트리 정렬이란 이진 탐색 트리를 이용하여 정렬하는 방법이다. 정렬할 원소들을 이진 탐색 트리로 구성하고, 중위 우선 순회 방법을 사용한다. 중위 순회의 경로가 오름차순 정렬이 된다. 트리 정렬 수행 과정 정렬되지 않은 {30, 3, 49, 12, 1, 24, 5} 를 트리 정렬을 통해 과정을 살펴보자. 1. 정렬되지 않은 자료를 이진 탐색 트리로 구성한다. 2. 중위 순회 연산을 시행하면 순회 순서가 정렬 값이다. 중위 순회 순서: 1, 3, 5, 12, 24, 30, 49 트리 정렬 복잡도 분석 메모리 공간 사용 원소 n개의 대하여 n개의 메모리 사용 크기 n의 이진 탐색 트리 저장 공간 연산 시간 n개의 노드에 대한 시간 복잡도 O(nlog2 n)