본문 바로가기
알고리즘 자료구조

[알고리즘] 정렬 (선택정렬, 삽입정렬, 퀵정렬, 계수정렬)

by 커피는아아 2021. 3. 17.
반응형

정렬

  • 데이터를 특정한 기준에 따라서 순서대로 나열하는 것
  • 이진 탐색을 하기위한 전처리과정
  • 선택정렬, 삽입정렬, 퀵정렬, 계수정렬만 다뤄보자

선택 정렬 O(N^2)

  • 가장 작은것을 선택하여 맨 앞과 바꾼다
  • 특정한 리스트에서 가장 작은 데이터를 찾는 일이 코딩테스트에서 잦으므로 선택정렬 소스코드에 익숙해지자
array = [7, 5, 9, 0, 3, 1, 6, 2, 4, 8]

for i in range(len(array)):
        min_index = i # 가장 작은 원소의 인덱스, i번째 인덱스와 바꿀 가장 작은 인덱스를 찾는다.
        for j in range(i+1, len(array)):
                if array[min_index] > array[j]:
                        min_index =j
        array[i], array[min_index] = array[min_index], array[i] # 스와프

print(array)

파이썬 스와프(Swap) 소스코드

array = [3,5]
array[0] , array[i] = array[1], array[0]

print(array)

삽입 정렬 O(N^2)

  • 알고리즘 문제에서 사용하기에는 느린 정렬 방식 (선택보단 빠름)
  • 데이터를 하나씩 확인하며, 각 데이터를 적절한 위치에 삽입하면 어떨까?
  • 데이터가 거의 정렬되어 있을 때 효율적
  • 특정한 데이터를 적절한 위치에 삽입한다.
    • 적절한 위치 이전에, 그 앞까지의 데이터는 이미 정렬되어 있다고 가정한다.
  • 삽입정렬은 두번 째 데이터부터 시작한다. 첫 번째 데이터는 이미 정렬되어있다고 판단
array = [7, 5, 9, 0, 3, 1, 6, 2, 4, 8]

for i in range(1, len(array)):
        for j in range(i, 0, -1): # 인덱스 i 부터 1까지 감소하며 반복하는 문법
                if array[j] < array[j-1]: # 한 칸씩 왼쪽으로 이동
                         array[j], array[j-1] , array[j-1], array[j]
                else:
                    break
print(array)

퀵 정렬 O(NlogN) ~ O(N^2)

  • 피벗

    • 큰수와 작은 수를 교환 할 때 교환하기 위한 '기준'
  • 호어 분할 방식 (Hoare Partition)

    • 피벗을 기준으로 왼쪽에서는 피벗보다 큰값 오른쪽에서는 피벗보다 작은 값을 찾는다

    • 두개의 위치를 바꿔준다

    • 엇갈린다면 피벗과 위치를 변경한다.

    • 일반적인 소스코드

      
      array = [5, 7, 9, 0, 3, 1, 6, 2, 4, 8]
      
      def quick_sort(array, start, end):
            if start >= end: # 원소가 1개인 경우 종료
                    return
            pivot = start # 피벗은 첫 번째 원소
            left = start + 1
            right = end
            while left <= right:
                        # 피벗보다 큰 데이터를 찾을 때 까지 반복
                        while left <= end and array[left] <= array[pivot]:
                                left += 1
                            # 피벗보다 작은 데이터를 찾을 때까지 반복
                        while right > start and array[right] >= array[pivot]:
                                right -= 1
                        if left > right: # 엇갈렸다면 작은 데이터와 피벗을 교체
                                array[right], array[pivot] = array[pivot], array[right]
                        else: # 엇갈리지 않았다면 작은 데이터와 큰 데이터를 교체
                                array[left], array[right], array[right], array[left]
      
             # 분할 이후 왼쪽 부분과 오른쪽 부분에서 각각 정렬 수행
             quick_sort(array, start, rigth - 1)
             quick_sort(array, rigth + 1, end)
      
      quick_sort(array, 0, len(array) -1)
      print(array)
      
      # 큰데이터는 찾았으나 작은데이터는 못찾을시 stay
      # 작은 데이터는 찾았으나 큰데이터를 못찾는다면 피벗과 교환
    • 파이썬의 장점을 살린 퀵 정렬 소스코드

      array = [5, 7, 9, 0, 3, 1, 6, 2, 4, 8]
      
      def quick_sort(array):
            # 리스트가 하나 이하의 원소만을 담고 있다면 종료
            if len(array) <= 1:
                    return array
            pivot = array[0] # 피벗은 첫 번째 원소
            tail = array[1:] # 피벗을 제외한 리스트
      
            left_side = [x for x in tail if x <= pivot] # 분할된 왼쪽 부분
            right_side = [x for x in tail if x > pivot] # 분할된 오른쪽 부분
      
            # 분할 이후 왼쪽 부분과 오른쪽 부분에서 각각 정렬 수행하고, 전체 리스트를 반환
            return quick_sort(left_side) + [pivot] + quick_sort(right_side)
      print(quick_sort(array))

      계수정렬 O(N+K)

    • 특정한 조건이 부합할 때만 사용할 수 있으나 매우 빠르다

    • 조건

      • 데이터의 크기 범위가 제한되어 정수 형태로 표현할 수 있을 때
      • 가장 작은 데이터와 큰 데이터의 차이가 100만 이하일 때 효과적으로 사용
    • 조건이 붙는 이유

      • 모든 범위를 담을 수 있는 크기의 리스트(배열)을 선언해야 하기 때문
      # 계수 정렬 소스코드
      
      # 모든 원소의 값이 0보다 크거나 같다고 가정
      array = [7 ,5, 9, 0, 3, 1, 6, 2, 9, 1, 4, 8, 0, 5, 2]
      
      # array의 모든 범위를 포함하는 리스트 선언(모든 값은 0으로 초기화)
      count = [0] * (max(array) + 1) # ~~len(array)으로도 되는지 확인~~ # +1을 하는 이유는 10의 데이터 차이까지는 11개의 수가 존재하기 때문
      
      for i in range(len(array)):
            count[array[i]] += 1 # 각 데이터에 해당하는 인덱스의 값 증가
      
      for i in range(len(count)): # 리스트에 기록된 정렬 정보 확인
            for j in range(count[i]):
                    print(i, end=' ') # 띄어쓰기를 구분으로 등잔한 횟수만큼 인덱스 출력

      파이썬의 정렬 라이브러리

    • 병합정렬로 이루어져있다

    • 단 최악의 경우라도 O(NlogN)을 보장한다.

      정렬 알고리즘이 사용되는 경우

    1. 정렬 라이브러리로 풀 수 있는 문제

    2. 정렬 알고리즘의 원리에 대해서 물어보는 문제

    3. 더 빠른 정렬이 필요한 문제 (계수정렬, 기존 알고리즘 개선)

      # sorted 소스코드
      
      array = [7, 5, 9, 0, 3, 1, 6, 2, 4, 8]
      
      result = sorted(array)
      print(result)
      
      # sort()함수 사용
      array.sort()
      
      # key 매개변수 입력 key값으로는 함수가 들어가야 하며 이는 정렬 기준이 된다.
      
      # key 값은 람다(lambda 함수를 사용할 수 도 있다)
      
      array= [('바나나',2), ('사과',5), ('당근',3)]
      
      def setting(data):
           return data[1]
      
      result = sorted(array, key=setting)
      print(result)