눈떠보니 월요일 2021. 8. 18. 15:38
자료구조 기초

탐색 : "많은 양의 데이터 중에서 원하는 데이터를 찾는 과정"

- 대표적인 탐색 알고리즘 : DFS/BFS - 스택, 큐, 재귀함수의 이해 필요

자료구조 : "데이터를 표현하고 관리하고 처리하기 위한 구조"

- 삽입(push), 삭제(pop)

 

스택(stack)

- 선입후출 or 후입선출 구조

# 삽입(5) - 삽입(2) – 삽입(7) – 삭제( ) – 삽입(1) – 삽입(3) – 삭제( )

stack = []
stack.append(5)
stack.append(2)
stack.append(7)
stack.pop()
stack.append(1)
stack.append(3)
stack.pop()
print(stack) # 최하단 원소부터 출력 5 2 1
print(stack[::-1]) # 최상단 원소부터 출력 1 2 5

 

큐(Queue)

- 선입선출

# 삽입(5) - 삽입(2) – 삽입(7) – 삭제( ) – 삽입(1) – 삽입(3) – 삭제( )
from collections import deque

queue = deque()

queue.append(5)
queue.append(2)
queue.append(7)
queue.popleft()
queue.append(1)
queue.append(3)
queue.popleft()
print(queue) # 먼저 들어온 순서대로 출력 7 1 3
queue.reverse() # 역순으로 바꾸기
print(queue) # 나중에 들어온 순서대로 출력 3 1 7

- 리스트로 이용할 경우 시간복잡도가 높아짐

 

재귀함수(Recursive Function)

- 자기 자신을 다시 호출하는 함수

# 재귀 함수 예제
def recursive_function():
    print('재귀함수 호출')
    recursive_function()

recursive_function()

-> 무한 루프 : 종료조건을 명시해야함

# 두 가지 방식으로 구현한 팩토리얼 예제

# 반복문으로 구현한 n!
def factorial_iterative(n):
    result = 1
    for i in range(1, n+1):
        result *= i
    return result

# 재귀적으로 구현한 n!
def factorial_recursive(n):
    if n<=1:
        return 1
    return n * factorial_recursive(n-1)

 

최대공약수 계산 - 유클리드 호제법

유클리드 호제법 : 두 개의 자연수에 대한 최대 공약수를 구하는방법

- 두 자연수 A,B에 대하여 (A>B) A를 B로 나눈 나머지를 R이라고 한다.

- 이때 A와 B의 최대공약수는 B와 R의 최대공약수와 같다

(예시) : GCD(192, 162)

단계 A B
1 192 162
2 162 30
3 30 12
4 12 6
def gcd(a,b):
    if a%b == 0:
        return b
    elsel:
        return gcd(b, a%b)
        
print(gcd(192,162))
  • 재귀 함수를 잘 활용하면 복잡한 알고리즘을 간결하게 작성할 수 있다. (단, 오히려 다른 사람이 이해하기 어려운 형태의 코드가 될 수 있기 때문에 신중히 사용)
  • 모든 재귀함수는 반복문을 이용하여 동일한 기능 구현 가능
  • 재귀함수가 반복문보다 유리한 경우도 있고 불리한 경우도 있다.
  • 컴퓨터가 함수를 연속적으로 호출하면 컴퓨터 메모리 내부의 스택 프레임이 쌓인다. 그래서 스택을 사용해야 할 때 구현상 스택 라이브러리 대신에 재쉬함수를 이용하는 경우가 많음

탐색 알고리즘 DFS/BFS

DFS(Depth-First-Search)

"깊이 우선 탐색이라고도 부르며, 그래프에서 깊은 부분을 우선적으로 탐색하는 알고리즘"

[그래프 표현 방식]

1. 인접 행렬 : 2차원 배열로 그래프의 연결 관계를 표현하는 방식

인접 행렬

INF = 999999999 # 무한의 비용 선언

graph = [
	[0, 7, 5],
    [7, 0, INF],
    [5, INF, 0]
]

print(graph)

 

2. 인접 리스트 : 리스트로 그래프의 연결 관계를 표현하는 방식

- 모든 노드에 연결된 노드에 대한 정보를 차례대로 연결하여 저장

인접 리스트

# 행이 3개인 2차원 리스트로 인접 리스트 표현
graph = [[] for _ in range(3)]

# 노드 0에 연결된 노드 정보 저장(노드, 거리)
graph[0].append((1,7))
graph[0].append((2,5))

# 노드 1에 연결된 노드 정보 저장(노드, 거리)
graph[1].append((0,7))

# 노드 2에 연결된 노드 정보 저장(노드, 거리)
graph[2].append((0,5))

print(graph)

인접 행렬 vs 인접 리스트

[메모리 측면]

인접 행렬 - 모든 관계를 저장하므로 노드 개수가 많을수록 메모리가 불필요하게 낭비

인접 리스트 - 연결된 정보만을 저장하기 때문에 메모리를 효율적으로 사용

[속도]

인접 리스트 방식은 인접 행렬 방식에 비해 특정한 두 노드가 연결되어 있는지에 대한 정보를 얻는 속도가 느림

 

DFS의 동작 과정(stack 자료 구조 이용)

1. 탐색 시작 노드를 스택에 삽입하고 방문 처리

2. 스택의 최상단 노드에 방문하지 않은 인접 노드가 있으면 그 인접 노드를 스택에 넣고 방문 처리, 방문하지 않은 인접 노드가 없으면 스택에서 최상단 노드를 꺼냄

3. 2번 과정을 더 이상 수행할 수 없을 때까지 반복

 

그래프 예시(일반적으로 인접한 노드 중에서 방문하지 않은 노드가 여러 개 있으면 번호가 낮은 순서부터 처리한다.)

tip.  방문처리된 노드는 회색으로, 현재 처리하는 스택의 최상단 노드는 하늘색으로 표현

결과적으로 노드의 탐색 순서(스텍에 들어간 순서)는 다음과 같다

[1 -> 2 -> 7 -> 6 -> 8 -> 3 ->4 -> 5]

- DFS는 스텍을 이용하는 알고리즘이기 때문에 실제 구현은 재귀함수를 이용했을 때 매우 간결하게 구현할 수 있다.

def dfs(graph, v, visited):
    #현재 노드 방문처리
    visited[v] = True
    print(v, end=' ')
    # 현재 노드와 연결된 다른 노드를 재귀적으로 방문
    for i in graph[v]:
        if not visited[i]:
            dfs(graph, i, visited)

graph = [
    [],
    [2,3,8],
    [1,7],
    [1,4,5],
    [3,5],
    [3,4],
    [7],
    [2,6,8],
    [1,7]
]

visited = [False] * 9

dfs(graph, 1, visited)

 

BFS(Breadth-First-Search)

"너비 우선 탐색이라는 의미를 가지며 가까운 노드부터 탐색하는 알고리즘"

BFS의 동작 과정(Queue 자료 구조 이용)

1. 탐색 시작 노드를 큐에 삽입하고 방문 처리를 한다.

2. 큐에서 노드를 꺼내 해당 노드의 인접 노드 중에서 방문하지 않은 노드를 모두 큐에 삽입하고 방문 처리를 한다.

3. 2번의 과정을 더 이상 수행할 수 없을 때까지 반복한다.

- 일반적인 경우 실제 수행 시간은 DFS보다 좋은편임.

결과적으로 노드의 탐색 순서(큐에 들어간 순서)는 다음과 같다

[1 -> 2 -> 3 -> 8 -> 7 -> 4 -> 5 -> 6]

from collections import deque

def bfs(graph, start, visited):
    # 큐 구현을 위해 deque 라이브러리 사용
    queue = deque([start])
    # 현재 노드를 방문 처리
    visited[start] = True
    # 큐가 빌 때까지 반복
    while queue:
        # 큐에서 하나의 원소를 뽑아 출력
        v = queue.popleft()
        print(v, end = ' ')
        # 해당 원소와 연결된, 아직 방문하지 않은 원소들을 큐에 삽입
        for i in graph[v]:
            if not visited[i]:
                queue.append(i)
                visited[i] = True

 

  DFS BFS
동작 원리 스택
구현 방법 재귀 함수 이용 큐 자료구조 이용

tip. 코딩 테스트에서 탐색 문제를 보면 그래프 형태로 표현한 다음 풀이법 고민하기


실전 1. 음료수 얼려 먹기

Q. N x M 크기의 얼음 틀이 있다. 구멍이 뚫려 있는 부분이 0, 칸막이가 존재하는 부분이 1로 표시된다. 구멍이 뚫려 있는 부분끼리 상, 하, 좌, 우로 붙어 있는 경우 서로 연결되어 있는 것으로 간주한다. 이때 얼음 틀의 모양이 주어졌을 때 생성되는 총 아이스크림의 개수를 구하는 프로그램을 작성하시오.

 

[DFS 활용 알고리즘]

1. 특정한 지점의 주변 상,하,좌,우를 살펴본 뒤에 주변 지점 중에서 값이 '0'이면서 아직 방문하지 않은 지점이 있다면 해당 지점 방문

2. 방문한 지점에서 다시 상,하,좌,우를 살펴보면서 방문을 진행하는 과정을 반복하면, 연결된 모든 지점을 방문할 수 있다.

3. 모든 노드에 대하여 1~2번을 반복하며, 방문하지 않은 지점의 수를 카운트한다.

 

def dfs(x, y):
    if x<=-1 or x>=n or y<=-1 or y>=m: # 주어진 범위를 벗어나는 경우에는 즉시 종료
        return False
    if graph[x][y] == 0: # 현재 노드를 아직 방문하지 않았다면
        graph[x][y] = 1 # 해당 노드 방문 처리
        # 상, 하, 좌, 우의 위치들도 모두 재귀적으로 호출
        dfs(x-1, y)
        dfs(x, y-1)
        dfs(x+1, y)
        dfs(x, y+1)
        return True
    return False
n, m = map(int, input().split())
graph = []
for i in range(n):
    graph.append(list(map(int, input())))

result = 0 # 모든 노드에 대하여 음료수 채우기
for i in range(n):
    for j in range(m):
        #현재 위치에서 DFS 수행
        if dfs(i,j) == True:
            result += 1

print(result)

input:             output : 3

4 5

00110

00011

11111

00000

 

 

실전 2. 미로 탈출

Q. N x M 크기의 직사각형 형태의 미로에서 (1,1) 위치에서 (N,M)의 위치로 가기위해 움직여야하는 최소 칸의 개수는?

- 괴물이 있는 부분 : 0, 괴물이 없는 부분 : 1

[BFS 활용 알고리즘] - 간선의 비용이 모두 같을 때, 최단 거리를 탐색할 수 있음.

from collections import deque
def bfs(x,y):
    queue = deque()
    queue.append((x,y))
    # 큐가 빌 떄까지 반복하기
    while queue:
        x, y = queue.popleft()
        # 현재 위치에서 4가지 방향으로의 위치 확인
        for i in range(4):
            nx = x + dx[i]
            ny = y + dy[i]
            #미로 찾기 공간을 벗어난 경우 무시
            if nx<0 or nx>=n or ny <0 or ny>=m:
                continue
            # 벽인 경우 무시
            if graph[nx][ny] == 0:
                continue
            # 해당 노드를 처음 방문하는 경우에만 최단 거리 기록
            if graph[nx][ny] == 1:
                graph[nx][ny] = graph[x][y] + 1
                queue.append((nx,ny))
                
    return graph[n-1][m-1]
n,m = map(int, input().split())
graph = []
for i in range(n):
    graph.append(list(map(int, input())))
    
dx = [-1,1,0,0]
dy = [0,0,-1,1]

print(bfs(0,0))

input:                             output: 10

5 6

101010

111111

000001

111111

111111