Algorithm/DFS

[DFS] DFS 알고리즘의 기본 개념 및 활용법

킹우현 2023. 2. 10. 17:58

DFS

DFS는 Depth-First Search, 깊이 우선 탐색이라고 부르며 그래프에서 깊은 부분을 우선적으로 탐색하는 알고리즘이다.

그래프의 기본 구조:

  • 노드(Node) or 정점(Vertex)
  • 간선(Edge)

그래프의 탐색이란 하나의 노드를 시작으로 다수의 노드를 방문하는 것을 말한다. 또한 두 노드가 간선으로 연결되어 있다면 두 노드는 인접(Adjacent)하다고 표현한다.

 

프로그래밍에서는 그래프를 크게 2가지 방식으로 표현할 수 있는데, 코딩테스트에서는 이 2가지 방식 모두 필요하니 두 개념에 대해 확실하게 알고 있도록 하자.

  1. 인접 행렬(Adjacency Matrix) : 2차원 배열로 그래프의 연결 관계를 표현하는 방식
  2. 인접 리스트(Adjacency List) : 리스트로 그래프의 연결 관계를 표현하는 방식

 

인접 행렬 방식

먼저 인접 행렬방식은 2차원 배열에 각 노드가 연결된 형태를 기록하는 방식이다.

 

연결이 되어 있지 않은 노드 끼리는 inf(무한)의 비용이라고 작성하고, 실제 코드에서는 논리적으로 정답이 될 수 없는 큰 값 중에서 999999999 등의 값으로 초기화하는 경우가 많다.

INF = 999999999 # 무한의 비용 선언

# 2차원 리스트를 이용하여 인접 행렬 표현
graph = [
	[0,7,5],
	[7,0,INF],
	[5,INF,0]
]

print(graph) # [[0,7,5],[7,0,999999999],[5,999999999,0]]

인접 리스트 방식

인접 리스트 방식에서는 모든 노드에 연결된 노드에 대한 정보를 차례대로 연결하여 저장한다.

 

파이썬은 기본 자료형인 리스트 자료형이 append()와 메소드를 제공하므로, 전통적인 프로그래밍 언어에서 배열과 연결 리스트의 기능을 모두 기본으로 제공한다.

 

파이썬으로 연결 리스트를 이용하여 그래프를 표현하고자 할 때도 2차원 리스트를 이용하면 된다는 점을 기억 !

# 행이 3개인 2차원 리스트로 인접 리스트 표현
graph = [[] for _ in range(3)]

# 노드 0에 연결된 노드 정보 저장(노드, 거리)
graph[0].append((1,7))
graph[0].append((2,5))

# 노드 1에 연결된 노드 정보 저장(노드, 거리)
graph[1].append((0,7))

# 노드 2에 연결된 노드 정보 저장(노드, 거리)
graph[2].append((0,5))

print(graph) # [[(1,7),(2,5)],[(0,7)],[(0,5)]]

두 방식은 어떤 차이가 있을까 ?

 

코딩 테스트를 위해 메모리와 속도 측면에서 살펴보자. 메모리 측면에서 보자면 인접 행렬 방식은 모든 관계를 저장하므로 노드의 개수가 많을수록 메모리가 불필요하게 낭비된다.

 

반면에 인접 리스트 방식은 연결된 정보만을 저장하기 때문에 메모리를 효율적으로 사용한다.

 

하지만 이러한 속성 때문에 인접 리스트 방식은 인접 행렬 방식에 비해 특정한 두 노드가 연결되어 있는지에 대한 정보를 확인하는 속도가 느리다.

⇒ 인접 리스트 방식에서는 연결된 데이터를 하나씩 확인해야 하기 때문

 

DFS의 동작 과정

DFS 알고리즘은 특정한 경로로 탐색하다가 특정한 상황에서 최대한 깊숙이 들어가서 노드를 방문하고 난 후, 다시 돌아가 다른 경로로 탐색하는 알고리즘이다.

1. 탐색 시작 노드를 스택에 삽입하고 방문 처리(스택에 한 번 삽입되어 처리된 노드가 다시 삽입되지 않게 체크하는 것, 노드를 한 번씩만 처리할 수 있음)를 한다.

2. 스택의 최상단 노드에 방문하지 않은 노드가 있으면 그 인접 노드를 스택에 넣고 방문 처리를 한다. 방문하지 않은 인접 노드가 없으면 스택에서 최상단 노드를 꺼낸다.

3. 2번 과정을 더 이상 수행할 수 없을 때까지 반복한다.

깊이 우선 탐색 알고리즘인 DFS는 스택 자료구조에 기초한다는 점에서 구현이 간단하다.

 

실제로는 스택을 사용하지 않아도 되며 탐색을 수행함에 있어서 데이터의 개수가 N개인 경우, “O(N)”의 시간이 소요된다는 특징이 있다.

 

또한 DFS는 Stack을 이용하는 알고리즘이기 때문에 실제 구현은 ‘재귀 함수’를 이용했을 때 매우 간결하게 구현할 수 있다.

 

# DFS 메소드 정의
def dfs(graph,v,visited):
    # 현재 노드를 방문 처리
    visited[v]=True
    print(v,end=' ')

    # 현재 노드와 연결된 다른 노드를 재귀적으로 방문
    for i in graph[v]:
        if not visited[i]:
            dfs(graph,i,visited)

# 각 노드가 연결된 정보를 리스트 자료형으로 표현(2차원 리스트)
graph=[
    [],
    [2,3,8],
    [1,7],
    [1,4,5],
    [3,5],
    [3,4],
    [7],
    [2,6,8],
    [1,7]
]

# 각 노드가 방문된 정보를 리스트 자료형으로 표현(1차원 리스트)
visited=[False]*9

# print(visited)

# 정의된 DFS 함수 호출
dfs(graph,1,visited)

'Algorithm > DFS' 카테고리의 다른 글

[백준 11724번] 연결 요소의 개수  (0) 2023.02.15
[백준 1012번] 유기농 배추  (0) 2023.02.13
[백준 2667번] 단지번호붙이기  (0) 2023.02.13
[백준 2606번] 바이러스  (0) 2023.02.12
[백준 1260번] DFS와 BFS  (0) 2023.02.12