카테고리 없음

인공지능) 인공지능 개념 정리(3)

jijijinog 2025. 11. 23. 02:46

CNN이란?

이미지의 특징을 자동으로 추출하여 컴퓨터가 이미지를 보고 이해할 수 있도록 돕는

이미지 인식과 처리에 특화된 딥러닝 모델이다.

 

주요 특징

특히 이미지처럼 격자 구조를 가진 데이터에서 공간적 구조적 특징을

효과적으로 추출하고 학습하는 데 강점을 지닌 모델이다.

 

등장배경

-기존 신경망의 한계: 과거의 인공 신경망은 이미지를 입력할 때 픽셀을 각각 독립적인 값으로 처리하여 이미지가 가진 중요한 공간적 정보를 제대로 활용하지 못했고 이미지 크기가 커질수록 계산량이 기하급수적으로 증가하는 한계를 지니고 있었다.

 

-얀 르쿤의 제안: 이러한 문제를 해결하기 위해 얀 르쿤 교수가 1980년대에 CNN 개념을 처음 제안했으며 그는 이미지 데이터의 구조적 특성을 활용해 패턴을 효율적으로 인식하는 방식을 고안하였다.

 

-초기 모델 LeNet-5: 1998년에 르쿤 교수가 개발한 초기 CNN 모델인 LeNet-5는 손글씨 숫자 인식에 활용되며 CNN의 가능성을 입증한 대표적 사례로 평가된다.

 

-핵심 아이디어: 이 모델은 이미지에서 선, 모서리, 색상과 같은 기본 특징을 추출하고, 이러한 특징들을 점차 복잡한 패턴으로 조합해 나가는 계층적 학습 방식을 도입함으로써 이미지 인식의 효율성과 정확도를 크게 높였다.

 

구성요소

-합성곱층: 이미지에서 특징을 추출하는 핵심적인 역할을 한다.

-풀링층: 추출된 특징 맵의 크기를 줄여서 계산량을 줄이고 과적합을 방지한다.

-완전 연결층: 추출된 특징들을 바탕으로 최종적으로 이미지를 분류한다.

 

합성곱 계층이란?

CNN의 핵심 구성 요소로서 입력 이미지에서 선, 모서리, 질감과 같은 시각적 패턴을 감지하여 의미 있는 특징을 추출하고 이를 바탕으로 특징 맵을 생성하는 역할을 한다.

 

연산과정
• 필터가 이미지의 좌측 상단 → 우측 하단으로 이동
• 각 위치에서 필터의 가중치와 이미지 패치의 픽셀 값을 곱한 후 더함
• 결과값은 해당 위치에서 필터가 찾는 특징의 강도를 표현

이 과정을 반복하여 특징 맵이 생성된다.

패딩

CNN 학습 과정(순전파)

입력 데이터가 신경망의 각 계층을 순차적으로 통과하며 최종 예측값을 생성하는 과정입니다.

  • 입력 이미지는 먼저 합성곱 계층을 통과한다.
  • 합성곱 계층에서는 필터(커널)와의 연산을 통해 특징 맵이 생성된다.
  • 생성된 특징 맵은 풀링 계층을 거치며 공간적 크기가 줄어들고 중요한 특징이 강조된다.
  • 이 합성곱과 풀링 과정은 여러 번 반복되며 단계적으로 더 복잡한 특징이 추출된다.
  • 최종적으로 얻어진 특징 맵은 평탄화되어 1차원 벡터로 변환된다.
  • 완전 연결 계층에서는 이 벡터를 바탕으로 최종 분류 또는 회귀 예측이 이루어진다.

CNN 학습 과정(역전파)

순전파를 통해 얻은 예측값과 실제 레이블 간의 오차를 계산하고 이 오차를 줄이기 위해
신경망의 가중치를 업데이트하는 과정입니다.

  • 손실 함수로 계산된 오차는 출력층에서 입력층 방향으로 역전파된다.
  • 역전파 과정에서는 각 계층의 가중치와 편향에 대한 손실 함수의 기울기가 계산된다.
  • 이 기울기는 손실을 줄이기 위해 가중치를 어느 방향으로 얼마나 수정해야 하는지를 나타낸다.
  • 계산된 기울기는 경사 하강법과 같은 최적화 알고리즘을 통해 각 계층의 필터(가중치)와 편향을 업데이트하는 데 사용된다.
  • 이러한 순전파와 역전파 과정이 전체 훈련 데이터셋에 대해 여러 에포크 반복되면서 모델의 예측 성능이 점차 향상된다.

CNN 장단점

장점 : 위치 불변성, 자동 특징 추출

단점 : 해석의 어려움, 높은 연산량

 

CNN 응용분야

자연어 처리, 음성 인식, 예술 등 여러 분야에서 응용되고 있다.