ㅁ컴퓨터 비전(Computer Vision): 이미지와 영상을 분석하여 유의미한 정보를 추출하는 기술
인공지능(AI)과 딥러닝(Deep Learning)의 발전과 함께 비약적인 성장을 이루었으며, 특히 CNN(Convolutional Neural Network)의 등장 이후 많은 발전이 이루어졌다. 본 글에서는 주요 CNN 기반 아키텍처와 그 기여도를 중심으로 컴퓨터 비전의 역사를 정리한다.
1. 초기 CNN의 등장 (1990-1998)
1990년: CNN(Convolutional Neural Network)
- 이미지 처리에 강점을 가진 신경망이 등장하였다.
- 합성곱 필터(Convolutional Filter)를 활용하여 이미지의 특징을 자동으로 추출하는 방법론을 제시하였다.
1998년: LeNet-5
- 초기 CNN 중 하나로 Yann LeCun이 개발하였다.
- 손글씨 숫자 인식을 위한 MNIST 데이터셋을 활용하여 훈련되었으며, 현대 CNN의 기초를 다졌다.
2. 딥러닝 기반 CNN의 발전 (2012-2015)
2012년: AlexNet
- GPU 기반의 ReLU 활성 함수와 Dropout 기법을 도입하여 대규모 CNN 모델을 구현하였다.
- ImageNet 데이터셋을 활용한 대회에서 탁월한 성능을 보이며 딥러닝 기반 컴퓨터 비전의 시대를 열었다.
2014년: VGGNet
- 작은 필터(3×3)와 여러 층을 깊이 쌓는 방식으로 단순한 구조를 유지하면서도 성능을 향상시켰다.
2014년: GoogleNet(Inception)
- Inception 모듈을 도입하여 계산 자원 효율성을 높이는 동시에 높은 정확도를 유지하였다.
2015년: ResNet(Residual Network)
- Residual Learning 기법을 도입한 Deep Network(최대 152층) 모델이 등장하였다.
- 기울기 소실(Vanishing Gradient) 문제를 해결하면서 딥러닝 모델의 깊이를 획기적으로 증가시킬 수 있게 되었다.
3. 성능 최적화와 실시간 처리 기술 (2016-2018)
2016년: DenseNet
- 각 층을 모두 연결하는 방식으로 파라미터 수를 줄이고, 정보 흐름을 원활하게 하여 성능을 향상시켰다.
2017년: YOLO(You Only Look Once)
- 실시간 객체 검출(Object Detection) 모델로 등장하였다.
- 빠른 속도와 높은 정확도를 갖춘 모델로, 자율 주행 및 보안 감시 등의 분야에서 활용되었다.
2018년: EfficientNet
- 네트워크 크기, 깊이, 해상도를 균형 있게 조절하는 방법론을 제안하였다.
- 기존 모델 대비 적은 연산량으로 높은 성능을 보였다.
4. 트랜스포머 기반 비전 모델의 등장 (2021~)
https://claremont.tistory.com/entry/%EC%83%9D%EC%84%B1%ED%98%95-AI-Transformer-%EA%B5%AC%EC%A1%B0
[생성형 AI] Transformer 구조
https://claremont.tistory.com/entry/LLM-LLM-%EB%B0%B0%EA%B2%BD-%EB%B0%8F-%EA%B5%AC%EC%A1%B0-%EC%9D%B4%ED%95%B4 [생성형 AI] 자연어 처리(NLP, Natural Language Processing) 개념ㅁ자연어 처리(NLP, Natural Language Processing): 컴퓨터가
claremont.tistory.com
2021년: ViT(Vision Transformer)
- Transformer 모델을 이미지 분류에 적용한 사례로 등장하였다.
- 기존 CNN보다 연산량이 적고 성능이 우수한 결과를 보였으며, 일부 Vision Task에서 CNN을 대체할 가능성을 시사하였다.
컴퓨터 비전 분야는 CNN의 발전과 함께 비약적인 성장을 이루어 왔다. 1990년대 LeNet-5와 같은 초기 모델에서 시작하여, 2012년 AlexNet을 기점으로 본격적인 딥러닝 기반 CNN 모델이 등장하였다. 이후 ResNet, DenseNet과 같은 깊은 신경망 모델이 등장하며 성능이 향상되었고, 최근에는 Transformer 기반 모델인 ViT가 도입되면서 CNN을 대체할 새로운 가능성이 열리고 있다. 앞으로도 컴퓨터 비전 기술은 더욱 발전하여 다양한 산업과 응용 분야에서 중요한 역할을 하게 될 것이다.
'인공지능 > 딥러닝' 카테고리의 다른 글
[딥러닝] Gradio: "이렇게 간단히 인터페이스를 만들 수 있다고?" (1) | 2025.03.11 |
---|---|
[딥러닝] 파라미터(parameter)란? (0) | 2025.02.16 |