Computer Vision

[OpenCV] 차량 영상에서의 번호판 식별 알고리즘
이번에는 가장 널리 쓰이는 Image Processing 라이브러리인 OpenCV(Open Source Computer Vision)를 이용하여 차량 영상에서 번호판 영역을 특정하고 OCR을 이용하여 인식까지 진행해보도록한다. 우선 데이터셋은, 학과에서 수강한 영상처리 과목에서 제공해준 차량 번호판 데이터셋을 활용했다. 전체적인 프로세스는 다음과 같다. 1. 컬러 영상으로 들어온 입력 영상을 GrayScale 영상으로 변환 2. 노이즈 제거를 위한 Gaussian Blurring과 Morphology 연산 수행 3. 균일하지 않은 명암을 가진 영상을 처리하기 위한 Adaptive Thresholding(적응형 이진화) 수행 4. 전처리된 영상에 대한 Edge 검출 및 Contour 그리기 5. 그린 Co..

[ResNet50] 전이 학습 기법을 이용한 CNN 이미지 분류 모델 생성
저번에 공부했던 ResNet 이론을 실습으로 옮겨 PyTorch 환경에서 ResNet50 사전학습 모델을 불러와 STL10 데이터셋을 전이학습시키고, 이미지 분류를 할 수 있는 모델을 생성해보자. 데이터셋 설명 및 준비에 앞서, 데이터 증강에 대해 간단히 알아보자. 데이터 증강(Data Augmentation)이란, 갖고 있는 데이터셋을 여러가지 방법으로 증강시켜 실질적인 학습 데이터셋의 규모를 키우는 방법이다. 데이터가 다양하게 많아진다는것은 학습 성능을 향상시키고 과적합을 줄일 수 있다는 것을 의미하기 때문에 데이터셋 규모가 작을때 데이터 증강은 어쩌면 필수라고 할 수 있다. 조금 더 쉽게 설명하면 위 사진에서, 원본 데이터를 d라고 하고 증강된 데이터를 Aug_d 라고 하자. 빨간색 x 표시가 Pr..