본문 바로가기

하루 30분 컴퓨터 비전 공부하기

(13)

Vision Linear Classifiers가 입력 데이터를 처리하고 결과를 해석하는 방식 Linear Classifiers란? Linear Classifiers는 선형 분류 모델을 말한다. 분류 모델이란 지도학습의 한 종류로, 입력데이터가 주어졌을 때 해당 데이터의 클래스의 정답값을 예측하거나 분류하는 모델이다. 컴퓨터 비전에서는 이미지가 입력 데이터로 들어왔을 때 이미지 내 특정 사물을 분류하는 것이다. 예를들어 고양이 이미지가 들어오면 학습된 이미지 분류 모델은 해당 이미지를 고양이로 분류해 낸다. 이미지 분류에서 선형 분류기(Linear Classifier) 모델은 어떻게 weight를 학습하고 어떤의의를 가지는지 살펴보자. 1. Parametric Approach선형 분류 함수 (Linear Classification Function)를 수식으로 표현하면 다음 수식을 따른다. f..

CV(11) 실습편 Object Detection 01. Faster RCNN1. Faster RCNN의 구조RCNN, Fast RCNN과 Faster RCNN의 가장 큰 차이점Selective Search를 Region Proposal Network(RPN) 로 바꿈.RPN : RoI가 될 후보군인 Anchor Box를 무수히 만든다.그 후 Bounding Box Regression를 통해서 괜찮은 RoI를 딥러닝을 통해 학습한다. Classification을 통해 그것이 Object인지 아닌지를 판단한다. RPN을 통해 얻은 결과에 Object Classification을 통해서 해당 RoI에 있는 Object가 어떤 Class인지 구분하고, Bounding Box Regression을 실행한다. 02. 실습 # Tensorflow와 Tensof..

CV(10) Image Classification/코드 실전편 Epoch : training데이터 전체를 다 이용해서 학습1step(Iteration) : step한번단 batch가 한번 학습01. Image Classification 1. VGG16 모델 구현하기 - 필요한 모듈 importimport tensorflow as tffrom tensorflow.keras.preprocessing.image import ImageDataGeneratorimport osimport numpy as npimport matplotlib.pyplot as plt- 데이터 불러오기 _URL = 'https://storage.googleapis.com/mledu-datasets/cats_and_dogs_filtered.zip'path_to_zip = tf.keras.utils..

CV(8) Segmentation과 U-Net 01. Semantic Segmentation vs Instance Segmentation 1. Segmentation 에 대한 이해 Segmentation : 이미지를 픽셀 단위로 나누어 특정 픽셀이 무엇인지를 파악하는 taskSemantic Segmentation : 하나의 이미지 안에 들어있는 객체의 종류 (object category)를 픽셀 단위로 찾자.Instance Segmentation : 하나의 이미지 안에 들어있는 객체의 개체 (object instance)를 픽셀 단위로 찾자 Instance Segmentation = Semantic Segmentation + 'distinguishing instances"픽셀단위로 task를 진행하기 때문에 비용이 많이 든다. 02. U-Net..

CV(7) Object Detection과 R-CNN 01. Image Classification vs. Localization vs.Object Detection 1. Computer Vision 내의 taskClassification하나의 대상의 true label 이 무엇인지 분류하기 Localization하나의 대상의 위치를 가장 적절하게 지정하는 Bounding Box찾기Object Detection Bounding Box로 객체의 위치를 표시하고 각 객체를 classification을 하는 것이다. SegmentationSemantic Segmentation : 픽셀단위로 classification 하는 것 2. Localization ( + Classification ) vs. Object Detection Localization과 Det..

CV(6) CNN 정복하기 - Transfer Learning 기본 01. 대규모 모델 학습의 어려움 2012년 ImageNet Competition에서 부터는 딥러닝을 사용한 방법들이 우수한 성적을 거두고 있다. layer를 적절히 많이 쌓을 수록 오분류이 줄어들고 더 좋은 성과를 내는 것을 확일 할 수 있다. 하지만 딥러닝 학습을 위해서는 생각해 보아야 할 문제들이 존재한다. 그것이 무엇인지 살펴보자 1. 데이터를 얼마나 모아야 하는 것일까?딥런닝을 위해서는 질좋은 많은 양의 데이터가 필요하다. 위의 그림에서도 알 수 있듯이 질좋은 데이터를 가지고 딥러닝 학습을 했는데 좋은 결과를 얻지 못했다면 결국 더 많은 양의 데이터를 가지고 학습을 해야한다는 것을 알 수 있다. 2. 모델을 학습시키는데에 들어가는 비용GPT-3 모델의 parameter개수 : 1759억개GPT..

CV(5) CNN 정복하기 GoogLeNet - 심화된 CNN 구조 01. Inception Module (Naïve Version) “GoogLeNet”좋은 성능을 얻기 위해서는 딥러닝 구조를 깊게 만들어야한다.error가 잘 전달 되지 않는 vanishing gradient의 문제를 극복하면서...1. GoogLeNet의 구조convolution과 max pooling이 섞여있음.Inception Module을 사용하여 vanishing gradient의 문제를 극복.왜 한 입력 image에 한 종류의 filter size만 적용할까? ➞ Filter size를 여러개 사용한 후 그 결과를 concat하자!!1*1, 3*3, 5*5, max poolig을 다 해보자~ 큰 사이즈의 Receptive Field가 제공하는 장점은 수용하면서 파라미터의 수를 줄일 수 있는..

CV(2) CNN 기초 - Convolution, filter, padding https://setosa.io/ev/image-kernels/ Image Kernels explained visuallyAn image kernel is a small matrix used to apply effects like the ones you might find in Photoshop or Gimp, such as blurring, sharpening, outlining or embossing. They're also used in machine learning for 'feature extraction', a technique for determining thesetosa.io➞ filter가 어떻게 작동하는지 쉽게 알아볼수 있는 사이트가 있어서 소개합니다. I. CNN이란 무엇일까? CN..

이전 1 2 다음

티스토리툴바