본문 바로가기

Learning

(42)
[AlexNet] ImageNet Classification with Deep Convolutional Neural Networks Abstract AlexNet : ImageNet Classification with Deep Convolutional Neural Networks 5개의 Conv층과 3개의 FC로 구성(6천만개의 파라미터, 65만개의 뉴런) 최종 층은 1000-way softmax 학습을 더 빨리 하기 위해 non-saturating 뉴런과 효율적인 GPU 구현을 사용했다. 과적합을 줄이기 위해 정규화 기법인 dropout을 사용했도, 매우 효과적이였다. contest top-1 top-5 *ImageNet LSVRC-2010 37.5% 17.0% ImageNet LSVRC-2012 26.2% 15.3% *1000개의 클래스로 분류된 120만개 고해상도 이미지 Index 1. Intoduction 2. The Data..
10. 시각 임베딩 목차 10.1 시각 임베딩 응용분야 10.2 임베딩 학습하기 10.3 손실함수 10.4 정보량이 높은 데이터를 골라내는 마이닝 10.5 프로젝트: 임베딩 신경망 학습하기 10.6 성능 더욱 높이기 10.1 시각 임베딩 응용분야 시각 임베딩 개념을 활용한 정보 검색 알고리즘 10.1.1 안면 인식 안면 식별 : 어떤 이미지를 데이터베이스에 저장된 모든 이미지와 비교해서 해당 이미지의 신원을 확인하는 일대다 대응. 안면 대조 : 어떤 이미지를 다른 한 이미지와 비교하는 일대일 대응. 10.1.2 이미지 추천 시스템 : 사용자가 입력한 이미지와 비슷한 이미지를 찾아주는 시스템(ex. e-커머스 상품 추천) 이미지의 유사도 측정 예시 색상 유사도 : 비슷한 색상의 상품들이 추천된다. 의미 유사도 : 비슷한 이미..
09. 딥드림과 신경 스타일 전이 목차 9.1 합성곱 신경망이 본 세계는 어떤 것일까 9.2 딥드림 9.3 신경 스타일 전이 9.1 합성곱 신경망이 본 세계는 어떤 것일까 블랙 박스인 신경망의 동작 과정을 뜯어보고 이해하자는 concept !! 9.1.1 CNN의 특징 시각화하기 합성곱 신경망에 의해 학습된 특징을 시각화하는 쉬운 방법 중 하나는 각 필터가 반응하는 시각적 패턴을 관찰하는 것 경사 상습법을 통해 수행 -> 빈 이미지에서 시작하여 특징 필터의 반응을 최대화할 수 있다. VGG16 신경망의 구조의 특징 맵 시각화해보기 방향이나 색 등의 저수준의 일반적인 특징이 나타남 block3_conv2층에서는 패턴이 보이기 시작함 특징이 보이기 시작함 9.1.3 특징 시각화 구현하기 신경망의 분류기 부분을 제외한 VGG16 모델 읽어오기..
08. 생성적 적대 신경망(GAN) 목차 8.1 GAN 구조 8.2 GAN 모델의 평가 방법 8.3 GAN 응용 분야 8.4 프로젝트: GAN 모델 직접 구현해보기 8.1 GAN 구조 GAN(Generative Adversarial Networks) 모델은 서로 경쟁하는 2개의 신경망으로 구성 생성자(generator) : 무작위 노이즈를 원래의 데이터셋에서 본 표본과 비슷하도록 변환하는 모델 판별자(discriminator) : 입력된 관찰이 생성자가 만든 가짜인지 원래의 데이터셋의 일부인 진짜인지 예측하는 모델 이해를 돕기 위한 예시 생성자는 위조지폐범 판별자는 경찰로 비유를 하자면 위조지폐범은 완벽한 위조지폐를 만들기 위해 노력하고 경팔은 이를 판별하기 위해 노력한다. 서로 상대방의 기술을 깨기 위한 방법을 계속해서 학습한다. GAN..
07. Object Detection(R-CNN, SSD, YOLO) 목차 7.1 사물 탐지 알고리즘의 일반적인 프레임워크 7.2 영역 기반 합성곱 신경망 7.3 싱글샷 탐지기 7.4 YOLO 7.1 사물 탐지 알고리즘의 일반적인 프레임워크 영역 제안(region proposal) : 이미지에서 시스템이 처리할 영역인 RoI(Region of Interest)를 제안하는 알고리즘이다. RoI는 이미지 내 객체가 존재할 것이라 예상되는 영역을 의미하며 많은 수의 박스 정보 중 객체 존재 확신도가 높은 박스를 전달한다. 특징 추출 및 예측 : 각 박스 영역의 특징을 추출 및 평가해서 객체 존재 여부와 클래스 판단. 비최대 억제(Non-Maximum Suppression, NMS) : 같은 물체에 대한 중복된 박스를 탐지하고 하나의 박스만 남기기 평가 지표 : 평균평균정밀도(m..
06. 전이학습 목차 6.1 전이학습으로 해결할 수 있는 문제 6.2 전이학습이란? 6.3 전이학습의 원리 6.4 전이학습의 세 가지 방식 6.5 적합한 전이학습 수준 선택하기 6.6 오픈 소스 데이터셋 6.7 프로젝트1 : 사전학습된 신경망을 특징 추출기로 사용하기 6.8 프로젝트2 : 미세 조정 6.1 전이학습으로 해결할 수 있는 문제 데이터 부족 : 어느정도 성능을 확보하여 문제를 해결하기 위해서는 대량의 데이터셋이 필요하지만, 레이블링된 데이터를 확보하는 것은 실제로 어려운 일이다. 과다한 계산 요구량 : 수백만장의 이미지를 이용해서 신경망을 학습 시키기 위해서는 엄청난 양의 계산 자원이 필요하다. 또한 만족스러운 성능을 내는 하이퍼파라미터를 선택하기 위해 많은 실험을 반복해야하는 비용도 무시할 수 없다. 일반화..
05. 고급 합성곱 신경망 구조 목차 5.1 CNN의 디자인 패턴 5.2 LeNet-5 5.3 AlexNet 5.4 VGGNet 5.5 인셉션과 GoogLeNet 5.6 ResNet 5.1 CNN의 디자인 패턴 첫 번째 패턴 - 특징 추출과 분류 - 특징 추출을 맡는 부분은 일련의 합성곱 층, 분류를 맡는 부분은 일련의 전결합층으로 구성 두 번째 패턴 - 이미지 깊이는 증가, 크기는 감소 - 합성곱 연산을 거치며 이미지의 깊이는 증가하고 크기는 감소(높이x폭x깊이) - 입력 때의 깊이는 색상 채널(3:컬러, 1:회색조)를 의미하지만 이후 계층에서는 추출된 특징을 나타내는 특징맵이 된다. 세 번째 패턴 - 전결합층 - 대부분의 경우 모든 전결합층은 유닛 수가 같거나, 이어지는 층에서 점차 유닛 수가 감소하는 패턴을 보임 - 이어지는 층에..
04. 딥러닝 프로젝트 시동 걸기와 하이퍼파라미터 튜닝 목차 4.1 성능 지표란 4.2 베이스라인 모델 설정하기 4.3 학습 데이터 준비하기 4.4 모델을 평가하고 성능 지표 해석하기 4.5 신경망을 개선하고 하이퍼파라미터 튜닝하기 4.6 학습 및 최적화 4.7 최적화 알고리즘 4.8 과적합을 방지하기 위한 규제화 기법 4.9 배치 정규화 4.10 프로젝트 : 이미지 분류 정확도 개선하기 4.1 성능 지표란 4.1.1 정확도가 가장 좋은 지표인가 : 예측하고자 하는 문제에 따라 성능지표가 다르다. 예를 들어, 1백만 명 중 1명꼴로 발병하는 희귀한 질환을 예측하는 경우 모두 질환이 없다고 예측을 해도 99.999%의 정확도가 나온다. 4.1.2 혼동 행렬(confusion matrix) : 모델의 분류 결과를 정리한 표로, 정확도 외에 다른 성능 지표를 보여..