'인공지능/컴퓨터비전' 카테고리의 글 목록

본문 바로가기

인공지능/컴퓨터비전

Deep Learning Based 2D Human Pose Estimation: A Survey 용어정의 요약 딥러닝 기반 자세추정기법 Single person pipeline Multi-person pipeline 오픈데이터셋 출처 1. 용어정의 피드백 후 작성예정입니다. 2. 요약 포즈를 추정하는 방법은 딥러닝이 떠오르기 이전부터 컴퓨터비전분야에서 꾸준히 연구되어 오던 분야이며, 마찬가지로 딥러닝의 출현과 함께 정확도가 대폭 개선된 연구분야이다. 딥러닝 기반으로 2차원이미지에서 포즈를 추정하는 방법은 이미지 내 사람이 단수 혹은 복수인지에 따라 달라지며, 핵심은 인체 부분 중 머리, 몸체, 팔, 다리와 같은 키포인트(Keypoint)의 위치를 올바르게 추정하는 것이다. 이미지 내 사람이 한명 존재하는 경우에 Single Person Pipeline 카테고리의 연구분야에 속하며 (1).. 더보기

Content & Style Extraction 용어정의 요약 특징 추출방법 분석결과 출처 1. 용어정의 피드백 후 작성예정입니다. 2. 요약 본 내용에서는 학습된 네트워크 모델(VGG, ResNet 등)과 Loss functions을 이용해서 레이어 내부로부터 어떤 특징을 추출하고 활용할 수 있는지 확인할 수 있다. (해당코드는 코드구현 카테고리에 업로드 예정입니다.) 3. 특징 추출방법 학습된 모델을 VGG19를 로드하여 추출할 대상이미지를 정하고, 입력이미지에 대해서 Loss function이 최소화하도록 만들어주어 추출한 특징을 시각화하였다. 여기서 VGG19 모델에서 특징을 추출하는 부분은 총 5개의 블록으로 구성되는데, "conv1_1, conv2_1, conv3_1, conv4_1, conv5_1" 에서 차례로 연산된 특징맵을.. 더보기

Visual Interpretability for Convolutional Neural Networks 용어정의 요약 시각화방법 및 구현 Occlusion Visualization Saliency Map SmoothGrad Generate Specific Classmap Class Activation Mapping(CAM) 출처 1. 용어정의 피드백 후 작성예정입니다. 2. 요약 콘볼루션 뉴럴네트워크는 여러겹의 레이어에 입력이미지를 통과시킴으로써 이미지 내 대상를 인지하고 무엇인지 구분할 수 있다. 하지만 모델이 이미지 내에서 어느부분을 보고 대상을 인지하는지는 알 수 없기 때문에 이를 시각화하는 방법들이 다양하게 연구되고 있고, 본 글에서 관련된 대표적 기술들을 차례로 소개하고자 한다. 구현된 모든코드는 Github 및 코드구현 카테고리에 업로드 예정입니다. 3. 시각화방법 및 구현 3-1... 더보기

Convolution Neural Networks & Visualization 용어정의 요약 Convolutional Neural Network Filter & Kernel Understanding Edge Detection of Filters Layer Padding Stride Backpropagation Visualization of CNN Filters Feature maps 결론 출처 1. 용어정의 피드백 후 작성예정입니다. 2. 요약 일반적으로 인간은 어떤 사물을 인지할 때, 사물의 전체적인 모양을 보고 천천히 디테일한 부분까지 살펴본다. 뉴럴네트워크에서는 다층 레이어(Layer)를 통해 이 인지과정을 모방하였으며, 앞부분의 레이어는 선을 인식하고, 점점 레이어가 깊어질수록, 선을 면으로, 면을 사물의 전체적 구조로, 그리고 특징적 부분으로 확장시켜 사물을 .. 더보기

Loss functions for Image Transformation 용어정의 요약 Perceptual Loss Functions Feature Reconstruction Loss Style Reconstruction Loss Simple Loss Functions Pixel Loss Total Variation Regulation 결과분석 결론 출처 1. 용어정의 피드백 후 작성예정입니다. 2. 요약 컴퓨터비전(Computer Vision)과 영상처리(Image Processing)에는 Image Transformation이 필수적이며, 일반적으로 딥러닝 모델을 이용한 Transformation은 (1) Per-pixel Loss 와 (2) Perceptual Loss 를 최적화하는 방법을 이용하여 모델을 학습시킬 수 있다. 이때 각각의 Loss Functi.. 더보기

EdgeConnect: Generative Image Inpainting with Adversarial Edge Learning 용어정의 요약 학습방법 Edge Generator Image Completeion Network Edge Information & Image Mask Training Setup & Strategy 결과분석 Qualitative Comparison Quantitative Comparison Ablation Study 결론 출처 1. 용어정의 피드백 후 작성예정입니다. 2. 요약 기존에 연구되었던 Inpainting 기술은 (1) Diffusion-based method, (2) Patch-based method 그리고 (3) Learning-based method 로 나뉘어져있고 각 방법들은 다음과 같이 간단히 설명할 수 있다. (1) Diffusion-based method 삭제된 영역에 인.. 더보기

Partial Convolution based Padding 용어정의 요약 연구배경 우수성 학습방법 Partial Convolution Partial Convolution based Padding Case of Big Padding size 결과분석 Running time Task 1: Image classification network Task 2: Semantic segmentation network 결론 출처 1. 용어정의 피드백 후 작성예정입니다. 2. 요약 2-1. 연구배경 콘볼루션 연산은 슬라이딩되는 연산필터의 크기가 이미지의 크기와 정확히 일치하지 않을 경우에 패 (Padding)을 필요로 하고, 이때 사용되는 패딩 기법은 아래와 같이 크게 3가지로 나뉜다. Zero padding : 가장자리 패딩영역을 0으로 채움 Reflection p.. 더보기

Image Inpainting for Irregular Holes Using Partial Convolutions 용어정의 요약 학습방법 Partial convolution layer Network architecture and implementation Loss function 구현결과 출처 1. 용어정의 피드백 후 작성예정입니다. 2. 요약 Image Inpainting 이란 영상 혹은 이미지데이터 내 원치 않는 아이템을 삭제(이하, 마스킹)하고 해당공간의 영상을 복구하는 기술이다. 기존 Deep learning 기반의 inpainting기술은 color discrepancy나 blurriness 등의 artifacts 존재하여, 복잡한 후처리(post-processing)과정이 반드시 요구되었다. 또한, 이미지 중앙에 오로지 사각형 마스크를 만들어 영상 복구를 시도하였던 학습 및 검증방법은 실제환경.. 더보기

이전 1 2 다음

728x90

티스토리툴바