컴퓨터그래픽스🦜

딥러닝 활용 컴퓨터 그래픽스 생성 기술

헤스더 2023. 12. 10. 23:57

이번학기에 컴퓨터그래픽스 강의를 수강하고 있다. 해당 수업이 AI 융합학과에서 운영되는 과목이다 보니, 교수님께서 AI와 관련된 컴퓨터 그래픽스 기술에 대해 많이 언급하셨다. 곧 다가오는 기말고사 공부를 진행하며, AI 활용 컴퓨터 그래픽스 기술에 대해 정리해볼 필요가 있다고 느껴 이 글을 작성한다.

 

 

 


1. 딥러닝이란? (with 머신러닝)

  • 머신러닝(Machine Learning): '기계학습’으로, 인공지능을 만들기 위해 기계를 학습시키는 다양한 방법에 대한 학문
  • 딥러닝(Deep Learning): 층이 깊다고 해서 ‘깊은 학습, 심층 학습‘으로 불리는 학습 방법
    • '신경망(Neural Network)’을 통해 인공지능을 만드는 머신러닝의 한 종류
    • 신경망(Neural Network)’을 따라 만든 ‘인공신경망(Artificial Neural Network)’에서 여러 계층 쌓아서 만든 깊은 신경망(Deep Neural Network)

 

 

 

2. AI, 머신러닝, 딥러닝의 포함관계

  • 인공지능: 사람의 지적 능력을 컴퓨터를 통해 구현하는 기술
  • 머신러닝: 사람이 정한 모델과 특징 추출 방법을 이용하여 데이터를 기반으로 학습해서 추론할 수 있게 하는 기술
  • 딥러닝: 인공신경망 방법을 이용해 만든 머신러닝 기술로, 빅테이터 학습에 적합한 기술

 

 

 

3. 딥러닝 모델 종류 - ANN

  • 기존의 생물학적 신경망에서 영감을 받아 만들어진 알고리즘
  • 입력과 출력 사이의 연결된 뉴런 계층으로 구성된 기본적인 인공 신경망
  • 입력 데이터에서 특징을 학습하고 이를 토대로 분류 등의 작업을 수행
  • 복잡한 비선형 관계를 학습할 수 있음
  • 입력 데이터 간의 순서나 시간적 의존성을 고려하지 않기 때문에, 시계열 등의 데이터 처리에는 한계

 

 

 

3. 딥러닝 모델 종류 - RNN

  •  
  • 자신의 이전 상태를 입력으로 받고 출력으로 내보내면서 구성되는 순환 구조를 가진 신경망
  • 시계열 데이터 등과 같이 같이 입력 간 순서나 시간적 의존성이 반영되어야 하는 문제에 적합
  • 이전 시간 단계의 정보를 현재 시간 단계로 전달하여 과거의 정보를 활용할 수 있음
  • 문장 생성, 기계 번역 등의 작업에 적용되며, 시간적인 흐름을 갖는 데이터에 적합

 

 

 

3. 딥러닝 모델 종류 - CNN

  • 입력 데이터에 대해 커널 (Convolutional Kernel)을 적용하여 이미지의 특징을 추출
  • 추출한 이미지의 특징은 다시 다중 신경망을 거쳐 요약 되어 출력으로 사용
  • 주로 이미지 처리에 사용되는 알고리즘
  • 합성곱과 풀링 등의 연산을 통해 공간적인 구조를 파악하고, 이미지의 특징을 활용하여 정확한 예측

 

 

 

4. 컴퓨터 비전이란?

  • 컴퓨터가 디지털 이미지나 비디오에서 정보를 추출하고 해석하여 특정 작업을 수행하는 컴퓨터 과학 분야
  • 이미지 처리나 모델 학습, Pattern recognize (패턴 인식) 와 같은 작업의 기본 원리

 

 

5. 컴퓨터 비전 데이터셋

ImageNet : WordNet 계층 구조에 따라 구성된 명사의 선택으로, 각 노드에는 수천 개의 연관 이미지가 있습니다. 저장소의 데이터는 연구자에게 무료로 제공됩니다.
MNIST : MNIST는 손으로 쓴 숫자 이미지를 제공합니다. 여기에는 60,000개의 예제로 구성된 훈련 세트와 10,000개의 예제로 구성된 테스트셋이 포함됩니다.
IMDB-Wiki dataset : 500,000개 이상의 이미지로 구성된 최대 규모의 얼굴 이미지를 제공합니다. 대부분의 이미지는 유명인과 Wikipedia에서 가져왔습니다. 각 이미지에는 성별 및 연령 라벨이 첨부되어 있습니다.
LabelMe dataset : LabelMe 어노테이션 툴을 사용하여 구축되었습니다. 이 툴을 통해 사용자는 개체의 윤곽을 잡고 해당 개체에 라벨링할 수 있습니다. 이 데이터셋은 이미지 인식 프로젝트에 사용될 수 있습니다.
MS COCO : Microsoft Common Objects in Context Dataset의 약자로, Common Objects in Context Challenge를 위해 게시되었습니다. 이곳에는 120,000개 이상의 이미지가 포함되어 있으며 각 이미지에는 객체 감지, 분할 및 기타 이미지 라벨링 기술과 관련된 여러 태그가 있습니다. 세트에는 91개의 이미지 카테고리가 있습니다.

 

 

 

6. 딥러닝 활용 방안(preview) - 컴퓨터 비전, 패턴인식

  • 개념: 딥러닝(Deep Learning)과 인공지능(AI) 기술을 활용하여 인공적으로 생성된 가상 콘텐츠. 주로 얼굴이나 음성을 합성하여 실제와 구별하기 어려운 형태의 가짜 콘텐츠를 만드는 기술.
  • 사용 기술: 오토인코더, CNN, GANs 등
  • 윤리적 고려사항: 사생활 침해, 정보 조작 등과 관련된 윤리적 문제 발생 가능성 → 규제 및 윤리적 가이드라인 필요