메뉴 바로가기 검색 및 카테고리 바로가기 본문 바로가기

한빛출판네트워크

한빛랩스 - 지식에 가능성을 머지하다 / 강의 콘텐츠 무료로 수강하시고 피드백을 남겨주세요. ▶︎

밑바닥부터 시작하는 딥러닝 5

10단계로 익히는 이미지 생성 모델의 원리

한빛미디어

번역서

판매중

  • 저자 : 사이토 고키
  • 번역 : 개앞맵시(이복연)
  • 출간 : 2024-10-15
  • 페이지 : 340 쪽
  • ISBN : 9791169212960
  • 물류코드 :11296
  • 초급 초중급 중급 중고급 고급
4.9점 (17명)
좋아요 : 9

10단계로 알아보는 이미지 생성 모델의 원리!
생성형 AI와 함께하는 『밑바닥부터 시작하는 딥러닝 5』

이 책은 정규 분포와 최대 가능도 추정과 같은 기본 개념에서 출발하여 가우스 혼합 모델, 변이형 오토인코더(VAE), 계층형 VAE 그리고 확산 모델에 이르기까지 다양한 생성 모델을 설명합니다. 수식과 알고리즘을 꼼꼼하게 다루며 수학 이론과 파이썬 프로그래밍을 바탕으로 한 실제 구현 방법을 알려줍니다. 생성 모델을 이론뿐만 아니라 실습과 함께 명확하게 학습할 수 있습니다. 특히 확산 모델에 이르는 10단계의 과정을 하나의 스토리로 엮어 중요한 기술들을 서로 잇고 개선할 수 있도록 구성했습니다. 이 책과 함께 생성 모델을 밑바닥부터 시작해보세요.

 

사이토 고키 저자

사이토 고키

1984년 나가사키 현 쓰시마 출생. 도쿄공업대학교 공학부를 졸업하고 도쿄대학대학원 학제정보학부 석사 과정을 수료했다. 현재는 기업에서 인공지능 관련 연구·개발에 매진하고 있다. 『밑바닥부터 시작하는 딥러닝』 시리즈 집필 외에 『파이썬 인 프랙티스』, 『밑바닥부터 만드는 컴퓨팅 시스템』, 『Building Machine Learning Systems with Python』 등을 일본어로 옮겼다. 

개앞맵시(이복연) 역자

개앞맵시(이복연)

고려대학교 컴퓨터학과를 졸업하고 삼성전자에서 자바 가상 머신, 스마트폰 플랫폼, 메신저 서비스 등을 개발했다. 주 업무 외에 분산 빌드, 지속적 통합, 앱 수명주기 관리 도구, 애자일 등 동료 개발자들에게 실질적인 도움을 주는 일에 관심이 많았다. 그 후 창업전선에 발을 들여 좌충우돌하다가 개발자 커뮤니티에 기여하는 더 나은 방법을 찾아 출판 시장에 뛰어들었다.

『밑바닥부터 시작하는 딥러닝』 시리즈, 『구글 엔지니어는 이렇게 일한다』, 『리팩터링 2판』, 『JVM 밑바닥까지 파헤치기』, 『이펙티브 자바 3판』 등을 번역했다.

 

- 페이스북: facebook.com/dev.loadmap

- 브런치: brunch.co.kr/@wegra

 

 

CHAPTER 1 정규 분포
_1.1 확률의 기초
_1.2 정규 분포
_1.3 중심 극한 정리
_1.4 표본 합의 확률 분포
_1.5 우리 주변의 정규 분포

 

CHAPTER 2 최대 가능도 추정
_2.1 생성 모델 개요
_2.2 실제 데이터로 생성 모델 구현
_2.3 최대 가능도 추정 이론
_2.4 생성 모델의 용도

 

CHAPTER 3 다변량 정규 분포
_3.1 넘파이와 다차원 배열
_3.2 다변량 정규 분포
_3.3 2차원 정규 분포 시각화
_3.4 다변량 정규 분포의 최대 가능도 추정

 

CHAPTER 4 가우스 혼합 모델
_4.1 우리 주변의 다봉 분포
_4.2 가우스 혼합 모델 데이터 생성
_4.3 가우스 혼합 모델의 수식
_4.4 매개변수 추정의 어려움

 

CHAPTER 5 EM 알고리즘
_5.1 KL 발산
_5.2 EM 알고리즘 도출 ①
_5.3 EM 알고리즘 도출 ②
_5.4 GMM과 EM 알고리즘
_5.5 EM 알고리즘 구현

 

CHAPTER 6 신경망
_6.1 파이토치와 경사법
_6.2 선형 회귀
_6.3 매개변수와 옵티마이저
_6.4 신경망 구현
_6.5 토치비전과 데이터셋

 

CHAPTER 7 변이형 오토인코더
_7.1 VAE와 디코더
_7.2 VAE와 인코더
_7.3 ELBO 최적화
_7.4 VAE 구현

 

CHAPTER 8 확산 모델 이론
_8.1 VAE에서 확산 모델로
_8.2 확산 과정과 역확산 과정
_8.3 ELBO 계산 ①
_8.4 ELBO 계산 ②
_8.5 ELBO 계산 ③
_8.6 확산 모델의 학습(알고리즘)

 

CHAPTER 9 확산 모델 구현
_9.1 U-Net
_9.2 사인파 위치 인코딩
_9.3 확산 과정
_9.4 데이터 생성
_9.5 확산 모델의 학습(구현)

 

CHAPTER 10 확산 모델 응용
_10.1 조건부 확산 모델
_10.2 점수 함수
_10.3 분류기 가이던스
_10.4 분류기 없는 가이던스
_10.5 스테이블 디퓨전

 

APPENDIX A 다변량 정규 분포의 최대 가능도 추정법 도출
_A.1 μ의 최대 가능도 추정
_A.2 2차 형식의 미분([식 A.4]의 증명)
_A.3 Σ의 최대 가능도 추정
_A.4 대각합과 미분([식 A.12]의 증명)

 

APPENDIX B 옌센 부등식
_B.1 볼록 함수와 옌센 부등식
_B.2 오목 함수와 로그 함수
_B.3 ELBO 도출

 

APPENDIX C 계층형 VAE의 이론과 구현
_C.1 2계층 VAE의 구성요소
_C.2 ELBO의 식 전개
_C.3 몬테카를로 방법에 따른 ELBO의 근삿값
_C.4 2계층 VAE 구현
_C.5 구현 코드

 

APPENDIX D 수식 기호 목록
_D.1 이 책에서 사용하는 기호
_D.2 이 책에서 사용하는 수식

정규 분포에서 확산 모델까지, 생성 모델 완전 정복!
수식과 코드로 명쾌하게 풀어낸 최고의 생성 모델 안내서!

명불허전 『밑바닥부터 시작하는 딥러닝』 시리즈가 이번에는 생성형 AI와 함께합니다.
스테이블 디퓨전, 미드저니, DALL-E 등과 같은 이미지 생성 AI가 다양한 분야에서 관심을 얻고 활용되고 있습니다. 이들 기술의 배경에는 딥러닝을 활용한 '생성 모델'이 있습니다. 이번 편에서는 바로 생성 모델에서 주목받고 있는 '확산 모델(Diffusion Model)'을 다룹니다. 

정규 분포, 최대 가능도 추정(MLE)과 같은 기본 개념에서 시작해 가우스 혼합 모델(GMM), 기댓값 최대화 알고리즘(EM), 변이형 오토인코더(VAE), 계층형 VAE 그리고 확산 모델까지의 여정을 10단계로 나누어 안내합니다. 단순히 이미지나 결과를 전달하는 데 그치지 않고 ‘왜 그렇게 되는지’와 ‘어떻게 그 결과를 얻을 수 있는지’도 빼놓지 않았습니다. 이를 위해 수식을 세심하게 다루며 작은 부분까지 신경 썼습니다.

이론과 실습을 아우르는 체계적인 커리큘럼을 제공하기 때문에 기초부터 차근차근 배우고 실습을 통해 생성 모델의 원리를 깊게 이해할 수 있습니다. 확산 모델을 비롯한 생성 모델을 더욱 깊이 이해하고 응용하고자 하는 모든 이에게 이 책은 든든한 길잡이가 될 것입니다.

 

대상 독자
(미적분학, 선형대수학 등의 수학과 파이썬 기초 지식이 있으면 좋습니다.)
- 생성 모델 구현 원리와 응용에 대해 궁금한 개발자
- 자연어 처리, 이미지 생성, 음성 합성 등 다양한 분야에 생성 모델을 적용하고 싶은 개발자

 

주요 내용 
- 1장 정규 분포
- 2장 최대 가능도 추정
- 3장 다변량 정규 분포
- 4장 가우스 혼합 모델
- 5장 EM 알고리즘
- 6장 신경망
- 7장 변이형 오토인코더(VAE)
- 8장 확산 모델 이론
- 9장 확산 모델 구현
- 10장 확산 모델 응용

 

 

추천사


믿고 보는 『밑바닥부터 시작하는 딥러닝』이 새로운 시리즈로 돌아왔습니다. 책을 끝까지 읽고 나니 왜 여전히 많은 사람이 이 시리즈를 딥러닝 입문서로 선택하는지 다시 한번 알게 되었습니다. 이번 편은 전 세계가 주목하는 생성형 AI의 핵심인 확산 모델에 대해 다루며 최신 생성형 인공지능의 탄생 배경에 깔린 이론들을 탄탄한 흐름 속에서 익힐 수 있습니다. 딥러닝을 책으로 공부하다 보면 크게 두 가지 아쉬움을 느끼게 됩니다. 하나는 이론과 실습의 균형이 잘 잡힌 개념서를 찾기 어렵다는 것이고, 다른 하나는 최신 이론을 책으로 접하기가 쉽지 않다는 점입니다. 하지만 이번 편은 두 마리 토끼를 다 잡았다고 생각합니다. 
_강민재, 성균관대학교 전자전기공학부

 

생성형 AI의 기반이 되는 여러 확률 이론을 논문으로 배울 수 있다고 하지만, 기반 지식이 없는 상태에서는 그 내용을 제대로 파악하고 적용하기가 어려울 수 있습니다. 다른 『밑바닥부터 시작하는 딥러닝』 시리즈와 마찬가지로 이 책 역시 생성 모델에 대한 기본 지식부터 수식 증명까지 단계별로 설명하는 방식을 따르고 있습니다. 수식에 대한 상세한 설명과 함께 실제 코드 구현까지 다루고 있기 때문에, 수식이 어렵지만 생성 모델의 기초를 탄탄히 다지고자 하는 사람에게 좋은 길잡이가 될 것입니다.
_강찬석, LG전자 소프트웨어 엔지니어

 

생성 모델을 이루는 고전 모델부터 확산 모델에 이르기까지, 수학적 개념을 가능한 한 쉽게 풀어내고 코드로 이해를 돕습니다. 생성 모델에 관심이 있다면 이 책을 통해 차근차근 기초를 쌓은 다음 최신 논문 등으로 살을 붙여 나간다면, 분명 해당 분야에 대한 깊이 있는 통찰력을 갖춘 전문가로 성장할 수 있을 것입니다. 딥러닝 입문서로 이만한 책이 있을까요?
_김용회, 숭실대학교 인공지능IT융합학과 박사과정

 

확산 모델에 필요한 기초 지식부터 세부적인 내용 그리고 코드까지 단계별로 이해할 수 있도록 잘 구성되어 있습니다. 공개된 다른 자료와 비교했을 때 훨씬 직관적이고 이해하기 쉽게 설명하고 있어 많은 분에게 도움이 될 것임을 확신합니다.
_김지훈, 서울대학교병원 연구원

 

드디어 생성형 AI를 다루는 『밑바닥부터 시작하는 딥러닝』 시리즈가 출간되었습니다. 기존 시리즈의 명성에 이어 생성 모델을 안내하는 대표 도서 중 하나로 자리잡을 것으로 기대됩니다. 생성 모델 분야에서 6년 넘게 일하고 있지만 원리를 설명하기 어려울 때가 있었습니다. 이 책은 기대 이상으로 생성 모델을 명쾌하게 설명하고 있어 이후에도 많은 도움이 될 것 같습니다. 이미 생성 모델을 공부한 분에게도 이 책을 강력히 추천합니다.
_김형섭, 생성형 AI 엔지니어

 

지난 몇 년 동안 이미지 생성 모델의 발전은 많은 것을 바꿔 놓았습니다. 그 배경에는 복잡한 수학 원리가 있습니다. 수학은 생성 모델에 매료된 이들에게는 진입 장벽으로, 관련 종사자들에게는 지속적인 도전 과제로 남아 있습니다. 『밑바닥부터 시작하는 딥러닝』 시리즈는 주제의 기초 개념부터 시작해 점차 깊은 이해를 돕는 방식으로 정평이 났습니다. 이번에도 생성 모델의 첫걸음인 확률 기초부터 수학적 원리와 그를 구현해낸 코드까지, 수학이나 프로그래밍에 낯선 독자라도 쉽게 접근하고 이해할 수 있도록 구성되어 있습니다. 이 책의 흐름을 차근차근 따라가다 보면, 최신 논문과 기술 문헌을 탐색하기가 한결 더 편해질 것입니다.
_박광석, 모두의연구소 아이펠 AI 교육

 

최신 딥러닝 모델을 공부하기 시작할 때, 어디서부터 손을 대야 할지 막막한 경우가 많습니다. 특히 확산 모델과 같은 생성 모델들은 확률 분포의 기초부터 공부해야 할지, 이전의 생성 모델들을 먼저 이해하고 넘어가야 할지, 아니면 도구를 사용해 간단히 생성만 해보는 것이 좋을지 고민됩니다. 이 책은 바로 이러한 고민을 덜어주기 위해 체계적인 커리큘럼을 제공합니다. 기초부터 차근차근 배우며 실전 코딩을 통해 생성 모델의 원리를 깊이 있게 이해할 수 있습니다. 이미지와 비디오 생성 모델에 관심 있는 모든 분에게 이 책을 추천합니다.
_박정현, SSG.COM 머신러닝 엔지니어

 

단순히 기술을 설명하는 데 그치지 않습니다. 생성 모델의 근본 원리를 수학적으로 깊게 다루면서도 독자의 이해를 돕기 위해 다양한 예시와 시각 자료를 풍부하게 활용합니다. 특히 최신 기술인 확산 모델을 10단계로 나누어 상세히 설명한 부분이 이 책의 강점입니다. 생성형 AI에 관심 있는 모든 이에게 필수적인 지침서로서, 딥러닝 초보자부터 생성 모델을 더욱 깊이 이해하고 싶은 전문가까지 모두에게 강력히 추천합니다. 기초부터 최신 기술에 이르기까지 체계적으로 학습할 수 있도록 도와줄 것입니다.
_이석곤, AI/빅데이터팀 수석

 

이번 편에서는 정규 분포, 다변량 정규 분포, 최대 가능도 추정, 가우스 혼합 모델, VAE 등의 주제를 깊게 다룹니다. 정규 분포부터 시작해 확산 모델에 이르기까지 수식을 먼저 살펴보고 코드로 옮기는 과정을 자세히 안내하며, 각 수식과 기호도 친절히 설명하여 이해하는 데 많은 도움이 됩니다. 파이썬과 기본 수학 지식만 있어도 책에서 설명하는 확률과 통계에 기반한 내용을 이해할 수 있습니다. 학습할 때 옆에 두고 꾸준히 참고할 수 있는 좋은 책입니다.
_이승표, 서버 프로그래머

 

『밑바닥부터 시작하는 딥러닝 5』는 확산 모델만 설명하는 데 그치지 않고 모델을 이해하는 데 필수적인 수학 지식을 꼼꼼하게 설명합니다. 또한 파이토치, 사이파이, 넘파이를 적절하게 활용한 코드 덕분에 독자가 읽고 실습할 때 어렵지 않다는 점도 이 책의 장점입니다. 확산 모델 이론에 대해 탐구하고 싶은 분에게 추천하며 딥러닝 수학에 자신이 없는 분에게도 큰 도움이 될 것입니다.
_이영빈, 모두의연구소 아이펠 AI 교육

 

『밑바닥부터 시작하는 딥러닝 5』는 생성형 AI의 핵심인 확산 모델을 이해하고자 하는 모든 이에게 필독서라 할 수 있습니다. 필수적인 수학적 배경을 체계적으로 설명하고 있으며, 확산 모델의 원리를 깊이 있게 이해할 수 있습니다. 이론과 실습을 균형 있게 공부하고 싶은 분, 생성 모델에 대하여 깊이 있게 공부하고자 하는 분에게 적합합니다. 초보자부터 전문가까지 다양한 학습자에게 활용도 높은 유익한 정보를 제공합니다. 특히 생성형 AI 관련 기반 기술을 배우고자 하는 개발자와 연구자가 읽어보기를 권합니다. 
_전준규, 농협정보시스템 DT LAB

 

최근 확산 모델은 이미지 생성, 목소리 합성 등 다양한 분야에서 눈부신 성과를 보이며 인공지능 기술의 핵심으로 자리잡고 있습니다. 그러나 확산 모델을 제대로 이해하기 위해서는 상당한 수학적 지식이 필요합니다. 이 책은 이러한 어려움을 해결해줍니다. 정규 분포라는 기초 개념을 시작으로 VAE를 거쳐 최종적으로 확산 모델에 이르기까지, 각 단계별로 필요한 수학적 개념을 명확하고 이해하기 쉽게 풀어냅니다. 확산 모델을 이해하고 응용하고자 하는 모든 이에게 든든한 길잡이가 될 것입니다.
_조원양, 스마트사운드 AI융합팀 리더

 

생성형 AI 서비스의 근간에는 확산 모델이라는 수학적 이론이 담긴 생성형 AI 기술이 숨어 있습니다. 이 책은 확산 모델의 이론적 배경과 구현 과정에 대해 제목처럼 밑바닥부터 하나씩 차근차근 설명하고 있습니다. 특히 파이썬 언어로 그 과정을 실제 구현해보는 내용까지 포함되어 있어, 전체적인 이론과 흐름을 이해하는 데 많은 도움이 됩니다. 
_최성욱, 삼성전자 VD사업부 Security Lab

"이 후기는 한빛미디어 <나는 리뷰어다> 활동을 통해서 책을 제공받아 작성된 서평입니다."

 

밑바닥부터 시작하는 딥러닝 시리즈는 이미 많은 AI 개발자들에게 필독서처럼 읽히고 추천하는 책입니다.

제가 속한 AI 개발자 톡방에서 책 추천 질문을 받으면 답변에 꼭 포함되는 책 중 하나가 밑바닥~ 시리즈입니다.

밑바닥 시리즈는 인기에 힘입어 1편 이미지처리-CNN부터 2편 자연어처리-RNN, 3편 동적계산그래프, 4편 강화학습 

이렇게 고도화되는 AI 기술 동향과 분야에 발맞춰 지속적으로 시리즈로 발간되고 있습니다.

 

기대하던 5편에서는 생성형AI의 시대가 도래한 현 시점에 맞게 이미지 생성모델 원리와 구현을 다루고 있습니다.

전자책

 

책의 시작은 생성모델에 꼭 필요한 확률분포에 대한 개념을 설명하고 간단한 파이썬 코드로 실습하는 내용이 포함되어 있습니다. 하나의 실수값을 대상으로 하는 스칼라 정규분포부터 벡터 정규분포(다변량 정규분포), 3D 그래프 그리기, 실제 데이터를 활용한 실습, 정규분포를 여러개 혼합한 가우시안 혼합모델, EM 알고리즘 등  처음 접하면 어렵게 느껴지는 이론들을 단순히 개념적인 설명뿐만 아니라 예시와 그림, 실습을 통해 설명이 잘 이해되도록 풀어서 설명되어 있어 좋았습니다.

 

6장인 신경망은 파이토치 기반으로 선형회귀를 구현해보고 간단한 신경망을 구현해봄으로써 파이토치와 신경망에 익숙해지도록 트레이닝을 합니다. 그다음 7장에서는 신경망을 활용하여 보다 복잡한 데이터 표현이 가능한 "변이형 오토인코더 VAE", 8장, 9장에서는 최신기술인 확산모델(DDPM)의 원리와 이론, 확산모델을 통한 이미지 생성 구현까지 실습하는 내용이 포함되어 있습니다. 10장에서 확산모델을 응용한 조건부 확산모델을 활용하여 텍스트를 입력받아 이미지를 생성하는 Stable Diffusion(스테이블 디퓨전), Midjourney(미드저니) 를 이해할 수 있도록 "조건부 확산모델"을 간단하게 구현하고 실습해보는 것으로 책은 마무리됩니다.

 

책에서는 이미지 생성모델의 "원리"를 설명하려는 다양한 수학 수식이 많이 포함되어 있어 대충 훑어보기만 하면 머릿속에 썩 남는게 없다는 게 단점이지만, 인내심을 가지고 첫장부터 따라가다보면 어느새 수학 수식들이 복잡해져도 이해할 수 있기 때문에 책 내용을 꼼꼼하게 정독하시는 것을 추천드립니다. 

또한 점점 빌드업을 통해 쉬운 개념부터 어려운 개념까지 이미지 생성모델을 단계적으로 설명과 실습 코드를 포함하여 다루고 있어 생성형 모델을 연구할 때 논문이 잘 이해가 되지 않아 사전 지식을 쌓고 싶은 분들께 꼭 이 책을 추천드리고 싶습니다.

'밑바닥부터 시작하는 딥러닝 5'는 Diffusion 모델과 이미지 생성에 초점을 맞춘 실습 중심의 딥러닝 입문서입니다. 파이썬으로 직접 구현하며 배우는 방식으로, 라이브러리에 의존하지 않고 기초부터 차근차근 학습할 수 있습니다.

 

정규분포부터 시작해 VAE, Stable Diffusion까지 이어지는 자연스러운 흐름과 시각적인 설명이 돋보입니다. 특히 다른 책들과 달리 Diffusion 모델이라는 주제에 깊이 집중하여, 구현부터 응용까지 상세하게 다룹니다.

 

복잡한 개념들을 계산 그래프로 시각화하고, 필요한 기초 지식을 각 챕터에서 적절히 설명하는 점이 인상적입니다. 딥러닝의 작동 원리를 제대로 이해하고 싶은 분들께 추천합니다.

 

더 자세한 리뷰는 링크를 참고해주세요: https://sonim1.com/ko/blog/review-deep-learning-from-scratch-5

 

한빛미디어 서평단 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다.

 

"밑바닥 부터 시작하는 딥러닝 " 책 이 올해 마지막 시점에 시리즈 5번째 책이 출간 되었습니다. 
밑바닥 부터 시작하는 딥러닝 시리즈는 수식을 파이썬 코드로 각 기술을 쉽게 설명하여 딥러닝의 핵심을 쉽게 공부할 수 있는 책입니다.

 

"밑바닥 부터 시작하는 딥러닝 5" 책은 이미지 생성모델이라는 주제로 생성 모델에 사용하는 기술을 설명하고 있는 책입니다.

먼저 밑바닥부터 시작하는 시리즈를 간단히 설명하면 
밑바닥 부터 시작하는 딥러닝: 파이썬으로 익히는 딥러닝 이론과 구현
밑바닥 부터 시작하는 딥러닝 2: 파이썬으로 직접 구현하며 배우는 순환 신경망과 자연어 처리 
밑바닥 부터 시작하는 딥러닝 3: 파이썬으로 직접 구현하며 매우는 딥러닝 프레임 워크 
밑바닥 부터 시작하는 딥러닝 4: 파이썬으로 구현하며 배우는 강화 학습 알고리즘 
밑바닥 부터 시작하는 딥러닝 5: 10단계로 익히는 이미지 생성 모델의 원리 
를 주제로  해당 내용을 이야기 하고 있습니다.

 

"밑바닥 부터 시작하는 딥러닝 5"는 생성모델 매커니즘을 공부할 수 있는 책입니다. 
수식과 해당 수식에 대한 자세한 설명 그리고 해당 수식을 파이썬 코드로 직접 구현하면서 생성 모델, 확산 모델의 10가지 기술을 공부할 수 있습니다.  

 

​10가지 기술은 책의 목차와 같이 진행됩니다. 
Chapter 1.  정규 분포
Chapter 2.  최대 가능도 추정 
Chapter 3.  다변량 정규 분포
Chapter 4.  가우스 혼합 모델 
Chapter 5.  EM 알고리즘
Chapter 6.  신경망
Chapter 7.  변이형 오토인코더 
Chapter 8.  확산 모델 이론
Chapter 9.  확산 모델 구현
Chapter 10. 확산 모델 응용
그외 부록으로 구성되어 있습니다.


"밑바닥 부터 시작하는 딥러닝 5" 책을 읽으면서 수학공식에서는 어려움이 있었지만 부록에 있는 수식 기호 목록 (APPENDIX D) 과 파이썬을 활용한 코드를 직접 수행하면서 수학적 지식 및 어떤 방식으로 해당 내용이 구현되고 수행되는지 쉽게 알 수 있었습니다.

 

수식 기호가 생각 안난다면 꼭 수식 기호 목록과 소스 코드를 같이 보면서 학습하기를 추천합니다.

 

"밑바닥 부터 시작하는 딥러닝 5" 책은
1. 파이썬을 공부한 후 인공지능에 관심이 있다면 해당 밑바닥부터 시작하는 딥러닝 시리즈를 보는 것을 추천합니다.  
2. 이미지 생성모델에 대한 기본 지식을 공부한다면 "밑바닥 부터 시작하는 딥러닝 5" 책은 좋은 선택이라고 생각됩니다.

 

​인공지능, 딥러닝 관련 책은 많지만 그 중에서 "밑바닥 부터 시작하는 딥러닝" 시리즈와 이미지 생성 모델을 공부할 수 있는 "밑바닥 부터 시작하는 딥러닝 5" 책을 선택해서 읽는 것은 인공지능 , 딥러닝을 공부하기 위한 좋은 선택입니다.  어려운 기술을 쉽게 공부 할 수 있는 딥러닝 시리즈 책 추천합니다.

 

한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다. 

요즘 AI 기술이 하루가 다르게 발전하는데, 그만큼 기초의 중요성도 커지고 있다고 생각합니다. 밑시딥 5는 단순히 생성 모델의 작동 원리를 제대로 이해할 수 있게 도와줍니다. 특히 확산 모델의 내부를 들여다보고 싶은 분들에게는 더할 나위 없는 교과서가 될 것 같습니다.

"한빛미디어 <나는리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

생성형 AI가 난리다!

여기저기서 얘기를 하는데, 솔직히 뭐라고 하는지 하나도 모르겠다.

조급한 마음으로 읽었지만, 막상 읽어보면 조급한 마음이 전부 사라진다.

빠르게 습득할 수 있는 지식이 아니란걸 느끼게 되기 때문이다.

입문서라고 해서 정말 누구나 이해할 수 있는 내용은 아니다.

기본적으로 이과 베이스를 가지고 있어야한다.

 

개발자라면 여기나온 이론 전부를 이해할 수는 없어도, 코드를 보며

이게 어떤 내용의 구문인지 책을 참고서처럼 활용하며 개괄적인 내용을 이해할 수 있을거다.

 

꽤 괜찮은 입문서로 추천한다!

 

한빛미디어 서평단 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다.

밑바닥 딥러닝 시리즈는 이미 책을 가지고 있을 만큼 유명한 시리즈이다. 딥러닝을 공부하게 된다면 한번쯤은 보게 되는 책인 것 같다. 이번 시리즈 책으로는 이미지 생성 모델의 원리라는 주제로 다루어져있다. 밑바닥 1,2 정도만 본 입장에서는 이미지 생성 모델이라 그런지 조금 어렵게 느껴졌다. 책에서 초반부에는 간단한 수학 지식을 소개하고 이미지 생성 모델을 다루고 있기는 하지만 완전 기초 상태라면 굉장히 어렵다고 느낄 수 있을 것같다. 하지만 수학적 지식을 충분하게 쌓아놓았다면 많은 도움이 될 거라고 생각한다. 수학 공식과 함께 자세한 설명들이 되어있어 이해하기 쉽도록 되어있다. 특히 이 책에는 파이썬 코드로도 생성 모델 구현을 설명하고 있는데 해당 코드들이 깃허브에 올라와있어서 Colab으로 돌려볼 수 있도록 되어있어서 책을 읽으면서 실행해볼 수 있어 이해가 좀 더 되었던 것 같다. 이 책을 통해 완벽하게 이해가 되었다고는 할 수 없지만 요즘 뜨는 주제인 이미지 생성 모델에 대해 전반적인 지식을 쌓을 수 있어서 좋았던 것 같다.

 

수학 지식을 가지고 있고, 그리고 이미지 생성 모델에 대해 알고싶다하는 경우 이 책을 통해 얇지만 전반적으로 살펴보는 것을 추천한다. 

 

"한빛미디어 <나는리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

 

O'REILLY

밑바닥부터 시작하는 딥러닝 5

  10단계로 익히는 이미지 생성 모델의 원리

  사이토 고키 지음

  개앞맵시 옮김

 

이번 책은 밑바닥부터 시작하는 딥러닝 시리즈의 5번째 출간된 책으로 이미지 생성 모델에 대해서 다루고 있습니다.

 

책 읽기 전에 ...

이 책을 학습하기 전에 책에서는 "미적분학, 선형대수학 등의 수학 이론과 파이썬 기초를 알고 있다면 읽기가 한결 수월할 것입니다." 라고 되어 있습니다.

기본적인 내용만 이해하고 있어도 충분하다고는 하지만 ....

 

이 책은 학습하기 전에 어떤 흐름을 가지고 구성되어 있는지 잘 정리되어 있습니다.

 

책 전체 흐름과 내용에 대해 줄거리 형태로 각 모델별 어떤 부분을 알고자 하는 것인지 짧게 짧게 잘 정리 되어 있으니 책 학습 전에 한번 읽어 보고 시작하면 좋을 것입니다.

 

[ 책 구성]

이 책은 총 10개의 장에 4개의 부록으로 구성되어 있습니다.

  1장. 정규 분포

  2장. 최대 가능도 추정

  3장. 다변량 정규 분포

  4장. 가우스 혼합 모델

  5장. EM 알고리즘

  6장. 신경망

  7장. 변이형 오토인코더

  8장. 확산 모델 이론

  9장. 확산 모델 구현

10장. 확산 모델 응용

부록A. 다변량 정규 분포의 최대 가능도 추정법 도출

부록B. 옌센 부등식

부록C. 계층형 VAE의 이론과 구현

부록D. 수식 기호 목록

 

저자가 얘기한데로 수식들이 많이 있기에 미적분학과 선형대수학 등의 수학 이론은 알면 좀더 이해하는데 편한것 같습니다.

기초 적인 부분에서는 아래와 같이 설명해주고 있기에 이해하기 어려운 수식들은 넘어가고 파이썬 예제 코드 및 그림들을 참고 하면서 학습하여도 어느 정도는 괜찮은듯 하지만, 좀 더 쉽고 자세하게 접근하고자 한다면 수학 이론에 대해 선행 또는 병행 하면서 학습하는 것이

좋은것 같습니다.

 

 

 

 

그리고, 필요에 따라 "NOTE" 블럭을 두어 부연 설명이 필요한 부분들은 별도 추가되어 있습니다.

 

 

 

[ 결론 ]

밑바닥 부터 시작하는 딥러닝 시리즈는 처음 접한 책 입니다.

저자가 초입에 정리 해준 전체 흐름에 대한 줄거리로 각 장에서 이해하고 학습해야할 목표를 세우고 시작 할 수 있도록 하는 부분은

좋은 것 같습니다.

밑바닥의 기준은 사람에 따라 다르긴 하겠지만 각 장의 흐름이 기본적으로 알아야 할 부분부터 스토리를 가지고 구성되어 있는 부분도

좋은 것 같습니다.

그리고 부록을 통하여 심도있게 알면 좋을 법한 주제를 다루고 있고, 수식 기호 목록 정리도 유용한 부분인 것 같습니다. 

밑바닥부터 시작하는 딥러닝 5는 기초 확률 개념부터 최신 확산 모델까지 딥러닝의 생성 모델에 대해 체계적이고 깊이 있게 설명해 준다. 수학적 이론, 알고리즘, 그리고 파이썬 프로그래밍을 활용한 실제 구현을 다루고 있기 때문에 독자가 개념을 이론적으로 이해하고 이를 실무에 적용할 수 있도록 한다. 이 책은 정규 분포, 최대 가능도 추정과 같은 기초 개념에서 시작해 가우스 혼합 모델, 변이형 오토인코더(VAE), 그리고 디퓨전 모델로 이어진다. 이 책은 고급 딥러닝 개념을 다루기 때문에, 기초 프로그래밍과 통계적 배경 지식이 없는 독자에게는 어려울 수 있지만 책 초반부에서 개념을 차근차근 설명하기 때문에 약간의 노력만 있으면 충분히 따라갈 수 있다.



역시는 역시다.

밑시딥 시리즈는 역시 믿고 보는 책이다.

비록... 밑시딥 1권만 보고 안보긴 했지만... 밑시딥 1은 여러번 정독을 할정도로 정말 마음에 드는 책이었고

이론 설명 역시 다른 여타 책들과는 다르게 이해하기 쉽게 잘 되어있다.

 

그리고 무엇보다 기본적인 이론부터 심화된 내용까지 책을 뒤로 읽으면서까지 앞에서 설명한 이론들이 점점 쌓이면서 살이 붙으며 자연스럽게 이해를 하게 된다.

 

 

밑시딥으로 인공지능을 시작하면서 재미를 느끼면서 입문했던 때가 2019년 이었다.

요근래에는 인공지능에 현타를 느끼던 중이었고...

인공지능의 진입 장벽이 낮이자면서 비전공자들도 쉽게 다루는게 생성모델이다.

이런 분들이 다른 것보다도... 이 책 정도만 봐줬으면한다...

디퓨전이 나오기까지 많은 노력과 연구가 있었고 이게 단순히 뚝딱뚝딱 사용가능하다해서

전혀 쉬운게 아니라는 것을 이해해줬으면 한다..

 

이런 현타를 느끼던 중 다시 밑시딥을 읽게 되었고...

내가 무슨 마음으로 인공지능을 시작했는지 다시 생각을 하게 해주는 책이었다.

 

인생 입문서이다.

말이 필요 없다.

https://blog.naver.com/ab415/223671571947

명불허전 밑바닥 시리즈의 신작. 언제나 그렇듯 생성모델의 근본 원리는 물론 실습을 통한 이해의 시너지를 높일 수 있는 것이 특징이다.

시중에 딥러닝 입문서로 정평이 나 있는 책들이 제법 많다. 저마다 각각의 장점을 갖고 최고봉을 찍고 있는 것 또한 사실이지만 그럼에도 밑바닥 시리즈보다 뛰어나다고 확신할 수는 없을 것이다.

알파고의 등장 이후 처음 만난 밑바닥 1권은 충격 그 자체였다. 알파고 관련 논문을 읽으며 멘붕에 빠졌던 내가 그 나이에 석사에 입문하지 않고 딥러닝 계열의 논문을 읽을 수 있게 도와준 것이 밑바닥 시리즈였다.

착각하지 말아야 할 것은 다른 책들은 개정판이 등장하면 과거 버전의 책을 굳이 읽지 않아도 되지만, 이 책은 개정판이 아니라 시리즈라는 점을 잊으면 안된다. 시리즈 별로 다루는 내용은 전혀 다르며 가급적 시리즈의 순서대로 읽기를 권하고 싶다.

“밑바닥”이라는 표현을 쓰는 책은 매우 드문데 한편으로 이 용어를 쓸 수 있으려면 저자 입장에서는 대단한 자신감이 필요할 것 같다. 이 단어가 독자에게 주는 의미는 크게 두가지 의미로 나뉘는 데, 하나는 말그대로 원리부터 설명한다는 것이고 다른 하나는 그만큼 저자의 단단한 이해에서 출발함을 의미한다.

덕분에 얻을 수 있는 장점 두가지가 있다. 하나는 이론과 실전이라는 두마리 토끼를 모두 잡을 수 있다는 점, 다른 하나는 깊이있는 이해가 가능하다는 점이다. 덕분에 딥러닝 서적들이 우후죽순 쏟아져 순식간에 사라지는 트렌드의 변화에도 이 책은 꽤 오랫동안 내 서재에 버티고 있다.

기본 원리를 중심으로 설명한 책이기에 그 수명은 왠만한 교과서와 비슷하지 않을까 싶다. 7년 전에 만난 1권 또한 독자의 입장에서 치울 수가 없는 책이다. 잘 만든 책들의 전형적인 특징이다.

이번 5권은 생성모델의 근간인 확산모델을 집중적으로 다룬다. 2022년 전 세계를 뒤흔든 생성형 AI에 적잖은 충격을 받았던 기억이 떠오른다. 지금의 LLM들과 마찬가지로 세상을 지배할 것 같은 포스에 압도되었다.

다급히 생성형 AI를 이해해보려 노력했지만 분포와 확률이라는 두가지 장애물에 큰 난관을 겪었다. 당시에는 눈 먼 장님이 코끼리 다리 만지는 식으로 접근했었는데 통계학적 지식이 풍부하지 않아서인지 대강의 감을 잡는데 그쳤다.

어떤 기초 지식이 부족한 것인지 조차 진단을 내리기 어려웠는데 이 책을 처음 펴는 순간 책의 서두에 소개된 “들어가며” 챕터에서 그 비밀을 알 수 있었다.

아래 그림은 이 책의 가이던스이다. 이 책은 10장으로 구성되는데 그 각각의 단계를 일목요연하게 설명해 주는 그림으로 각각의 장에 해당하는 그림에 대한 개념이 무엇인지 간략하게 설명하고 출발한다. 몇 페이지를 읽지 않았던 당시에도 역시 밑바닥 시리즈는 다르다는 것을 다시 한 번 절감할 수 있었다.

개요

또 하나의 눈에 띄는 특징은 밑바닥에서 출발한 이론을 반드시 실습으로 매듭짓는다는 점이다. 예를 들어 위 2장의 최대 가능도 추정의 개념을 명확히 이해하기 위한 아래와 같은 실습이 준비되어 있다.

실습

어떤 책은 실습으로만 도배된 책이 있다. 그것에 스스로의 경험과 창의성을 더해 공학적으로 풍부한 상상의 결과를 구현할 수 있으니 그 또한 나쁘지는 않다. 다만, 그 책이 처음 전해준 프레임의 한계에 갇혀 패러다임을 뒤흔들 피봇팅은 어렵다. 원리나 근간에 대한 이해 부족 때문이다.

이 책은 원리에 대한 이해를 풍부히 넓혀 그런 한계점을 돌파할 수 있게 도와준다. 아래 분류기 없는 가이던스 원리에 대한 설명이 그러하다. 분류기를 별도로 만드는 수고 없이도 확산모델을 활용할 수 있게 만드는 기술인데 베이즈 정리를 활용한 도출과정이나 특히 이를 시각화하여 표현한 것이 일품이다. 덕분에 직관으로도 원리를 쉽게 들여다 볼 수 있다.

원리

AI의 발전이 눈부신 속도로 변하고 있음에도 그 가속도는 더욱 빨라지고 있다. 인간의 수명에는 한계가 있기에 이럴수록 선택과 집중이 필요한 시점인 것 같다. 철저히 GPT와 같은 주류 플랫폼에 탑승하여 AI의 활용에만 집중할 것이 아니라면 밑바닥 시리즈는 프레임을 뒤집는 데 요긴한 마법의 도구로 적격이다.

이번에 리뷰할 서적은 한빛미디어에서 출판된 "밑바닥부터 시작하는 딥러닝 5" 입니다.
"밑바닥부터 시작하는 딥러닝 5"는 딥러닝의 최첨단 주제인 확산 모델과 변이형 오토인코더(VAE)를 중심으로 딥러닝의 기초부터 응용까지를 체계적으로 다루는 심도 깊은 교재입니다. 
본 책은 초보자에게는 수학적 배경을 쌓을 기회를 제공하고, 중급 및 고급 독자에게는 최신 모델의 구현 및 응용을 배울 수 있는 실전 가이드를 제공합니다.

챕터별로 주요 내용을 아래에 정리해 보았습니다.

CHAPTER 1: 정규 분포
정규 분포의 개념과 중심 극한 정리 등 확률 통계의 기초를 다룹니다. 
특히 표본 합의 확률 분포와 실생활의 예시를 통해 수학적 개념이 실제 데이터 분석과 기계 학습에서 어떻게 활용되는지 알기 쉽게 설명합니다. 
통계 초심자도 부담 없이 이해할 수 있도록 구성되어 있습니다.

CHAPTER 2: 최대 가능도 추정
최대 가능도 추정(MLE)을 통해 생성 모델의 개념을 배우는 장입니다. 
수학적 이론과 실제 데이터 분석 간의 연결고리를 탐구하며, 데이터 생성과 학습의 기반을 다지는 데 유용합니다. 
딥러닝으로 넘어가기 전에 반드시 알아야 할 기본 개념입니다.

CHAPTER 3: 다변량 정규 분포
다차원 데이터에서 정규 분포의 개념을 확장하여 다변량 정규 분포를 탐구합니다. 
넘파이를 사용한 데이터 처리부터 2차원 정규 분포의 시각화, 최대 가능도 추정 구현까지 설명하여 딥러닝 모델 학습의 기초를 탄탄히 합니다.

CHAPTER 4: 가우스 혼합 모델
혼합 분포와 가우스 혼합 모델(GMM)을 소개하며, 데이터의 잠재 구조를 파악하기 위한 기법을 다룹니다. 
GMM의 수식과 매개변수 추정의 난제를 설명하고, 실생활의 다봉 분포 사례로 직관적 이해를 돕습니다.

CHAPTER 5: EM 알고리즘
가우스 혼합 모델의 학습에 필수적인 EM 알고리즘(Expectation-Maximization)을 심층적으로 설명합니다. 
KL 발산과 EM 알고리즘의 도출 과정을 수학적으로 탐구한 후 구현 사례를 제공하여, 알고리즘의 원리와 실제 코딩을 연결합니다.

CHAPTER 6: 신경망
파이토치를 활용해 신경망의 기본 원리를 다룹니다. 
선형 회귀부터 시작해 신경망의 매개변수 최적화와 데이터셋 구성까지 설명하여 딥러닝의 초석을 쌓을 수 있습니다. 
이 장은 딥러닝 입문자를 위한 훌륭한 출발점입니다.

CHAPTER 7: 변이형 오토인코더(VAE)
VAE의 구조를 디코더와 인코더 관점에서 설명하고, ELBO(Evidence Lower Bound) 최적화를 통해 VAE 학습 과정을 심층적으로 다룹니다. 
구현 예제는 독자가 직접 모델을 구축하고 학습할 수 있도록 돕습니다.

CHAPTER 8: 확산 모델 이론
최근 주목받고 있는 확산 모델의 이론적 배경을 소개합니다. 
VAE와의 연결, 확산 과정 및 역확산 과정, ELBO 계산 등을 설명하며, 확산 모델 학습의 수학적 기초를 탄탄히 다집니다. 
이 장은 최신 연구 동향을 이해하는 데 필수적입니다.

CHAPTER 9: 확산 모델 구현
U-Net, 사인파 위치 인코딩 등 확산 모델 구현에 필요한 요소를 설명하며, 학습 프로세스를 구체적으로 보여줍니다. 
독자가 실제로 확산 모델을 학습시키고 데이터를 생성할 수 있도록 구체적인 코드 예제를 제공합니다.

CHAPTER 10: 확산 모델 응용
확산 모델의 실제 응용 사례를 다룹니다. 
조건부 확산 모델, 분류기 가이던스, 스테이블 디퓨전 등을 소개하며, 생성 모델을 실전에서 활용할 수 있는 방법론을 탐구합니다. 
특히 스테이블 디퓨전은 생성 AI 분야의 핵심 기술로, 이를 통해 상업적 가능성까지 엿볼 수 있습니다.


APPENDIX
부록은 책의 내용을 심화 및 보완하는 데 초점을 맞춥니다.

- A: 다변량 정규 분포의 최대 가능도 추정법 도출  
 복잡한 수식을 단계별로 설명하여 독자가 이론적 배경을 이해하고 응용할 수 있도록 돕습니다.

- B: 옌센 부등식  
 볼록 함수와 ELBO 도출 과정을 명료하게 설명하여 딥러닝 학습의 수학적 기초를 다집니다.

- C: 계층형 VAE의 이론과 구현  
 2계층 VAE의 이론적 개념과 코드 구현을 제공하여, 고급 모델에 대한 이해를 돕습니다.

- D: 수식 기호 목록  
 본문에서 사용된 기호와 수식을 정리하여 독자가 학습 과정에서 참조하기 편리합니다.

총평
"밑바닥부터 시작하는 딥러닝 5"는 수학적 기초부터 최신 딥러닝 모델까지 체계적으로 다루며, 학문적 깊이와 실전 적용 가능성을 동시에 제공합니다. 
특히 확산 모델과 변이형 오토인코더와 같은 최신 주제를 다루는 데 있어, 이론과 구현을 균형 있게 설명하여 독자 스스로 실험하고 확장할 수 있도록 돕는 점이 돋보입니다.

추천 독자:
- 딥러닝 기초를 다지고자 하는 초중급자
- 최신 딥러닝 연구 동향을 학습하려는 연구자 및 실무자
- 확산 모델 및 생성 AI 구현에 관심 있는 독자

이 책은 딥러닝을 깊이 이해하고 실무에 활용하려는 모든 독자에게 강력히 추천할 만한 교재입니다.

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."


 

Author: 사이토 고키 지음 / 개앞맵시 옮김

출판사: 한빛미디어

Score /5: ⭐️⭐️⭐️⭐️⭐️

 

개인적으로 어떤 주제를 공부할 때 책을 통해서 지식을 쌓는 것을 좋아한다.
다양한 매체(유투브, 쇼츠, 인강)등이 있지만 글쓴이 또는 옮긴이의 정제된 언어로 필터링해서 들으면 그 사람의 생각을 일부 엿볼 수 있기 때문이기도 하고 글의 문법적 또는 오류(읽기 어려운 번역체)등에서 벗어날 수 있기 때문이다.
솔직히 내용을 이해하기에도 벅찬데 번역체이면 이해하기의 난이도가 적어도 2배는 올라가는 것 같다.

다음으로 친절하고 읽기 쉬운 책을 좋아한다.
Step by Step이라는 형태로 어려운 주제를 풀어내는 솜씨가 글쓴이의 작가적 능력을 보여준다고 생각한다.
그런 의미에서 밑바닥 시리즈는 나에게 이 2가지를 충족시키는 훌륭한 머신러닝 기본서다.

 

생성형 AI가 다 해주는 데 이제 이런거 필요 없지 않아요?
라고도 할 수 있겠지만 생성형 AI도 기계학습(딥러닝)의 한 갈래다.
지금은 생성형 AI가 화두지만 그다음 세대는 다른 방법이 더 각광받을지 모른다.


 

직장 동료가 기술직군에서 너무 Fancy한 것을 보기보다 기본을 익히라고 한 적이 있다.
나는 이것에 동의한다. 시간이 지나면 정말 다른 기술이 아니라면 모든것은 기본에서 출발하고 하나의 가지이자 갈래다.
기본은 아무리 강조해도 지나치지 않다.

그렇다면 머신러닝에서 기본적인 것을 효율적으로 배우려면 어떻게 해야 할까?
잘 정제된 누군가 했을 시행착오를 책으로 간접경험 하는 것이다.
그리고 책을 통해서 누군가가 경험했을 시행착오를 우리는 효율적으로 경험하고 넘어갈 수 있다.
즉, 기계학습을 마스터하는 것이 산 정상이라면 그 정상을 가기 위한 효율적인 지름길을 제공하는 것이 책이다.

요즘 핫한 미드저니나 다른 이미지 생성 모델도 마찬가지다.
디퓨전 모델이 어떤식으로 이루어져 있는지 기초에 대한 부분부터 차근히 풀어주고 간단한 코드를 통해서 해당 현상을 정말 깔끔하게도 설명한다.
우리는 다양한 직군에 있을 수 있다. 단순히 활용하기만 원한다면 이 책이 필요없을 수도 있다. 하지만 어떤 물건이나 제품을 더 정교하게 사용하고자 한다면 명세서를 읽어보듯이 우리는 이러한 이미지 생성 모델을 더 잘 쓰기 위한 방법을 공부하면 더 좋지 않을까?

얼굴을 본적도 없지만 개인적으로 멘토라고 생각하는 작가와 옮긴이에게 찬사를 바치며 모든 엔지니어분들에게 이 책을 추천한다.

 

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평임."

이론과 실습의 균형을 통해 학습할 기회 제공
 "밑바닥부터 시작하는 딥러닝" 시리즈의 강점은 이론과 코딩을 균형 있게 다루고 있다는 점이다. 이론의 방대한 수식과 알고리즘을 이해하는 데 필요한 수학적 배경과 더불어, 이를 파이썬 코드로 구현하여 실습할 기회를 제공하는 것이 늘 강점이라고 생각한다. 다만, 이번 시리즈 자체가 이미지 생성 모델을 중점적으로 다루고 있어서, 책의 내용을 이해하기 위해서 딥러닝에 대한 기본적인 이해도가 있어야 할 것 같다는 생각은 들었다.

 

추천 독자
이미지 생성 모델에 대해 이론적으로 공부하고 싶은 사람
딥러닝 모델 이론 학습하는 사람
 

한빛미디어 서평단 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다.

<밑바닥부터 시작하는 딥러닝> 시리즈를 처음 접한건, 2017년쯤이었습니다. 다들 인공지능!, 딥러닝! 이러는 상황에서 저혼자 뒤쳐지는 느낌을 지울수가 없는데, 갑자기 쏟아지는 책들 중에 뭘 봐야 할지도 모르겠고, 책을 펼치면 죄다 수식이어서, 어떻게 해야 할지 몰랐던 때였습니다.

운좋게 <밑바닥부터 시작하는 딥러닝>을 읽게 되었습니다. "밑바닥"이라는 단어가 마음을 이끌었던 것 같습니다. 수포자라도 밑바닥은 이해할 수 있지 않을까 싶었거든요. 신기하게!! 수식이 있어도 읽을 수 있는 책이었습니다. 게다가 읽고 나서는 딥러닝이 무슨 의미인지 이해할 수 있었습니다. 그 이후로는 수식이 있더라도, 비록 이해하지 못하더라도 다른 딥러닝 책들도 겁먹지 않고 읽어 보게 되었습니다.

<밑바닥부터 시작하는 딥러닝 2>도 역시 쉬웠습니다. 저자가 도데체 뭐하시는 분인지 모르지만, 정말 "밑바닥"부터 이야기를 잘 풀어서, 책을 읽고 있는 동안 정말 수식을 다 이해하고 코드를 작성하고 있는 느낌을 주는 놀라운 능력이 있다는 걸 알았습니다.

1,2권을 읽고나서는 뭔가 안도감 같은걸 느끼게 되었습니다. 1권을 읽기전에는 너무 뒤쳐진것 같아서 약간의 두려움이 있었는데, 이제 대충은 이해했다는 안도감이었던 것 같습니다. 그래서 한동안 <밑바닥부터 시작하는 딥러닝> 시리즈를 잊고 지냈습니다.

그런데, 올해 초 "나는 리뷰어다" 리뷰 책 목록에 <밑바닥부터 시작하는 딥러닝 4>가 있는걸 발견했습니다. 크게 뒤통수를 맞은 기분이었습니다. '밑바닥 부터 이해해야 하는 무언가가 또 있었나?'라는 생각에 리뷰신청을 했는데, 강화학습에 대한 이야기였습니다. 역시 저는 모르는게 너무 많다는 생각을 하며 책을 읽어 나갔고, 강화학습에 대한 설명도 너무 쉽게 하고 있다는 부분에서 다시 한번 놀랐습니다. 아무래도 이 책의 저자(사이토 고키 님)와 역자(개앞맵시 님)의 팬이 될 것 같다는 생각을 했습니다.

그런데 한해가 다가기 전에 다시 한번 5편이 나와버리고 말았습니다.

<밑바닥부터 시작하는 딥러닝 5>는 대놓고 죄다 수식입니다. 수식은 병적으로 싫어하는데도 역시 읽을 수 있었습니다. 신묘한 난이도 조절입니다. 책을 읽으면서, '이런식의 설명을 하는 수학책이라면, 지금이라도 다시 수학공부를 기초부터 시작해서 공부하고 다시 이 책을 읽어보고 싶다'라고 생각했습니다.

책 표지에 써 있는 "이미지 생성 모델의 원리"가 무엇인지, 수식을 외워서 쓸 수는 없더라도 제가 아는 표현방법으로 설명할 수 있게 된 그런 느낌입니다.

책을 읽고 나서, 인터넷 서점을 한참 검색했습니다. 뭔가, 직장인 입장에서 수학을 다시 공부할 수 있는 책을 찾기 위해서였습니다. 왠지 <밑바닥부터 시작하는 딥러닝> 시리즈 책을 처음 부터 다시 읽어보면서, 그 수식들을 공부해보고 싶어졌습니다.

"한빛미디어 <나는리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

밑바닥부터 시작하는 딥러닝 5

- 생성모델의 원리를 차근차근 공부하자 -

 

밑바닥부터 시작하는 딥러닝 시리즈 5는 책 제목에서도 알 수 있듯이 시리즈로 나온 도서이며 이번이 다섯 번째 책입니다.

이전 서적의 내용을 보면 
밑바닥부터 시작하는 딥러닝 시리즈 1: 합성곱 신경망(CNN)과 이미지처리
밑바닥부터 시작하는 딥러닝 시리즈 2: 순환 신경망(RNN)과 자연어처리
밑바닥부터 시작하는 딥러닝 시리즈 3: 동적 계산 그래프(Define-by-Run)과 딥러닝 프레임워크
밑바닥부터 시작하는 딥러닝 시리즈 4: 강화학습 
의 주제를 다루고 있습니다. 
이번에 새로나온 신간은 최근 주목받고 있는 생성명 모델과 관련된 내용으로 특히 이미지 생성과 관련된 내용을 자세히 다루고 있습니다.

이 책의 특징은 잘 체계화된 구조로 어려운 내용을 책 제목 그대로 바닥부터 단계적으로 풀어나간다는 것입니다. 
chapter 1 - 5 까지는 생성모델의 기초가 되는 수학과 통계 개념에 대한 자세한 설명과 예제가 있습니다. 
정규분포, 최대 가능도 추정, 다변량 정규 분포, 가우스 혼합 모델, EM 알고리즘 의 순서로 기본 이론을 설명하고 있고 이 내용이 chapter 6-10까지 나오는 생성모델과 이어집니다. 
chapter1-5에서 공부한 내용이 chapter6-10에서 어떻게 응용되고 그 결과 어떻게 생성모델이라는 것이 만들어지는지 보여줍니다.
그냥 수학과 확률에 대한 정리 -> 생성모델 만들기 가 아니라 생성모델에서 앞서 배운 수학과 통계가 어떻게 응용되는지를 자세하게 풀어서 설명하면서 알려주는 부분이 아주 인상적이었습니다.

이 책은 생성모델을 사용하는 방법이라던지, 프롬프트 엔지니어링을 알려주는 책이 아닙니다. 정말 생성 모델 특히 이미지, 영상 분야에서 사용되는 생성모델의 원리를 바닥부터 파해쳐서 설명해주는 책입니다. 
생성 모델의 원리에 대해서 자세히 공부하고 싶은 분들께 적극 추천합니다.


"한빛미디어 <나는리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

#한빛미디어 #밑바닥부터시작하는딥러닝5 #생성모델 #인공지능

스테이블 디퓨전은 어떤 원리로 만들어져 있을까?

총 10단계로 이미지 생성 AI 를 밑바닥 부터 단단하게 다져 올라가며 배울 수있고 

그 내용들이 매우 흥미롭고 재미있으며 예제 코드가 제공되어 직접 실습해보며 즐겁게 공부하는 맛이 있다 ~

총평

- 책의 난이도 : ★★★★

- 추천 별점     : ★★★★

- 추천 독자     :  머신러닝/딥러닝을 공부하는 모든 사람

- 지은이          : 사이토 고키 지음 / 개앞맵시 옮김

- 출판사          : 한빛미디어

 


와 벌써 5번째 책이 나왔네요.

딥러닝 공부하시는 분의 필독서죠. 너무 시리즈가 좋아서 벌써 5번째 시리즈가 나왔나 봅니다.

번역은 항상 해주시는 개앞맵시 님께서 해주셨네요. 구글 디자이너는 이렇게 일한다를 번역하신 분이기도 합니다. ㅎㅎ

 

아무튼 이번에 나온 책은 10단계로 익히는 이미지 생성 모델의 원리가 부제입니다.

즉 GEN AI라고 해야할까요? 이미지 생성형 모델을 중점적으로 다룬다고 볼 수 있겠습니다.

 

이번 판은 정말 풀 컬러로 예쁘게 나왔습니다. 원래도 컬러이긴 한데 뭔가 퀄리티가 점점 더 좋아지는 느낌이에요 ㅎㅎ

 

 

 

책의 목차

1장. 정규분포

2장. 최대 가능도 추정

3장. 다변량 정규 분포

4장. 가우스 혼합 모델

5장. EM 알고리즘

6장. 신경망

7장. 변이형 오토인코더

8장. 확산 모델 이론

9장. 확산 모델 구현

10장. 확산 모델 응용

첨부로 다변량 정규 분포 최대 가능도 추정법 도출 / 옌센 부등식 / 계층형 VAE의 이론과 구현 / 수식 기호 목록 이렇게가 있어요.

 

책의 내용

 

간단하게 책에서 어떤 내용을 다루고 있는지 자세하게 서술해보겠습니다.

 

1장에서 정규분포의 이론과 함께 수식과 확률분포 등에 대해서 학습하게 됩니다. 코드도 같이 첨부되어 있기 때문에 코드로 하나씩 따라가보면 될것같아요.

 

2장에서는 실제 데이터로 생성 모델도 구현합니다. 키 데이터 셋을 불러와서 정규 분포를 따르는 생성 모델을 구현해보고 실제로 코드로 구현해보면서 이론을 추론하게 됩니다.

 

3장에서는 다변량 정규 분포를 살펴보는데요. 다변량 정규 부ㄴ포는 여러 개의 실수로 이뤄진 벡터의 정규분포를 말합니다. 이것을 시각화해보고 최대가능도를 추정하는 실습을 합니다. 넘파이를 이용하기 때문에 아무래도 파이썬이 익숙하신 분들이 보는게 좋다고 생각되네요.

 

4장 부터는 가우스 혼합 모델을 보게되는데, 정규분포만으로 표현하기 어려운 현상들을 가우스 혼합 모델을 통해서 해결하곤 합니다. 이는 정규분포를 여러개를 혼합하게 되면서 나오는 복잡 모델을 해결하는 방법입니다. 이 기법은 통계학과 머신러닝에서 널리 쓰이고 있고 데이터 생성에서도 중요한 기법입니다.

 

5장은 EM 알고리즘을 설명하는데요. EM은 Expectation-Maximization의 약자로 기댓값 최대화 알고리즘을 이야기 합니다. 가우스 혼합 모델의 매개변수를 효율적으로 추정하기 위해서 사용하게 됩니다.

 

6장은 신경망입니다. 이제 알고리즘을 학습했으면 신경망으로 들어가야죠. 신경망 프레임워크인 파이토치를 사용하게 되는데 역시 넘파이랑 파이토치를 이미 1편부터 읽으신 분들이라면 잘 알고 계실겁니다. 이를 통해서 신경망을 구현하는 학습을 진행합니다.

 

7장 변이형 오토인코더 에서는 신경망을 활용해 보다 복잡한 데이터를 활용하는데 쓰입니다. VAE라고도 하는데요 variational autoencoder입니다. VAE는 인코더 이기 때문에 디코더도 같이 학습하면서 비교해봅니다. 

 

8장 확산 모델 이론에서는 VAE에서 좀더 발전한 모델들을 학습합니다. 잠재 변수를 계층화한 계층형 VAE가 있습니다. 그리고 Denoising Diffusion Probabilistic Models(DDPM, 노이즈 제거 확산 확률 모델)이라는 게 있는데 이런 것들을 확산 모델이라고 합니다.

 

9장 확산 모델 구현에서는 8장에서 서술한 모델들의 이론을 직접 구현해봅니다. 확산 모델에서는 신경망에 U-Net이라는 모델을 많이 활용하는데요. 여기서는 이 모델에 대해서 학습하고 구현해봅니다. 그리고 시각 데이터를 효율적으로 처리하기 위한 사인파 위치 인코딩을 학습하고 가우스 노이즈를 추가하는 확산 과정을 확인해봅니다. 그리고 MNIST 데이터셋으로 확산 모델을 학습해봅니다.

 

10장에서는 확산 모델 응용을 해봅니다. 시테이블 디퓨전, 그리고 우리가 가장 많이 들어본 미드저니가 대표적인 서비스이빈다. 이들은 모두 텍스트를 입력받아서 이미지를 생성하고 조건부 확산 모델을 이용해서 구현합니다. 10장에서는 그래서 조건부 확산 모델을 학습하고 이런 첨단 이미지 생성 AI가 어떤 기술을 사용하는지 좀 더 구체적으로 분석해봅니다.

 

 

정말 이 책은 잘 알려진 명서라서 크게 소개드리기보다는 이미 공부하시는 분들이 학습할 내용이 있다면 바로 사서 읽어보시면 좋을 것 같습니다^^

 

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

결제하기
• 문화비 소득공제 가능
• 배송료 : 2,000원배송료란?

배송료 안내

  • 20,000원 이상 구매시 도서 배송 무료
  • 브론즈, 실버, 골드회원이 주문하신 경우 무료배송

무료배송 상품을 포함하여 주문하신 경우에는 구매금액에 관계없이 무료로 배송해 드립니다.

닫기

리뷰쓰기

닫기
* 상품명 :
밑바닥부터 시작하는 딥러닝 5
* 제목 :
* 별점평가
* 내용 :

* 리뷰 작성시 유의사항

글이나 이미지/사진 저작권 등 다른 사람의 권리를 침해하거나 명예를 훼손하는 게시물은 이용약관 및 관련법률에 의해 제재를 받을 수 있습니다.

1. 특히 뉴스/언론사 기사를 전문 또는 부분적으로 '허락없이' 갖고 와서는 안됩니다 (출처를 밝히는 경우에도 안됨).
2. 저작권자의 허락을 받지 않은 콘텐츠의 무단 사용은 저작권자의 권리를 침해하는 행위로, 이에 대한 법적 책임을 지게 될 수 있습니다.

오탈자 등록

닫기
* 도서명 :
밑바닥부터 시작하는 딥러닝 5
* 구분 :
* 상품 버전
종이책 PDF ePub
* 페이지 :
* 위치정보 :
* 내용 :

도서 인증

닫기
도서명*
밑바닥부터 시작하는 딥러닝 5
구입처*
구입일*
부가기호*
부가기호 안내

* 온라인 또는 오프라인 서점에서 구입한 도서를 인증하면 마일리지 500점을 드립니다.

* 도서인증은 일 3권, 월 10권, 년 50권으로 제한되며 절판도서, eBook 등 일부 도서는 인증이 제한됩니다.

* 구입하지 않고, 허위로 도서 인증을 한 것으로 판단되면 웹사이트 이용이 제한될 수 있습니다.

닫기

해당 상품을 장바구니에 담았습니다.이미 장바구니에 추가된 상품입니다.
장바구니로 이동하시겠습니까?

자료실

최근 본 상품1