데이터 과학 레벨 업 with 로드맵

cool***l2023-05-29

데이터 과학 레벨 업 with 로드맵

daeh***l2023-05-29

캐글의 입문서 for 머신러닝 초보와 중수 사이

lks7***l2023-05-28

내용에 비해 번역 퀄리티가 너무 아쉬운 책

minki1***l2023-05-28

단순한 문제 해결 방법이나 기법만이 아니라 그랜드 마스터들의 마인드까지 배울 수 있는 책

byc3***l2023-05-28

글로벌 데이터 분석 대회 플랫폼-캐글 을 통한 데이터 분석가로 성장할 수 있는 로드맵이 궁금하다면 이 책을 보라.

[나의 한줄 추천사]

- 글로벌 데이터 분석 대회 플랫폼 "캐글"을 통한 데이터 분석가로 성장할 수 있는 로드맵이 궁금하다면 이 책을 보라.

[책 추천 이유]

- 데이터 분석을 하려면 데이터가 있어야 하는데 데이터를 구하는 것이 현실적으로 대단히 어렵다. 데이터를 막상 구했다면 분석하려는 환경이 있어야 하는데, 이 모든 것을 지원해주는 곳이 "캐글" 이다. 이 책에서는 "캐글"에서 데이터 분석 방법론 과 성장할 수 있는 로드맵을 제시해 준다.

[내가 찾고자 했던 질문들]

캐글 그랜드 마스터가 되려면 어떻게 해야하나?

그랜드 마스터 31인의 인터뷰를 읽어보면 공통된 부분이 있다. 바로 "꾸준함" 이다. 리더보드 스코어에 집중하다보면 지치고, 힘들때가 있는데, 꾸준하게 대회에 참여하고 꾸준하게 코드를 분석하고 제출하는 것을 해야 가능하다는 것이다. 약간 뻔한 이야기이지만 가장 많이 와닿는 글이었다.

2. 캐글 통해서 데이터 분석가로 성장하는 방법?

코드공유 및 디스커션을 잘 활용한다. 코드 공유을 통한 남의 코드을 빠르게 학습하고, 나만의 리파지토리에 저장하여 필요할때 꺼내 쓸 수 있게 정리해둔다. 그리고 디스커션 부분은 대회 중 중요한 힌트들이 올라와서 공유될 수 있기 때문에 꾸준히 모니터링하여 순간 순간 나의 코드에 반영해 볼 수 있으면 더 좋다.
다양한 데이터 유형 대회에 참가하므로써 새로운 도메인 및 문제들을 배우고, 해결해보는 습관을 들이면 훌륭한 데이터 분석가로 성장할 수 있다.
블로그, 깃헙 등을 캐글 프로필에 연결해두면 하나의 포트폴리오로 활용할 수 있는 주요한 포컬이 될 것이다.

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

In***l2023-05-28

처음 시작하는 사람에게도, 다시 시작하는 사람에게도 좋은 책

IT에서 오래 있긴 헀지만, 이 분야 만큼 배우기 쉬운 것도, 혹은 어려운 분야도 없습니다.

배우기 쉽다는 것은 그 만큼 시작하기에 참고할 자료가 많다는 뜻 이며, 어렵다는 것은 도대체 어디서 시작해야 하고, 어떤 커리큘럼으로 배워야 할지 막막하기 때문입니다. 금방 의욕적으로 시작하다가도 내가 실습하는 프로그램과 책의 버전이 조금이라도 달라도 막히는 부분이 나오기도 하고, 제대로 이해하려면 수학적인 지식을 요구하기도 합니다.

그런 의미에서 이번에 한빛미디어에서 나온 "데이터 과학 레벨 업 with 로드맵" 이러한 어려움을 다소나마 낮춰주는 책이라고 할 수 있습니다.

다른 프로그래밍 서적과 다르게 이 책의 서두는 "캐글 Kaggle" 대회에 대한 설명으로 시작합니다. 프로그래밍 대회의 하나 인데, 다소 생소할 수도 있습니다.

지금 이 리뷰를 쓰는 시점에서 캐글에 들어가보면 여러 대회 중에 현재 구글에서 런칭한 대회가 있는데, 손동작을 인식하는 대회에 총 상금이 20만 달러 입니다.

꼭 1등이 아니더라도, 대회 참가하고 코드를 고민하고 여러 참가자와 토론하는 것 만으로도 충분히 데이터 과학에 대한 지식을 쌓으리라 생각합니다. 무엇보다 중요한 것은 그 과정을 즐겁게 하는 것이라고 필자는 말합니다. 문제 해결 만큼 즐거운 일이 또 있을까요?

그래서 2장까지 캐글에 대한 사용법과 데이터셋에 대한 준비를 간략하게 소개합니다.

그리고 파트 2 부터 대회에 대한 테크닉을 다루게 됩니다. 하이퍼마라미터 최적화, 블렌딩과 스태킹 설루션을 사용한 앙상블, 컴퓨티 비전 모델리와 NLP모델링 등입니다.

또 이 책의 즐거운 점(?)은 각 챕터가 끝날 때마다 캐글 사용자들의 인터뷰가 깨알 같이 들어 있습니다.

각 인터뷰를 읽으면 정말 다양한 사람들이 다양한 분야에서 데이터과학을 활용하고 있다는 것을 느끼게 됩니다.

그리고 파트 3에서는 데이터 과학 경력 관리에 대하여 다루는데, 단순한 데이터과학에 대한 로드맵 뿐 아니라 커리어 관리를 어떻게 해야하는지 잘 설명해줍니다. 커리어 관리에서 가장 까다롭지만 늘 관리를 잘 해야 하는 것이 포트폴리오 인데, 캐글을 사용하면 포트폴리오 관리도 쉽게 할 수 있습니다. 단순히 쥬피터 노트북을 통한 코드 공개 뿐 아니라 데이터 셋이나, 특히 토론에 대한 내용이 회사의 인터뷰 2시간 보다 더 자신을 표현할 수 있을 것 입니다.

데이터과학은 굳이 생업이라기보다 인생의 취미로서 가지고 가도 좋을 만큼 매력적인 분야라고 생각합니다. 어떠한 로드맵이던 첫 발자국이 중요한 만큼, 처음 시작하는 사람에게도 그리고 중간에서 다시 시작하는 사람에게도 좋은 책이라고 생각합니다.

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

#데이터과학 #캐글 #쥬피터노트북 #한빛미디어 #그랜드마스터

jeee***l2023-05-28

[서평] 데이터 과학 레벨 업 with 로드맵

jjkwa***l2023-05-28

The Kaggle Book

ttme***l2023-05-28

[나는리뷰어다] 한빛미디어, 데이터 과학 레벨 업 with 로드맵

ingo***l2023-05-27

데이터 과학을 이제 막 입문하는 분들에게 딱인 책

kangt***l2023-05-27

[서평] 데이터 과학 레벨 업 with 로드맵

inkuk***l2023-05-26

데이터 과학 레벌 업

캐글, 태뷸러 데이터 대회 등 처음 듣는 용어들

캐글이 무엇인지 이 책을 읽으며 처음 알았다.

데이터 과학 대회와 대회에 출제되는 유형의 문제들도 처음 접해 본다.

그러면서 이 책의 제목을 다시 살펴보았다.

데이티 과학 레벨업!!

대상 독자가 일반적으로 데이터 과학을 접해보는 초보자나 데이터 과학을 살짝 맛을 본 사람이 아닌

전문가, 데이터 과학을 전문적으로 하다가 데이터 과학 대회에 참여하기 위한 전문가를 위한 책이다.

대상 독자 : 캐글 노비스(웨사이트에 가입한 회원), 캐글 컨트리 뷰터(프로필만 입력한 사용자) 를 캐글러라고 부르고,

이 책을 통해 대회에 참가하고, 머신러닝을 학습하는 사람들 대상으로 만들어진 책이다.

책의 구성

책은 크게 3부로 되어 있다.

1부 캐글 사용버

2부 대회를 위한 테크닉

3부 데이터 과학 경력 관리

주된 내용은 2부 대회를 위한 테크닉에서 소개하고 있다.

대회 과제, 태뷸러 대회를 위한 모델링, 하리퍼파라미터 최적화, 블렌딩과 스태킨 설루션을 사용한 앙상블, NLP 모델링 등을 소개하고 있다.

하나의 챕터 뒤에는 실제 대회를 참가한 전문가들의 인터뷰가 들어가 있다.

다양한 예제들과 깊이 있는 내용들이 있지만

데이터 과학의 입문자, 초보자들에게는 맞이 않는 부분들이 있다.

제목 그대로 어느 정도 수준 이상으로 올라온 전문가가 세련된 스킬을 익히거나

대회를 위한 노하우를 전수받는 느낌으로 책을 읽어 나가면 좋을 것 같다.

ydk***l2023-05-25

캐글 대회 참가 희망자의 길잡이로 짱!

데이터 과학 레벨 업 with 로드맵

콘라트 바나헤비치, 루카 마사론 저/김형민 역 | 한빛미디어 |

데이터 과학 레벨 업 with 로드맵은 캐글대회 참가과정에서 다양한 문제들을 접한 캐글 대회 그랜드마스터 31명의 인터뷰가 인상적이다..

인터뷰를 읽으며 그들이 경험한 경험들은 독자들에게 다양한 문제에 대한 접근 방법을 알 수 있는 길잡이 역할이 될 것이다.

1.캐글 데이터 과학대회 안내와 데이터 세트, 노트북설정, 토론 포럼에 대한 상세한 설명은 캐글 대회 도전자에게 중요한 정보를 제공하고 있다.

2.대회를 위한 테크닉으로 과제와 지표, 좋은 검증 설계법과 테블러 데이터 대회를 위한 모델링, 하이퍼파라미터 최적화, 블랜딩과 스태킹 솔루션을 사용한 앙상불, 컴퓨터 비전 모델링, NLP 모델링, 시뮬레이션 최적화

3.데이터 과학 경력관리를 위한 포트폴리오 준비, 새로운 기회를 찾는 법 등으로

데이터 과학 레벨 업을 위한 경로를 안내하고 있다.

구슬이 서말이라도 꿰어야 보배,

직접 실습을 통하여 내 것으로 만드는 실행력이 중요!!!

책소개

데이터 과학자여,

그랜드마스터로 올라서는 비법이 여기에 있다.

실력 향상에 가장 좋은 방법은 실습!

데이터 과학 플랫폼 캐글에서는 다양한 대회에 참가하고 데이터 세트와 노트북, 토론을 주고받으며 ‘실습을 통한 학습’ 경험을 쌓을 수 있다. 캐글 그랜드마스터인 콘라트 바나헤비치와 루카 마사론이 데이터 과학 대회와 프로젝트에서 성공하는 데 필요한 기술과 비법을 하나로 모았다. 다양한 경험을 통해 쌓인 모델링 전략과 각종 지식을 토대로 데이터 과학자로 성장하는 방법을 여러분에게 전수한다.

그랜드마스터와 마스터 등급에 오른 캐글러 31명의 솔직한 인터뷰도 담았다. 이들이 가감 없이 공유하는 초창기에 저지른 실수와 깨달은 교훈을 통해 데이터 과학 세계에서 살아남는 데 필요한 인사이트를 얻어보세요. 그랜드마스터가 대회나 프로젝트를 시작할 때 사용하는 접근법과 서로 협력하는 법, 도구까지 여러분 것으로 만드세요. 길목 곳곳에 숨겨진 보물을 찾다보면 어느새 데이터 과학에 자신감이 붙은 여러분을 발견할 수 있을 겁니다.

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

#데이터_과학 #레벨_업 #로드맵 #콘라트_바나헤비치, #루카_마사론 #김형민 #한빛미디어

misoo***l2023-05-23

캐글 좋아하세요?

gofum***l2023-05-21

데이터분석 대회 사이트, 캐글의 공략법 알려주는 책

데이터분석 대회 사이트,

캐글의 공략법 알려주는 책이 있다!

데이터분석 대회 사이트?

출처 입력

여러분 코딩 배울 때 보통 백준이라는 사이트에서 코딩 문제를 풀고 채점을 맡기면서

오류를 찾고 이런 식으로 공부를 하잖아요?

그런데 인공지능, 데이터분석 관련도 그렇게 공부를 할 수 있는 사이트가 있어요!!

제일 유명한 국외 사이트인 캐글이 대표적이고요

국내에서는 데이콘이 유명하죠!

그런데 이 성능을 따질 때 평가 기준이 있는데요!

그 평가기준에 부합하게 잘 만들면 순위가 올라가요!

이렇게 순위를 매겨서 1등을 하면 좋잖아요?

그런데 처음 공모 대회에 참여하면 어떻게해야 순위가 올라가는지에 대한

전략적인 부분도 부족할 수 밖에 없는데, 그 부분을 보완해주는 책이 있더라고요!!

그게 오늘 소개해드릴 "데이터 과학 레벨 업 with 로드맵"입니다~!

데이터 과학 레벨 업 with 로드맵

본격 책 소개

이렇게 귀여운 표지입니다~!

책은 크게 3가지 분류로 나뉘어져있는데요!

1. 캐글 사용법

2. 대회를 위한 테크닉

3. 데이터 과학 경력 관리

로 나뉘어져 있습니다!

특히 캐글은 사이트 규모도 큰만큼 제공하는 서비스가 되게 많은데

그 서비스들도 이용하려면 어떻게 이용할 수 있는지를 찾아봐야하잖아요!

그런 부분까지 책에 소개되어있습니다!

대표적으로 캐글에서는 코랩에서처럼 바로 코딩을 할 수 있게 해주는데요!

그 방법이 책에 있더라고요!! = 캐글 노트북

이렇게 시작할 때 깔끔한 프레임에 이번 장, 챕터에서 배울 내용을 정리해줘서 좋더라고요!

그래서 그냥 처음부터 끝까지 읽는 것도 좋지만,

찾고자하는 부분을 딱딱 찾아볼 때도 좋은 거 같아요!

그리고 현직자 분들의 인터뷰가 있더라고요!

그래서 데이터과학자, 데이터사이언티스트, 데이터분석가 등등

관련 분야 희망하시는 분들께 또 다른 동기부여가 될 것 같아요~!

게다가 코드 예제가 있어서 좋아요!!

코드 없이 그냥 설명만 들으면 감이 안 올 때도 많고 어떻게 써야할지를 모르겠는데

이렇게 에제 코드가 있어서 관련된 부분을 보고 써먹을 수 있어서 좋았습니다!

그리고 마지막에 인덱스 부분도 있어서 정말 사전처럼 딱딱 찾아보기 좋더라고요!1

책 뒷표지에는 관련도서 설명도 있는데,

요즘 데이터분석 관련해서 관심이 많아졌는데, 관련도서까지 챙겨보고 싶네요~!

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

aimcle***l2023-05-20

캐글을 넘어서 취업까지 활용할 수 있는 도서!

key***l2023-05-20

데이터 공모전을 시작하고 싶은 분들의 좋은 참고서!

데이터 과학을 공부하기 위해서 캐글을 들어가봤는데, 처음에 어떻게 시작해야될 지 감이 잘 안왔다. 데이터셋도 워낙 많고, 이 데이터셋으로 어떻게 분석을 시작해야할 지 갈피잡기가 힘들었다. 그래서 캐글을 잘 활용하기 위한 책이 바로 이 책이다.

처음에 책 제목과 표지를 봤을 땐 초보자를 위한 가이드 느낌인가 했는데, 내용을 보니 완전 초보를 위한 느낌은 아니고 데이터 과학이 아예 처음은 아닌 정도로 알고 있으면 될 것 같다. 1부는 캐글은 어떻게 돌아가는 커뮤니티인지, 대회에는 어떤 것들이 있는지를 다루고 있다.

2부에서는 본격적으로 데이터를 분석하기 위한 방법을 다루고 있는데, 캐글의 대회에선 어떤 지표를 사용하여 평가하는지, 모델은 어떤 방식으로 검증해야 하는지, 하이퍼파라미터는 어떻게 조정해야 하는지, 그리고 앙상블에 대해서도 설명하고 있다. 각각을 코드로 구현하면서 코드의 각 메서드들과 파라미터들은 무엇을 의미하는지를 주로 다루고 있다. 실습을 위한 책이라기보다는 이론을 다룬 개론서에 가깝다고 느꼈다. 또 컴퓨터 비전과 NLP에 대해서도 다루고 있어 참고하면 될 듯 하다.

마지막 3부는 캐글을 이용해서 어떻게 경력 관리를 할 수 있는지를 다루는데, 간단히 읽어보고 참고하면 될 듯한 내용이다.

책 중간중간에 캐글 그랜드마스터와의 인터뷰가 들어가 있는데, 캐글을 처음 시작하는 사람들에게 도움이 될 만한 내용들이 많았다. 많은 분들의 인터뷰가 들어가 있는데, 공통적으로 하는 말이 있었다.

"간단한 모델부터, 순위에 연연하지 말고 데이터에 집중하고, 포기하지 말고 꾸준히"

캐글이나 데이콘과 같은 데이터 공모전에 관심이 있다면 참고하면 많은 도움이 될 것 같은 책이다.

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

pokari0***l2023-05-16

캐글 활용 로드맵으로 데이터 과학 전문가되기