티스토리 뷰

구글 스터디잼 중에서 머신러닝 중급 과정을 통해 코세라 강의를 한달동안 무료로 수강할 수 있는 기회를 얻었습니다. 이번에 학습하게된 코스는 Launching into Machine Learning  으로 해당 과정에서는 머신러닝의 역사적인 이야기부터 모델, 하이퍼파리미터, GCP Datalab, 빅쿼리 등 폭 넓은 내용을 다루고 있습니다.

코스중에는 Tensorflow 홈페이지에서 제공되는 playground를 통해서 다양한 하이퍼파라미터와 hidden layers를 설정하면서 여러가지 현실적인 문제를 직접 경험할 수 있도록 유도하는 과정도 있습니다. 그 과정에서 자연스럽게 하이퍼파라미터 튜닝의 중요성을 깨우치게 될 것으로 기대됩니다.

https://playground.tensorflow.org

batch size에 따라서 loss가 어떻게 변화하는지 상세하게 다룹니다. 여기서 이야기하는 배치사이즈는 우리가 작성하는 모델에 한번에 얼만큼의 양을 학습시킬 것인지를 결정하는 파라미터인데 배치사이즈가 작으면 loss가 민감하게 움직이고 반대로 큰 배치는 부드러운 그래프를 나타냅니다. 하지만 너무 커져버리면 정상적으로 글로벌 미니멈에 도달하지 못할수도 있고 큰 메모리를 필요로 하기 때문에 부담스럽게 됩니다. ML 엔지니어들이 항상 고민하는 부분이겠죠.

사실 머신러닝의 절반 이상은 데이터를 다루는 일이라고 볼 수 있는데 아래 nips에 등재되어 있는 페이퍼가 그런 내용을 잘 나타내주고 있습니다. 이 코스는 데이터를 다루는 과정에도 충실합니다. 

http://papers.nips.cc/paper/5656-hidden-technical-debt-in-machine-learning-systems.pdf

Google Cloud Platform 위에 datalab을 설치하고 BigQuery를 통해 데이터를 다루는 데모를 퀵랩에서 실습하게 됩니다.

머신러닝에 입문하기 위해 대부분의 사람들이 흔히 이야기하는 필독서나 영상들이 몇 개 있는데 무엇을 먼저 보든 그것은 자유일겁니다. 하지만 분명한건 그런 리스트에 포함되기에 코세라의 본과정 Launching into Machine Learning는 충분한 구성을 갖추고 있습니다. 기회가 된다면 꼭 한번 들어보시는걸 추천드립니다. 

모든 랩을 수행하면 [나의 강좌]에서 수료한 강좌를 클릭해서 수료증을 확인할 수 있습니다. 그럴싸한 오답으로 우리를 유혹하는 퀴즈를 모두 풀어내고 취득한 수료증이기 때문에 더 뿌듯하게 느껴집니다.

위에서 확인한 수료증은 링크드인에 게시할 수 있는데 관련 내용은 아래 링크를 통해 확인해보세요.

https://jybaek.tistory.com/788

또한 스터디잼에 대한 공지, 소식과 정보는 아래 페이스북 그룹을 통해 얻으실 수 있습니다. 잼 진행간의 문제나 질문등을 통해 다양한 인사이트를 얻으실 수 있을 것으로 기대됩니다. 

https://www.facebook.com/groups/studyjamkorea/

댓글
댓글쓰기 폼