3주차 학습정리

강의 복습 내용

pytorch (1~11번 포스팅)

https://velog.io/@naem1023/series/pytorch

data viz (3~4번 포스팅)

https://velog.io/@naem1023/series/Data-Viz

과제 수행 과정 / 결과물 정리

Custom model

custom model 과제의 경우 assert까진 아니더라도 유닛테스트와 비슷한 형식으로 검증 코드들이 있어서 과제 수행 여부를 체크하기 편했다. 가령, tensor([1])인지 혹은 tensor([1.0], dtype=float64)인지..

과제량이 많아서 수행시간은 길었지만 시간을 투자한만큼 진행됐다. 강의에서는 짧게 언급하고 넘어간 부분들을 과제에서 상세하게 다시 상기시킬 수 있었다. 덕분에 velog에 강의 내용 정리하기 편했다.

pytorch model을 처음 다루는 것이 아니지만, dimension 관련 부분을 풀 때는 처음 언어를 접했던 것마냥 막막했다. torch.gather나 dimension을 맞춰서 답을 맞춰야하는 부분들이 그랬다.

Custom dataset/dataloader

앞선 과제와 다르게 문제 서술이 애매한 부분이 많았다. 내가 전혀 다뤄보지 않았던 내용들도 많아서 시간을 정말 많이 썻다.. 마지막 NLP dataset문제에서는 4시간을 쓴거 같다.

torchtext의 vocab과 vocab을 통해 encoding dictionary를 만드는 부분에서 정말 많이 해맸다. 생성하는데 시간이 너무 걸렸는데, 알고보니 vocab에서 따로 관련 메서드를 지원해주더라. vocab docs에서 vocab 생성 관련된 부분이 너무 짧아서 docs는 묻혀두고 과제를 했었는데, docs를 자세히 읽도록 하자..

피어세션 정리

이번주는 피어세션에서 도움이 되고자 진행했던 알고리즘 스터디가 주된 내용이었다. 아무래도 다들 필수과제를 금요일까지 힘들게 푼 것도 있어서, 남는 요일에 토의할 내용이 비어있기도 했었다. 석사과정을 다들 꺼려하는 분위기라 알고리즘 스터디에 다들 호의적이었다.

기초부터 시작하자는 마인드여서 탐색, 정렬 알고리즘부터 시작했다. 다른분들은 C++로 하셔가지고 속도 관련 이슈가 없었는데, 나는 python으로 해서 pypy3로도 안 풀리는 문제들이 몇몇 있었다. 특히 정렬 문제에서 심했는데, I/O에서 속도 저하가 매우 심했다. 검색으로 해결하긴했는데, 백준 문제는 c++로 푸는 것을 고려중이다..

학습 회고

21/08/17: 저번주 선택과제 ViT 해결, pytorch 메서드 정리, 블로그 정리 21/08/18: 필수 과제 1번 해결, pytorch 메서드 공부, 블로그 정리 21/08/19: 필수 과제 2번 해결, 블로그 정리 21/08/20: mlops 관련 정보 검색, 블로그 정리

Leave a comment