본문 바로가기

AI

(6)
[AI 논문] CLIP: Learning Transferable Visual Models From Natural Language Supervision (2021) 당시 NLP에서는 raw data로부터 pre-training을 직접 시켜서 zero-shot transfer가 가능하였다. 여기서 zero-shot trasnfer이란 사전 학습 중에 본 적이 없는 새로운 작업이나 데이터에 대해 추가 학습 없이도 바로 성능을 발휘할 수 있는 능력을 말한다.  근데 당시 CV에서는 사람이 직접 labeling한 ImageNet과 같은 데이터셋을 사용해 pre-training하는 것이 표준이었다. 만약 사람이 직접 labeling하지 않고 web에서 image를 설명하는 raw text data를 활용한다면, labeling 노동을 줄일 수 있을 뿐만 아니라, fine-tuning이 필요 없는 zero-shot trasnfer도 가능하지 않을까? 이것이 CLIP 모델이 탄..
[AI 논문] AN IMAGE IS WORTH 16X16 WORDS:TRANSFORMERS FOR IMAGE RECOGNITION AT SCALE Transformer는 본래 NLP 쪽에서 주로 활용되었다면, 이를 이미지에도 적용시키고자 나온 개념이 바로 ViT(Vision Transformer)이다. 오늘은 ViT를 다루는 논문, 'AN IMAGE IS WORTH 16X16 WORDS: TRANSFORMERS FOR IMAGE RECOGNITION AT SCALE'에 대해 공부해보겠다. 출처- Dosovitskiy, A., Beyer, L., Kolesnikov, A., Weissenborn, D., Zhai, X., Unterthiner, T., Dehghani, M., Minderer, M., Heigold, G., Gelly, S., Uszkoreit, J., & Houlsby, N. (2021). An image is worth 16x16..
[AI 논문] Attention Is All You Need (2017) 이번 시간에는 레전드 논문 'Attention Is All You Need'를 공부해보겠다.확실히 공부한 걸 블로그로 작성하는 일은 시간은 걸리더라도 long-term memory에 각인되는 것 같다. 공부한 흔적 그 이상의 가치를 가지는 것 같아서 앞으로도 귀찮더라도 꾸준히 포스팅을 해야겠다. 출처- Vaswani, A., Shazeer, N., Parmar, N., Uszkoreit, J., Jones, L., Gomez, A. N., Kaiser, Ł., & Polosukhin, I. (2017). Attention is all you need. Advances in Neural Information Processing Systems, 30, 5998-6008.- Umar Jamil Youtube:..
[AI 논문] Show and Tell: A Neural Image Caption Generator (2015) 처음엔 그저 재밌어보여서 시작한 AI 공부를 벌써 4개월 째 하고 있다.이젠 책으로 공부만 하는 건 지겹고 실제 프로젝트를 해보고 싶었다.마침 고려대학교 의료빅데이터연구소에서 9~10월 동안 '방광암 WSI 기반 병리 보고서 생성 모델 개발'이라는 주제로 대회를 개최한다는 소식을 듣고 해당 주제에 관심 있는 동기들과 함께 지원하였고, 운이 좋게 선발이 되었다. * 대회 사이트https://k-medicon.com/sub2.html MEDICAL CONTESTUrinary bladder, transurethral resection; Invasive urothelial carcinoma, with 1) squamous differentiation 2) invasion to muscularis propria ..
합성곱 신경망(CNN)을 파헤쳐 보자! 7~8월은 이라는 책으로 딥러닝의 기본 컨셉을 복습하고, 이미지 인식 분야에서 가장 많이 사용되는 합성곱 신경망(Convolutional Neural Network, CNN)에 대해 알아보았다. 이번 블로그 포스팅에서는 책을 다 뗀 기념으로(?), CNN에 대한 내용을 정리해 보려고 한다! (아래 그림의 출처는 https://github.com/WegraLee/deep-learning-from-scratch입니다.) https://product.kyobobook.co.kr/detail/S000001057805 밑바닥부터 시작하는 딥러닝 | 사이토 고키 - 교보문고밑바닥부터 시작하는 딥러닝 | 직접 구현하고 움직여보며 익히는 가장 쉬운 딥러닝 입문서!『밑바닥부터 시작하는 딥러닝』은 라이브러리나 프레임워크에..
MNIST 손글씨 데이터 인식 신경망 직접 만들어 보기 이번 6월에 이라는 책으로 딥러닝에 대한 기초 개념을 습득하였다.  https://www.yes24.com/Product/Goods/37883845 신경망 첫걸음 - 예스24인류에겐 이런 딥러닝 입문서가 필요했다 딥러닝 입문자가 늘고 있지만, 수학 이론을 공부하자니 갈 길이 멀고 원리를 무시한 채 코딩부터 하자니 응용이 불가능하다. 수학 공식과 통계 이론을www.yes24.comhttps://github.com/ratel0307/Deep-Learning GitHub - ratel0307/Deep-Learning: 딥러닝 스터디 기록용입니다딥러닝 스터디 기록용입니다. Contribute to ratel0307/Deep-Learning development by creating an account on Gi..