본문 바로가기

의학

[세미나] 의료 인공지능의 발전과정: 연구 사례 중심으로

9월 20일부터 22일까지 <디지털 헬스케어 AI 솔루션 개발과 산업 현장 체험> 프로그램에 참가하게 되었다.
금요일(9.20)에는 딥노이드, 그리고 토요일과 일요일(9.21~9.22)에는 분당서울대병원 견학을 가게 되는데
그전에 미리 사전강의를 수강하라고 안내가 와서 해당 강의 중 정말 도움이 되었던 세미나 내용을 블로그에 정리해보고자 한다.
 

 

강의 제목: 의료 인공지능의 발전과정: 연구 사례 중심으로

연자: 이동헌, 충남대학교 의과대학 의공학과 조교수

Progess of AI

AI가 발전한 이유?
1. 3박자: Big data + GPU + Algorithm
2. '공개' 문화: arvix.org / GitHub / kaggle
 
AI Application
1. Image
1) Discriminative: classification, object detection, segmentation, pose estimation, graph convolution
- Progress of CNN
: LeNet-5(1998), AlexNet(2012), VGG(2014), GoogLeNet(2014), ResNet(2015), DenseNet(2016), NASNet(2018), EfficientNet(2019) -> Vision Transformer (2020)
- 위와 같은 것들이 backbone이 되어 feature representation에 사용됨!
2) Generative: synthesis, cross- modality, denosing, disease modeling
- GAN
- Diffusion models
 
2. Text
- Progress of NLP: RNN / LSTM / GRU -> Transformer -> ELMo -> BERT -> GPT (GPT3부터 LLM)

3. Multi-modality
1) Fusion Model
2) Joint Training
- e.g. CLIP -> 의료분야에서는 CXR-RePaiR(CXR reports generation, Image to Text)가 유명함
 
*초거대 언어모델(Large Language Model, LLM)
- 다른 데이터 활용에서도 높은 성능을 보이는 범용성으로 Foundation Model로 불림
- Large Language Model (LLM) -> Large Vision-Language Model (LVM)
 

Progress of AI in Medicine

1. Convergence of Human and AI
- Human vs. AI -> Human with AI로 연구 기조가 바뀜...WHY? AI가 high performance 일지라도 safety, explainability, countability 등의 이유로 의료진이 final decision을 내려야 함.
- Helpful for diagnosis of pathologists: AI model + Study Pathologist일 때 error rate 최소
- Especially helpful for diagnosis of GI trainee (Novice): 훈련생에게 AI가 많은 도움이 됨
- Explainable AI (XAI)
 
2. Data Bias
- 특정 병원 or 기기로 획득한 데이터: 대표성, 정확성, 질적 균질성 bias
- 데이터를 학습하는 과정에서 부수적인 요소를 학습하는 사례도 존재
 
3. Data Privacy
- 직접 데이터 전달: 병원 -> 기업
- Cloub(폐쇄망) 통해서 데이터 전달: 병원 -> Cloud -> 기업
- 데이터심의위원회 (DRB): 가명, 익명 처리
- 합성(Synthetic) 데이터을 활용하기도 한다
- 연합 학습(Federated Learning) 
 
4. Data-centric AI
- From Model-centric to Data-centric!
- Data의 품질에 따라 결과가 천차만별: Medical domain에서는 데이터 전처리가 매우 중요!
- MLOps
- Development in the face of data shifts: SHAP value, Uncertainty quantification(bayesian deep learning이 사용됨)
 
5. Lack of Data
1) 원인
- 의료 데이터 annotation에 전문 지식이 요구됨
- 질병의 유병률에 따른 data imbalance issue 발생
2) 해결책
- Open Dataset 
- ML Techniques: augmentation, transfer learning, weakly supervised learning, meta learning, anomaly detection
 
*Self-supervised Learning (SSL)
- Unlabled dataset 이용하여 representation을 얻고자 하는 방법 
- Pretext task: label 없이 input 내에서 self로 task를 정해서 모델 학습 ex) Contrastive Learning
- Downstream task: pretext task로 학습된 모델에 transfer하여 사용
 
*LLM in Medicine
- Skin-GPT4 (2023)
- Med-PaLM M (2023)
- RadFM (2023)


강의를 들으니 그동안 뒤죽박죽 섞여 있었던 지식이 잘 정리되었고, 인공지능(+의료)의 큰 그림을 그릴 수 있게 되었다.
 
지금 내가 하고 있는 프로젝트는 병리 슬라이드 이미지로 병리 보고서를 생성하는 모델을 개발하는 것인데
 
PLIP이나 CONCH 같은 모델이 multi-modal learning으로서 image와 text간의 관계를 학습하여 더 좋은 성능을 낼 수 있음을 알게 되었다!
 
다음은 Pathology에서 vision-language model의 따끈따근한 review paper를 공부해보려고 한다.

'의학' 카테고리의 다른 글

[병리] 방광암에 대해 알아보자  (1) 2024.09.02