[Med] STROK-A: A non-invasive artificial intelligence approach for the prediction of human blastocyst ploidy: a retrospective
[Med] STROK-A: A non-invasive artificial intelligence approach for the prediction of human blastocyst ploidy: a retrospective
model development and validation study
- paper: https://www.ncbi.nlm.nih.gov/pmc/articles/PMC10193126/pdf/nihms-1859601.pdf
- github: x
- Lancet Digit Health 2023 accpeted (인용수: 25회, ‘24-04-24 기준)
- downstream task: predict aneuploids(비정상 염색체) & euploids (정상 염색체)
1. Motivation
- IVF (In-vitro Fertilization)에서 challenge는 생존 가능한 수정란을 옮기는 일이다.
- 기존 형태학자들이 형태만 보고 평가하는 방식은 내외적으로 많은 차이가 존재해 일관되지 못하다.
- 반면 침습적 방법인 PGT-A의 경우 비용과 윤리적 문제가 있다.
- 비침습적이고, 비용-effective한 방법으로 model기반의 분류기법을 제안해본다.
2. Contribution
-
10.4K의 110h 이후 정적 이미지를 취득하여 이를 이용해 AI 모델을 학습시켜, WCM-ES+ & IVI Valencia dataset에서 일반화된 성능을 AUC로 평가함 $\to$ STROKE-A제안
-
3가지 이진 분류 task를 실험하고 분석함
- aneuploid vs. euploid : 69.3% (PPV: 76.1%, NPV: 62.1% / AUC: 76.1)
- complex aneuploidy vs. euploidy and single aneuploidy : 74% (PPV: 54.9%, NPV: 87.6%)
- complex aneuploidy vs. euploidy : 77.6% (PPV: 76.7%, NPV: 78%)
3. STORK-A
3.1. Preliminaries
사용 정보 : Image, 모세포 나이, morphokinetics, blastocyst score
-
blastocyst score:
- blastocyst의 expansion 정도 & hatching status : Grade 1-6로 분류
- ICM (Inner-cell-mass): Grade A-C로 분류
- TE (Trophectoderm): Grade A-C로 분류
-
Morphokinetics : time-lapse microscopy로 취득한 이미지에 대해 형태학자들이 label을 수행
-
blastulation(포배 형성)을 시작으로 full blastulation까지로 정의 (aneuploidy, euploidy의 Morphokinetics time이 다름을 이용)
$\to$ 성능에 도움이 안됨
- 이는 형태학자들간의 편차가 심하기 때문으로 사료됨
- PGT-A를 대체하진 못함
-
-
기존 연구
- ERICA: DL model과 PGT-A & $\beta$-HCG concentration (임신 호르몬) 정보를 활용하여 embryos를 ranking
- accuracy : 70% (AUC 74%: sensitivity: 54%, sepcificity: 86%)
- 한계점: single & complex aneuploid를 구분하지 않음
- Full-length time-lapse video를 이용
- 3D Conv활용하여 1~5일의 수정란 time-lapse video에 대해 예측 수행
- AUC: 0.74
- 한계점: 데이터 부족 (n=690), 37년 이상된 난자 부족, time-lapse microscopy가 범용적이지 않다.
- ERICA: DL model과 PGT-A & $\beta$-HCG concentration (임신 호르몬) 정보를 활용하여 embryos를 ranking
-
STORK-A:
-
Time-lapse 이미지 중 static image 1장만 취해 사용
+난자의 나이, morphokinetic parameters, morphological assessment 정보를 활용
-
-
Dataset
- Weill Cornell Medicine Center에서 10,378장의 이미지를 1385명의 환자로부터 취득 : 500x500 resolution
- day-5: 3994
- day-6: 6384
- 장비: EmbryoScope time-lapse imaging 장비
- GT: PGT-A를 활용 (aneuploids: 5953, euploids: 4425)
- Aneuploids (5953)
- single aneuploids (2944)
- complex aneuploids (3009)
- Aneuploids (5953)
- Validation : maternel age, morphokinetics parameters, morphological assessment 존재
- WCM-ES+ (841)
- single aneuploids (170)
- complex aneuploids (261)
- euploids (410)
- IVI Valencia (554) :
- aneuploids (319)
- euploids (235)
- WCM-ES+ (841)
- Weill Cornell Medicine Center에서 10,378장의 이미지를 1385명의 환자로부터 취득 : 500x500 resolution
-
Lasso Regression을 feature에 추가
- Regularization을 목적으로 l2 loss를 추가
- Feautre에 maternel age, morphokinetics parameters, morphological assessment 를 사용
-
Model
- Deep Learning: Res18사용
- Machine Learning: XGBoost, k-NN, SVM, Random Forest 사용
4. Experiments
-
ML 결과: 5-fold-Cross-validation
-
DL 결과 : 5-fold-Cross-validation
- AIBS: AI generated Blastocyst Score $\to$ 형태학자들의 score가 없더라도 이용 가능한 장점 + 성능 향상에 기여 (pseudo label 느낌)
-
다른 Dataset 결과
- Generalized되었음
-
수정란 이진 분류 & 임신 상관관계
-
Ablation
-
Maternal age & blastocyst score가 성능에 제일 큰 기여를 함
-
correlation between ploidy
trephectoderm grade (0.703) > inner cell mas (0.697) > expansion grade (0.692)
-
-
Web-site example of STORK-A