[Med] STROK-A: A non-invasive artificial intelligence approach for the prediction of human blastocyst ploidy: a retrospective
[Med] STROK-A: A non-invasive artificial intelligence approach for the prediction of human blastocyst ploidy: a retrospective
model development and validation study
- paper: https://www.ncbi.nlm.nih.gov/pmc/articles/PMC10193126/pdf/nihms-1859601.pdf
- github: x
- Lancet Digit Health 2023 accpeted (인용수: 25회, ‘24-04-24 기준)
- downstream task: predict aneuploids(비정상 염색체) & euploids (정상 염색체)
1. Motivation
- IVF (In-vitro Fertilization)에서 challenge는 생존 가능한 수정란을 옮기는 일이다.
- 기존 형태학자들이 형태만 보고 평가하는 방식은 내외적으로 많은 차이가 존재해 일관되지 못하다.
- 반면 침습적 방법인 PGT-A의 경우 비용과 윤리적 문제가 있다.
- 비침습적이고, 비용-effective한 방법으로 model기반의 분류기법을 제안해본다.
2. Contribution
- 
    10.4K의 110h 이후 정적 이미지를 취득하여 이를 이용해 AI 모델을 학습시켜, WCM-ES+ & IVI Valencia dataset에서 일반화된 성능을 AUC로 평가함 $\to$ STROKE-A제안 
- 
    3가지 이진 분류 task를 실험하고 분석함 - aneuploid vs. euploid : 69.3% (PPV: 76.1%, NPV: 62.1% / AUC: 76.1)
- complex aneuploidy vs. euploidy and single aneuploidy : 74% (PPV: 54.9%, NPV: 87.6%)
- complex aneuploidy vs. euploidy : 77.6% (PPV: 76.7%, NPV: 78%)
 
3. STORK-A
3.1. Preliminaries
사용 정보 : Image, 모세포 나이, morphokinetics, blastocyst score
- 
    blastocyst score: - blastocyst의 expansion 정도 & hatching status : Grade 1-6로 분류
- ICM (Inner-cell-mass): Grade A-C로 분류
- TE (Trophectoderm): Grade A-C로 분류
 
- 
    Morphokinetics : time-lapse microscopy로 취득한 이미지에 대해 형태학자들이 label을 수행 - 
        blastulation(포배 형성)을 시작으로 full blastulation까지로 정의 (aneuploidy, euploidy의 Morphokinetics time이 다름을 이용) $\to$ 성능에 도움이 안됨 - 이는 형태학자들간의 편차가 심하기 때문으로 사료됨
- PGT-A를 대체하진 못함
 
 
- 
        
- 
    기존 연구 - ERICA: DL model과 PGT-A & $\beta$-HCG concentration (임신 호르몬) 정보를 활용하여 embryos를 ranking
        - accuracy : 70% (AUC 74%: sensitivity: 54%, sepcificity: 86%)
- 한계점: single & complex aneuploid를 구분하지 않음
 
- Full-length time-lapse video를 이용
        - 3D Conv활용하여 1~5일의 수정란 time-lapse video에 대해 예측 수행
- AUC: 0.74
- 한계점: 데이터 부족 (n=690), 37년 이상된 난자 부족, time-lapse microscopy가 범용적이지 않다.
 
 
- ERICA: DL model과 PGT-A & $\beta$-HCG concentration (임신 호르몬) 정보를 활용하여 embryos를 ranking
        
- 
    STORK-A:  - 
        Time-lapse 이미지 중 static image 1장만 취해 사용 +난자의 나이, morphokinetic parameters, morphological assessment 정보를 활용 
 
- 
        
- 
    Dataset - Weill Cornell Medicine Center에서 10,378장의 이미지를 1385명의 환자로부터 취득 : 500x500 resolution
        - day-5: 3994
- day-6: 6384
 
- 장비: EmbryoScope time-lapse imaging 장비
- GT: PGT-A를 활용 (aneuploids: 5953, euploids: 4425)
        - Aneuploids (5953)
            - single aneuploids (2944)
- complex aneuploids (3009)
 
 
- Aneuploids (5953)
            
- Validation : maternel age, morphokinetics parameters, morphological assessment 존재
        - WCM-ES+ (841)
            - single aneuploids (170)
- complex aneuploids (261)
- euploids (410)
 
- IVI Valencia (554) :
            - aneuploids (319)
- euploids (235)
 
 
- WCM-ES+ (841)
            
 
- Weill Cornell Medicine Center에서 10,378장의 이미지를 1385명의 환자로부터 취득 : 500x500 resolution
        
- 
    Lasso Regression을 feature에 추가 - Regularization을 목적으로 l2 loss를 추가
- Feautre에 maternel age, morphokinetics parameters, morphological assessment 를 사용
 
- 
    Model - Deep Learning: Res18사용
- Machine Learning: XGBoost, k-NN, SVM, Random Forest 사용
 
4. Experiments
- 
    ML 결과: 5-fold-Cross-validation  
- 
    DL 결과 : 5-fold-Cross-validation  - AIBS: AI generated Blastocyst Score $\to$ 형태학자들의 score가 없더라도 이용 가능한 장점 + 성능 향상에 기여 (pseudo label 느낌)
 
- 
    다른 Dataset 결과  - Generalized되었음
 
- 
    수정란 이진 분류 & 임신 상관관계  
- 
    Ablation - 
        Maternal age & blastocyst score가 성능에 제일 큰 기여를 함 
- 
        correlation between ploidy trephectoderm grade (0.703) > inner cell mas (0.697) > expansion grade (0.692) 
 
- 
        
- 
    Web-site example of STORK-A 