• 우리

한국 청소년 및 젊은 성인을 대상으로 전통적인 치과 연령 추정 방법에 대한 데이터 마이닝 모델의 검증

Nature.com을 방문해 주셔서 감사합니다.사용 중인 브라우저 버전에서는 CSS 지원이 제한되어 있습니다.최상의 결과를 얻으려면 최신 버전의 브라우저를 사용하는 것이 좋습니다(또는 Internet Explorer에서 호환 모드를 끄는 것).그동안 지속적인 지원을 보장하기 위해 스타일 지정이나 JavaScript 없이 사이트를 표시하고 있습니다.
치아는 인체의 나이를 나타내는 가장 정확한 지표로 간주되며 법의학 연령 평가에 자주 사용됩니다.우리는 18세 임계값의 추정 정확도와 분류 성능을 기존 방법 및 데이터 마이닝 기반 연령 추정과 비교하여 데이터 마이닝 기반 치아 연령 추정의 유효성을 검증하는 것을 목표로 했습니다.15~23세의 한국과 일본 국민으로부터 총 2657장의 파노라마 방사선 사진을 수집하였다.이를 각각 900개의 한국 방사선 사진이 포함된 훈련 세트와 857개의 일본 방사선 사진이 포함된 내부 테스트 세트로 나누었습니다.우리는 데이터 마이닝 모델의 테스트 세트를 사용하여 기존 방법의 분류 정확도와 효율성을 비교했습니다.내부 테스트 세트에 대한 기존 방법의 정확도는 데이터 마이닝 모델의 정확도보다 약간 높으며 차이도 작습니다(평균 절대 오차 <0.21년, 제곱 평균 제곱 오차 <0.24년).18년 구분에 대한 분류 성능도 기존 방법과 데이터 마이닝 모델 간에 유사합니다.따라서 한국 청소년과 젊은 성인의 제2 및 제3대구치 성숙도를 이용한 법의학적 연령 평가를 수행할 때 전통적인 방법을 데이터 마이닝 모델로 대체할 수 있습니다.
치아 연령 추정은 법의학 및 소아 치과에서 널리 사용됩니다.특히, 생활연령과 치아발달 사이의 상관관계가 높기 때문에 치아발달단계에 따른 연령평가는 소아청소년의 연령을 평가하는 중요한 기준이 된다1,2,3.그러나 젊은 사람의 경우 치아성숙을 기준으로 치아나이를 추정하는 것은 제3대구치를 제외하면 치아성장이 거의 완료되어 있기 때문에 한계가 있다.청소년과 청소년의 연령을 결정하는 법적 목적은 그들이 성년에 도달했는지 여부에 대한 정확한 추정과 과학적 증거를 제공하는 것입니다.우리나라 청소년 및 청년의 법의학 실무에서는 Lee의 방법을 이용하여 연령을 추정하였고, Oh 등이 보고한 자료를 바탕으로 법적 기준치를 18세로 예측하였다5.
머신러닝은 대량의 데이터를 반복적으로 학습, 분류하고, 스스로 문제를 해결하며, 데이터 프로그래밍을 추진하는 인공지능(AI)의 일종이다.기계 학습은 대량의 데이터에서 유용한 숨겨진 패턴을 발견할 수 있습니다6.대조적으로, 노동 집약적이고 시간이 많이 걸리는 고전적인 방법은 수동으로 처리하기 어려운 대용량의 복잡한 데이터를 처리할 때 제한이 있을 수 있습니다7.따라서 최근 최신 컴퓨터 기술을 이용하여 인적 오류를 최소화하고 다차원 데이터를 효율적으로 처리하기 위한 많은 연구가 진행되고 있다8,9,10,11,12.특히 의료영상 분석에서는 딥러닝이 널리 활용되고 있으며, 방사선 사진을 자동으로 분석하여 연령 추정의 정확성과 효율성을 높이는 다양한 방법이 보고되고 있다13,14,15,16,17,18,19,20 .예를 들어, Halabi 등은 어린이 손의 방사선 사진을 사용하여 골격 연령을 추정하기 위해 CNN(컨볼루션 신경망)을 기반으로 한 기계 학습 알고리즘을 개발했습니다.본 연구에서는 의료 영상에 머신러닝을 적용한 모델을 제안하고, 이러한 방법이 진단 정확도를 향상시킬 수 있음을 보여줍니다.Li 등14은 딥러닝 CNN을 이용하여 골반 X선 영상으로부터 연령을 추정하고 이를 골화 단계 추정을 이용한 회귀 결과와 비교했습니다.그들은 딥러닝 CNN 모델이 전통적인 회귀 모델과 동일한 연령 추정 성능을 보인다는 것을 발견했습니다.Guo 등의 연구[15]는 치과 정사사진을 기반으로 한 CNN 기술의 연령 허용 분류 성능을 평가했으며, CNN 모델의 결과는 인간이 연령 분류 성능을 능가한다는 것을 입증했습니다.
기계학습을 이용한 연령 추정에 관한 대부분의 연구는 딥러닝 방법을 사용합니다13,14,15,16,17,18,19,20.딥러닝을 기반으로 한 연령 추정은 기존 방법보다 더 정확한 것으로 보고되었습니다.그러나 이 접근법은 추정에 사용된 연령 지표와 같은 연령 추정에 대한 과학적 근거를 제시할 기회를 거의 제공하지 않습니다.누가 검사를 실시하는지에 대한 법적 분쟁도 있습니다.따라서 딥러닝을 기반으로 한 연령 추정은 행정 및 사법 당국에서 받아들이기 어렵습니다.데이터 마이닝(DM)은 대용량 데이터 사이의 유용한 상관관계를 찾아내는 방법으로 예상된 정보뿐만 아니라 예상치 못한 정보도 발견할 수 있는 기술입니다6,21,22.기계 학습은 데이터 마이닝에 자주 사용되며, 데이터 마이닝과 기계 학습 모두 동일한 핵심 알고리즘을 사용하여 데이터의 패턴을 발견합니다.치아 발달을 이용한 연령 추정은 검사자의 대상 치아 성숙도 평가를 기반으로 하며, 이 평가는 각 대상 치아에 대한 단계로 표현됩니다.DM은 치과 평가 단계와 실제 연령 간의 상관관계를 분석하는 데 사용될 수 있으며 전통적인 통계 분석을 대체할 수 있는 잠재력을 가지고 있습니다.따라서 연령 추정에 DM 기법을 적용하면 법적 책임에 대한 걱정 없이 포렌식 연령 추정에 머신러닝을 구현할 수 있습니다.법의학 실습에 사용되는 전통적인 수동 방법과 치아 연령을 결정하기 위한 EBM 기반 방법에 대한 가능한 대안에 대한 여러 비교 연구가 발표되었습니다.Shen et al23은 DM 모델이 전통적인 Camerer 공식보다 더 정확하다는 것을 보여주었습니다.Galibourg et al24은 Demirdjian 기준25에 따라 연령을 예측하기 위해 다양한 DM 방법을 적용했으며 그 결과 프랑스 인구의 연령을 추정하는 데 있어 DM 방법이 Demirdjian 및 Willems 방법보다 우수한 것으로 나타났습니다.
한국의 청소년과 젊은 성인의 치아 연령을 추정하기 위해 Lee의 방법 4는 한국 법의학 실무에서 널리 사용됩니다.이 방법은 전통적인 통계 분석(예: 다중 회귀 분석)을 사용하여 한국인 피험자와 생활 연령 간의 관계를 조사합니다.본 연구에서는 전통적인 통계방법을 사용하여 얻은 연령 추정 방법을 '전통적 방법'으로 정의한다.Lee의 방법은 전통적인 방법으로 Oh et al.에 의해 정확성이 확인되었다.5;그러나 한국 법의학 실무에서 DM 모델을 기반으로 한 연령 추정의 적용 가능성은 여전히 ​​의문입니다.우리의 목표는 DM 모델을 기반으로 한 연령 추정의 잠재적 유용성을 과학적으로 검증하는 것이었습니다.본 연구의 목적은 (1) 치아 연령 추정에 있어서 두 DM 모델의 정확도를 비교하고 (2) 18세 연령의 7개 DM 모델의 분류 성능을 전통적인 통계 방법을 사용하여 얻은 분류 성능과 비교하는 것이었습니다. 양쪽 턱의 세 번째 어금니.
단계 및 치아 유형별 연대순 연령의 평균 및 표준 편차는 보충 표 S1(훈련 세트), 보충 표 S2(내부 테스트 세트) 및 보충 표 S3(외부 테스트 세트)에 온라인으로 표시됩니다.훈련 세트에서 얻은 관찰자 내 신뢰도와 관찰자 간 신뢰도에 대한 카파 값은 각각 0.951과 0.947이었습니다.카파 값에 대한 P 값과 95% 신뢰 구간은 온라인 보충 표 S4에 표시됩니다.카파 값은 Landis와 Koch26의 기준과 일치하여 "거의 완벽한" 것으로 해석되었습니다.
평균 절대 오차(MAE)를 비교할 때 전통적인 방법은 다층 퍼셉트론(MLP)을 제외하고 모든 성별 및 외부 남성 테스트 세트에서 DM 모델보다 약간 더 뛰어납니다.내부 MAE 테스트 세트에서 기존 모델과 DM 모델의 차이는 남성의 경우 0.12~0.19년, 여성의 경우 0.17~0.21년이었습니다.외부 테스트 배터리의 경우 차이가 더 작습니다(남성의 경우 0.001~0.05년, 여성의 경우 0.05~0.09년).또한 RMSE(제곱 평균 오차)는 기존 방법보다 약간 낮으며 차이가 더 작습니다(남성 내부 테스트 세트의 경우 0.17–0.24, 0.2–0.24, 외부 테스트 세트의 경우 0.03–0.07, 0.04–0.08).).MLP는 여성 외부 테스트 세트의 경우를 제외하고는 SLP(Single Layer Perceptron)보다 약간 더 나은 성능을 보여줍니다.MAE 및 RMSE의 경우 모든 성별 및 모델에 대해 외부 테스트 세트의 점수가 내부 테스트 세트보다 높습니다.모든 MAE 및 RMSE는 표 1과 그림 1에 나와 있습니다.
기존 및 데이터 마이닝 회귀 모델의 MAE 및 RMSE.평균 절대 오차 MAE, 제곱 평균 오차 RMSE, 단일 레이어 퍼셉트론 SLP, 다층 퍼셉트론 MLP, 기존 CM 방법.
민감도, 특이도, 양성 예측값(PPV), 음성 예측값(NPV) 및 수신기 작동 특성 곡선 아래 영역(AUROC) 측면에서 기존 모델과 DM 모델의 분류 성능(18년 컷오프)이 입증되었습니다. 27 (표 2, 그림 2 및 보충 그림 1 온라인).내부 테스트 배터리의 민감도 측면에서 전통적인 방법은 남성에서 가장 잘 수행되었으며 여성에서는 더 나빴습니다.그러나 기존 방법과 SD의 분류 성능 차이는 남성(MLP)의 경우 9.7%, 여성(XGBoost)의 경우 2.4%에 불과합니다.DM 모델 중에서 로지스틱 회귀(LR)는 남녀 모두에서 더 나은 민감도를 보였습니다.내부 테스트 세트의 특이성과 관련하여 4개의 SD 모델이 남성에서 잘 수행되는 반면 기존 모델은 여성에서 더 잘 수행되는 것으로 관찰되었습니다.남성과 여성의 분류 성능 차이는 각각 13.3%(MLP), 13.1%(MLP)로 모델 간 분류 성능 차이가 민감도를 초과하는 것으로 나타났다.DM 모델 중 SVM(Support Vector Machine), DT(Decision Tree), RF(Random Forest) 모델은 남성에서 가장 좋은 성능을 보인 반면, LR 모델은 여성에서 가장 좋은 성능을 보였습니다.기존 모델과 모든 SD 모델의 AUROC는 0.925(남성의 k-최근접 이웃(KNN))보다 커서 18세 표본을 식별하는 데 탁월한 분류 성능을 보여줍니다28.외부 테스트 세트의 경우 내부 테스트 세트에 비해 민감도, 특이도, AUROC 측면에서 분류 성능이 감소했습니다.또한, 최고 모델과 최악 모델의 분류 성능 간 민감도와 특이도의 차이는 10%~25% 범위로 내부 테스트 세트의 차이보다 컸다.
18년의 구분 기간을 가진 기존 방법과 비교한 데이터 마이닝 분류 모델의 민감도 및 특이도.KNN k 최근접 이웃, SVM 지원 벡터 머신, LR 로지스틱 회귀, DT 결정 트리, RF 랜덤 포레스트, XGB XGBoost, MLP 다층 퍼셉트론, 기존 CM 방법.
본 연구의 첫 번째 단계는 7개의 DM 모델에서 얻은 치아 연령 추정치의 정확성을 전통적인 회귀 분석을 사용하여 얻은 추정치와 비교하는 것이었습니다.MAE와 RMSE는 남녀 모두 내부 테스트 세트에서 평가되었으며, 기존 방법과 DM 모델의 차이는 MAE의 경우 44~77일, RMSE의 경우 62~88일 범위였습니다.본 연구에서는 전통적인 방법이 약간 더 정확했지만, 이러한 작은 차이가 임상적 또는 실제적인 의미가 있는지 결론을 내리기는 어렵습니다.이러한 결과는 DM 모델을 이용한 치아 연령 추정의 정확도가 기존 방법과 거의 동일함을 나타냅니다.본 연구와 동일한 연령대의 치아를 기록하는 동일한 기술을 사용하여 DM 모델의 정확도를 전통적인 통계 방법과 비교한 연구가 없기 때문에 이전 연구 결과와의 직접적인 비교는 어렵습니다.Galibourg et al24은 2~24세 프랑스 인구를 대상으로 두 가지 전통적인 방법(Demirjian 방법25 및 Willems 방법29)과 10개 DM 모델 간의 MAE와 RMSE를 비교했습니다.그들은 Willems 및 Demirdjian 방법에 비해 MAE에서 0.20년과 0.38년, RMSE에서 0.25년과 0.47년의 차이를 가지고 모든 DM 모델이 전통적인 방법보다 더 정확하다고 보고했습니다.Halibourg 연구에서 나타난 SD 모델과 전통적인 방법 사이의 불일치는 Demirdjian 방법이 연구의 기반이 된 프랑스계 캐나다인 이외의 인구 집단에서 치아 연령을 정확하게 추정하지 못한다는 수많은 보고서30,31,32,33를 고려합니다.본 연구에서는.Tai 등은 MLP 알고리즘을 사용하여 1636개의 중국 교정 사진에서 치아 연령을 예측하고 그 정확도를 Demirjian 및 Willems 방법의 결과와 비교했습니다.그들은 MLP가 기존 방법보다 정확도가 더 높다고 보고했습니다.Demirdjian 방법과 전통적인 방법의 차이는 <0.32년이고, Willems 방법은 0.28년으로 본 연구의 결과와 유사하다.이러한 선행연구24,34의 결과도 본 연구의 결과와 일치하며, DM모델과 전통적인 방법의 연령 추정 정확도는 유사하다.그러나 제시된 결과를 토대로 DM 모델을 사용하여 연령을 추정하는 것이 비교 및 ​​참조 이전 연구의 부족으로 인해 기존 방법을 대체할 수 있다는 결론을 조심스럽게 내릴 수 있습니다.본 연구에서 얻은 결과를 확인하려면 더 큰 표본을 사용한 후속 연구가 필요합니다.
치아 연령 추정에 있어 SD의 정확도를 테스트한 연구 중 일부는 우리 연구보다 더 높은 정확도를 보였습니다.Stepanovsky 등은 2.7세에서 20.5세 사이의 체코 거주자 976명의 파노라마 방사선 사진에 22개의 SD 모델을 적용하고 각 모델의 정확도를 테스트했습니다.그들은 Moorrees et al36이 제안한 분류 기준을 사용하여 총 16개의 왼쪽 위 및 아래 영구치의 발달을 평가했습니다.MAE 범위는 0.64~0.94년이고 RMSE 범위는 0.85~1.27년으로, 이는 본 연구에 사용된 두 가지 DM 모델보다 더 정확합니다.Shen 등23은 Cameriere 방법을 사용하여 5~13세 중국 동부 거주자의 왼쪽 하악 영구치 7개의 치아 연령을 추정하고 이를 선형 회귀 분석, SVM 및 RF를 사용하여 추정한 연령과 비교했습니다.그들은 세 가지 DM 모델 모두 기존 Cameriere 공식에 비해 정확도가 더 높다는 것을 보여주었습니다.Shen의 연구에서 MAE와 RMSE는 본 연구에서 DM 모델의 MAE와 RMSE보다 낮았습니다.Stepanovsky et al.의 연구 정확도가 향상되었습니다.35 및 Shen et al.23은 연구 표본에 더 젊은 피험자가 포함되었기 때문일 수 있습니다.치아가 발달하는 동안 치아 수가 증가함에 따라 치아가 발달한 참가자의 연령 추정이 더 정확해지기 때문에 연구 참가자가 더 어릴 때 결과 연령 추정 방법의 정확성이 손상될 수 있습니다.또한 MLP의 연령 추정 오류는 SLP보다 약간 작습니다. 이는 MLP가 SLP보다 더 정확하다는 것을 의미합니다.MLP는 MLP38의 숨겨진 레이어로 인해 연령 추정에 약간 더 나은 것으로 간주됩니다.그러나 여성의 외부 표본(SLP 1.45, MLP 1.49)에는 예외가 있습니다.연령 평가에 있어서 MLP가 SLP보다 더 정확하다는 사실을 발견하려면 추가적인 후향적 연구가 필요합니다.
18년 기준으로 DM 모델과 기존 방법의 분류 성능도 비교했습니다.테스트된 모든 SD 모델과 내부 테스트 세트의 기존 방법은 18세 표본에 대해 실질적으로 허용 가능한 수준의 차별을 보여주었습니다.남성과 여성의 민감도는 각각 87.7%, 94.9% 이상이었고 특이도는 89.3%, 84.7% 이상으로 나타났다.테스트된 모든 모델의 AUROC도 0.925를 초과합니다.우리가 아는 한, 치과 성숙도를 기반으로 한 18년 분류에 대한 DM 모델의 성능을 테스트한 연구는 없습니다.본 연구의 결과를 파노라마 방사선 사진에 대한 딥러닝 모델의 분류 성능과 비교할 수 있습니다.Guo et al.15는 특정 연령 임계값에 대해 CNN 기반 딥러닝 모델과 Demirjian 방법을 기반으로 한 수동 방법의 분류 성능을 계산했습니다.수동 방법의 민감도와 특이도는 각각 87.7%와 95.5%를 나타냈고, CNN 모델의 민감도와 특이도는 각각 89.2%와 86.6%를 넘어섰다.그들은 딥 러닝 모델이 연령 임계값 분류 시 수동 평가를 대체하거나 능가할 수 있다는 결론을 내렸습니다.본 연구의 결과는 유사한 분류 성능을 보여주었습니다.DM 모델을 사용한 분류는 연령 추정을 위한 전통적인 통계 방법을 대체할 수 있다고 믿어집니다.모델 중 남성 표본에 대한 민감도와 여성 표본에 대한 민감도 및 특이도 측면에서 DM LR이 가장 좋은 모델이었습니다.LR은 남성에 대한 특이성에서 2위를 차지했습니다.또한 LR은 보다 사용자 친화적인 DM35 모델 중 하나로 간주되며 덜 복잡하고 처리가 어렵습니다.이러한 결과를 바탕으로 LR은 한국 인구의 18세 청소년에 대한 최상의 컷오프 분류 모델로 간주되었습니다.
전반적으로 외부 테스트 세트의 연령 추정이나 분류 성능의 정확도는 내부 테스트 세트의 결과에 비해 낮거나 낮았습니다.일부 보고서에서는 한국인 인구를 기준으로 한 연령 추정치를 일본인 인구에 적용하면 분류 정확도나 효율성이 감소한다는 보고가 있으며5,39 본 연구에서도 유사한 패턴이 발견되었습니다.이러한 악화 추세는 DM 모델에서도 관찰되었습니다.따라서 정확한 연령 추정을 위해서는 분석 과정에서 DM을 사용하더라도 전통적인 방법과 같은 자생 인구 데이터에서 파생된 방법이 선호되어야 한다5,39,40,41,42.딥러닝 모델이 비슷한 경향을 보일 수 있는지가 불분명하기 때문에, 제한된 연령에서 인공지능이 이러한 인종적 격차를 극복할 수 있는지 확인하기 위해서는 동일한 표본을 대상으로 전통적인 방법, DM 모델, 딥러닝 모델을 사용하여 분류 정확도와 효율성을 비교하는 연구가 필요합니다.평가.
우리는 한국의 법의학 연령 추정 실무에서 DM 모델 기반의 연령 추정으로 전통적인 방법을 대체할 수 있음을 입증합니다.또한 법의학 연령 평가를 위해 기계 학습을 구현할 가능성도 발견했습니다.그러나 결과를 확정적으로 판단하기에는 본 연구에 참여자가 부족하고, 본 연구의 결과를 비교하고 확인할 수 있는 선행연구가 부족하다는 점 등 분명한 한계점이 있다.앞으로 DM 연구는 전통적인 방법에 비해 더 많은 수의 표본과 더 다양한 모집단을 대상으로 수행되어 실제 적용 가능성을 향상시켜야 합니다.인공 지능을 사용하여 여러 모집단의 연령을 추정하는 타당성을 검증하려면 동일한 샘플에서 DM 및 딥 러닝 모델의 분류 정확도와 효율성을 기존 방법과 비교하는 향후 연구가 필요합니다.
이번 연구에서는 15~23세의 한국과 일본 성인으로부터 수집한 2,657개의 정사 사진을 사용했습니다.한국 방사선 사진은 900개의 훈련 세트(19.42±2.65세)와 900개의 내부 테스트 세트(19.52±2.59세)로 나누어졌다.훈련 세트는 한 기관(서울성모병원)에서 수집하였고, 자체 테스트 세트는 두 기관(서울대학교 치과병원과 연세대학교 치과병원)에서 수집했습니다.또한 외부 테스트를 위해 다른 인구 기반 데이터(일본 이와테 의과대학)로부터 857개의 방사선 사진을 수집했습니다.일본인 피험자(19.31 ± 2.60세)의 방사선 사진이 외부 테스트 세트로 선택되었습니다.치과 치료 중 촬영한 파노라마 방사선 사진을 통해 치아 발달 단계를 분석하기 위해 후향적으로 데이터를 수집하였다.수집된 모든 데이터는 성별, 생년월일, 방사선 촬영 날짜를 제외하고 익명으로 처리되었습니다.포함 및 제외 기준은 이전에 발표된 연구와 동일했습니다4, 5.실제 나이는 방사선 사진 촬영일에서 생년월일을 뺀 값으로 계산됐다.표본 집단은 9개의 연령 집단으로 나누어졌다.연령 및 성별 분포는 표 3과 같습니다. 본 연구는 헬싱키 선언에 따라 수행되었으며 가톨릭대학교 서울성모병원 임상시험심사위원회(IRB)(KC22WISI0328)의 승인을 받았습니다.본 연구의 후향적 설계로 인해 치료 목적으로 방사선 촬영 검사를 받는 모든 환자로부터 사전 동의를 얻을 수 없었습니다.서울고려대학교성모병원(IRB)은 사전동의 요건을 포기했습니다.
양악 제2대구치와 제3대구치의 발달 단계는 Demircan 기준25에 따라 평가되었습니다.각 턱의 왼쪽과 오른쪽에 동일한 유형의 치아가 발견된 경우 하나의 치아만 선택되었습니다.양측의 상동 치아가 발달 단계가 다른 경우 추정 연령의 불확실성을 설명하기 위해 발달 단계가 낮은 치아를 선택했습니다.훈련 세트에서 무작위로 선택된 100개의 방사선 사진은 경험이 풍부한 두 명의 관찰자가 점수를 매겨 사전 교정 후 관찰자 간 신뢰성을 테스트하여 치아 성숙 단계를 결정했습니다.관찰자 내 신뢰도는 일차 관찰자가 3개월 간격으로 두 번 평가했습니다.
훈련 세트에서 각 턱의 두 번째 및 세 번째 어금니의 성별과 발달 단계는 서로 다른 DM 모델로 훈련된 일차 관찰자에 의해 추정되었으며 실제 연령은 목표 값으로 설정되었습니다.머신러닝에 널리 사용되는 SLP 및 MLP 모델을 회귀 알고리즘에 대해 테스트했습니다.DM 모델은 네 개의 치아의 발달 단계를 사용하여 선형 함수를 결합하고 이러한 데이터를 결합하여 연령을 추정합니다.SLP는 가장 간단한 신경망이며 숨겨진 레이어를 포함하지 않습니다.SLP는 노드 간 임계값 전송을 기반으로 작동합니다.회귀 분석의 SLP 모델은 다중 선형 회귀 분석과 수학적으로 유사합니다.SLP 모델과 달리 MLP 모델에는 비선형 활성화 함수를 사용하는 여러 개의 숨겨진 레이어가 있습니다.우리의 실험에서는 비선형 활성화 함수가 있는 숨겨진 노드가 20개만 있는 숨겨진 레이어를 사용했습니다.기계 학습 모델을 훈련하기 위해 최적화 방법으로 경사하강법을 사용하고 손실 함수로 MAE 및 RMSE를 사용합니다.가장 잘 얻은 회귀 모델을 내부 및 외부 테스트 세트에 적용하고 치아의 나이를 추정했습니다.
샘플이 18세인지 여부를 예측하기 위해 훈련 세트에서 4개 치아의 성숙도를 사용하는 분류 알고리즘이 개발되었습니다.모델을 구축하기 위해 우리는 (1) LR, (2) KNN, (3) SVM, (4) DT, (5) RF, (6) XGBoost 및 (7) MLP의 7가지 표현 기계 학습 알고리즘6,43을 도출했습니다. .LR은 가장 널리 사용되는 분류 알고리즘 중 하나입니다44.회귀분석을 사용하여 특정 카테고리에 속하는 데이터의 확률을 0에서 1까지 예측하고, 이 확률을 기반으로 데이터를 더 가능성 있는 카테고리에 속하는 것으로 분류하는 지도 학습 알고리즘입니다.주로 이진 분류에 사용됩니다.KNN은 가장 간단한 기계 학습 알고리즘 중 하나입니다45.새로운 입력 데이터가 주어지면 기존 세트와 가까운 k개의 데이터를 찾아 빈도가 가장 높은 클래스로 분류합니다.고려된 이웃 수(k)를 3으로 설정했습니다.SVM은 선형 공간을 fields46이라는 비선형 공간으로 확장하는 커널 함수를 사용하여 두 클래스 간의 거리를 최대화하는 알고리즘입니다.이 모델에서는 바이어스 = 1, 전력 = 1, 감마 = 1을 다항식 커널의 하이퍼파라미터로 사용합니다.DT는 의사결정 규칙을 트리 구조로 표현하여 전체 데이터 세트를 여러 하위 그룹으로 나누는 알고리즘으로 다양한 분야에 적용되었습니다47.모델은 노드당 최소 레코드 수 2로 구성되었으며 지니 지수를 품질 척도로 사용합니다.RF는 원본 데이터 세트에서 동일한 크기의 샘플을 여러 번 무작위로 추출하여 각 샘플에 대해 약한 분류기를 생성하는 부트스트랩 집계 방법을 사용하여 여러 DT를 결합하여 성능을 향상시키는 앙상블 방법입니다48.노드 분리 기준으로는 트리 100개, 트리 깊이 10개, 최소 노드 크기 1개, Gini 혼합 지수를 사용했습니다.새로운 데이터의 분류는 다수결로 결정됩니다.XGBoost는 이전 모델의 실제 값과 예측 값 사이의 오차를 학습 데이터로 취하고 기울기를 사용하여 오차를 증가시키는 방법을 사용하여 부스팅 기술을 결합한 알고리즘입니다49.성능과 자원 효율성이 우수할 뿐만 아니라 과적합 보정 함수로 신뢰도가 높아 널리 사용되는 알고리즘입니다.이 모델에는 400개의 지지 바퀴가 장착되어 있습니다.MLP는 하나 이상의 퍼셉트론이 입력 레이어와 출력 레이어 사이에 하나 이상의 숨겨진 레이어가 있는 다중 레이어를 형성하는 신경망입니다.이를 이용하면 입력 레이어를 추가하고 결과 값을 얻을 때 예측된 결과 값과 실제 결과 값을 비교하여 오류가 다시 전파되는 비선형 분류를 수행할 수 있습니다.각 레이어에 20개의 은닉 뉴런이 있는 은닉 레이어를 만들었습니다.우리가 개발한 각 모델은 내부 및 외부 세트에 적용되어 민감도, 특이도, PPV, NPV 및 AUROC를 계산하여 분류 성능을 테스트했습니다.민감도는 18세 이상으로 추정되는 표본과 18세 이상으로 추정되는 표본의 비율로 정의됩니다.특이도는 18세 미만의 표본과 18세 미만으로 추정되는 표본의 비율입니다.
훈련 세트에서 평가된 치과 단계는 통계 분석을 위해 수치 단계로 변환되었습니다.성별에 따른 예측 모델을 개발하고 연령 추정에 사용할 수 있는 회귀식을 도출하기 위해 다변량 선형 및 로지스틱 회귀 분석을 수행했습니다.우리는 이러한 공식을 사용하여 내부 및 외부 테스트 세트 모두에 대한 치아 연령을 추정했습니다.표 4는 본 연구에 사용된 회귀 및 분류 모델을 보여줍니다.
관찰자 내 및 관찰자 간 신뢰도는 Cohen의 카파 통계를 사용하여 계산되었습니다.DM 및 기존 회귀 모델의 정확성을 테스트하기 위해 내부 및 외부 테스트 세트의 추정 및 실제 수명을 사용하여 MAE 및 RMSE를 계산했습니다.이러한 오류는 일반적으로 모델 예측의 정확성을 평가하는 데 사용됩니다.오류가 작을수록 예측의 정확도가 높아집니다24.DM과 기존 회귀를 사용하여 계산된 내부 및 외부 테스트 세트의 MAE 및 RMSE를 비교합니다.전통적인 통계의 18년 구분의 분류 성능은 2×2 분할표를 사용하여 평가되었습니다.계산된 테스트 세트의 민감도, 특이도, PPV, NPV, AUROC를 DM 분류 모델의 측정값과 비교했습니다.데이터는 데이터의 특성에 따라 평균±표준편차 또는 수치(%)로 표현됩니다.양면 P 값 <0.05는 통계적으로 유의한 것으로 간주되었습니다.모든 일상적인 통계 분석은 SAS 버전 9.4(SAS Institute, Cary, NC)를 사용하여 수행되었습니다.DM 회귀 모델은 특별히 수학 연산을 위해 Keras50 2.2.4 백엔드와 Tensorflow51 1.8.0을 사용하여 Python으로 구현되었습니다.DM 분류 모델은 Waikato 지식 분석 환경 및 KNIME(Konstanz Information Miner) 4.6.152 분석 플랫폼에서 구현되었습니다.
저자는 연구 결론을 뒷받침하는 데이터가 기사와 보충 자료에서 발견될 수 있음을 인정합니다.연구 중에 생성 및/또는 분석된 데이터 세트는 합당한 요청이 있을 경우 해당 저자에게 제공됩니다.
Ritz-Timme, S. et al.연령 평가: 법의학 실무의 특정 요구 사항을 충족하는 최신 기술입니다.국제성.J. 법률 의학.113, 129-136(2000).
Schmeling, A., Reisinger, W., Geserik, G. 및 Olze, A. 형사 기소 목적을 위한 살아있는 피험자의 법의학적 연령 평가의 현재 상태.법의학.약.병리학.1, 239-246(2005).
Pan, J. et al.중국 동부 지역에서 5~16세 어린이의 치아 연령을 평가하기 위한 수정된 방법입니다.객관적인.구두 조사.25, 3463-3474(2021).
Lee, SS 등. 한국인의 제2, 제3대구치 발달 연대기와 법의학 연령 평가에의 적용.국제성.J. 법률 의학.124, 659–665 (2010).
Oh, S., Kumagai, A., Kim, SY 및 Lee, SS 한국인과 일본인의 제2 및 제3대구치의 성숙도에 기초한 연령 추정 및 18세 역치 추정의 정확성.PLoS ONE 17, e0271247(2022).
김, JY, 외.수술 전 머신러닝 기반 데이터 분석은 OSA 환자의 수면 수술 치료 결과를 예측할 수 있습니다.과학.보고서 11, 14911(2021).
Han, M. et al.사람의 개입 여부에 관계없이 기계 학습을 통해 정확한 연령 추정이 가능합니까?국제성.J. 법률 의학.136, 821–831(2022).
Khan, S. 및 Shaheen, M. 데이터 마이닝에서 데이터 마이닝까지.J.정보.과학.https://doi.org/10.1177/01655515211030872 (2021).
Khan, S. 및 Shaheen, M. WisRule: 연관 규칙 마이닝을 위한 최초의 인지 알고리즘.J.정보.과학.https://doi.org/10.1177/01655515221108695 (2022).
Shaheen M. 및 Abdullah U. Karm: 상황 기반 연관 규칙을 기반으로 한 전통적인 데이터 마이닝.계산하다.매트.계속하다.68, 3305-3322(2021).
Muhammad M., Rehman Z., Shaheen M., Khan M. 및 Habib M. 텍스트 데이터를 사용한 딥 러닝 기반 의미 유사성 탐지.알리다.기술.제어.https://doi.org/10.5755/j01.itc.49.4.27118 (2020).
Tabish, M., Tanoli, Z. 및 Shahin, M. 스포츠 비디오의 활동을 인식하는 시스템.멀티미디어.도구 응용 프로그램 https://doi.org/10.1007/s11042-021-10519-6 (2021).
Halabi, SSet al.소아 뼈 연령의 RSNA 기계 학습 과제.방사선과 290, 498-503 (2019).
Li, Y. et al.딥러닝을 활용한 골반 엑스레이를 통한 법의학 연령 추정.유로.방사능.29, 2322~2329(2019).
Guo, YC, 그 외 여러분.정사영 투영 이미지의 수동 방법과 심층 합성곱 신경망을 사용하여 정확한 연령 분류.국제성.J. 법률 의학.135, 1589~1597(2021).
앨라배마 Daloraet al.다양한 기계 학습 방법을 사용한 뼈 연령 추정: 체계적인 문헌 검토 및 메타 분석.PLoS ONE 14, e0220242(2019).
Du, H., Li, G., Cheng, K., Yang, J. 콘빔 컴퓨터 단층촬영을 사용하여 제1대구치의 치수실 부피를 기반으로 한 아프리카계 미국인과 중국인의 인구별 연령 추정.국제성.J. 법률 의학.136, 811–819(2022).
김S., 이영화, 노영경, 박FK, 오KS 인공지능 기반 제1대구치 영상을 이용하여 살아있는 사람의 연령군을 결정한다.과학.보고서 11, 1073(2021).
Stern, D., Payer, C., Giuliani, N. 및 Urschler, M. 다변량 MRI 데이터로부터 자동 연령 추정 및 대다수 연령 분류.IEEE J. Biomed.건강 경고.23, 1392~1403(2019).
Cheng, Q., Ge, Z., Du, H. 및 Li, G. 딥 러닝과 레벨 세트를 통합하여 콘빔 컴퓨터 단층 촬영에서 얻은 첫 번째 대구치의 3D 치수강 분할을 기반으로 한 연령 추정.국제성.J. 법률 의학.135, 365–373(2021).
우, WT, 그 외 여러분.임상 빅데이터의 데이터 마이닝: 공통 데이터베이스, 단계 및 방법 모델.세계.약.자원.8, 44(2021).
Yang, J. et al.빅데이터 시대의 의료 데이터베이스와 데이터 마이닝 기술 소개.J. 아비드.기초의학.13, 57–69(2020).
Shen, S. et al.기계 학습을 사용하여 치아 나이를 추정하는 Camerer의 방법.BMC 구강 건강 21, 641(2021).
Galliburg A. et al.Demirdjian 스테이징 방법을 사용하여 치아 연령을 예측하기 위한 다양한 기계 학습 방법 비교.국제성.J. 법률 의학.135, 665–675(2021).
Demirdjian, A., Goldstein, H. 및 Tanner, JM 치아 연령 평가를 위한 새로운 시스템.흡입.생물학.45, 211–227(1973).
Landis, JR 및 Koch, GG 범주형 데이터에 대한 관찰자 합의 척도.생체 인식 33, 159–174 (1977).
Bhattacharjee S, Prakash D, 김 C, 김 HK 및 최 HK.원발성 뇌종양 감별을 위한 인공지능 기법을 이용한 2차원 자기공명영상의 조직적, 형태학적, 통계적 분석.건강 정보.자원.https://doi.org/10.4258/hir.2022.28.1.46 (2022).


게시 시간: 2024년 1월 4일