Validation of a data mining model against traditional dental age estimation methods among Korean adolescents and young adults

Nature.com을 방문해 주셔서 감사합니다. 사용중인 브라우저 버전에는 CSS 지원이 제한되어 있습니다. 최상의 결과를 얻으려면 최신 버전의 브라우저 (또는 Internet Explorer에서 호환성 모드를 끄는 것이 좋습니다)를 사용하는 것이 좋습니다. 그 동안 지속적인 지원을 보장하기 위해 스타일링이나 JavaScript없이 사이트를 표시하고 있습니다.
치아는 인체 연령의 가장 정확한 지표로 간주되며 종종 법의학 연령 평가에 사용됩니다. 우리는 18 년 임계 값의 추정 정확도 및 분류 성능을 전통적인 방법 및 데이터 마이닝 기반 연령 추정치와 비교하여 데이터 마이닝 기반 치과 연령 추정치를 검증하는 것을 목표로했습니다. 15 세에서 23 세 사이의 한국과 일본 시민으로부터 총 2657 개의 파노라마 방사선 사진이 수집되었습니다. 그들은 각각 900 개의 한국 방사선 사진을 포함하는 훈련 세트와 857 개의 일본 방사선 사진을 포함하는 내부 테스트 세트로 나뉘 었습니다. 우리는 전통적인 방법의 분류 정확도와 효율성을 데이터 마이닝 모델의 테스트 세트와 비교했습니다. 내부 테스트 세트에서 전통적인 방법의 정확도는 데이터 마이닝 모델의 정확도보다 약간 높으며 차이는 작습니다 (평균 절대 오차 <0.21 년, 루트 평균 제곱 오차 <0.24 년). 18 년 컷오프의 분류 성능은 기존 방법과 데이터 마이닝 모델간에 유사합니다. 따라서, 한국 청소년과 청년의 2 차 및 세 번째 어금니의 성숙도를 사용하여 법의학 연령 평가를 수행 할 때 전통적인 방법은 데이터 마이닝 모델로 대체 될 수 있습니다.
치과 연령 추정은 법의학 및 소아 치과에서 널리 사용됩니다. 특히, 연대기 연령과 치과 발달 사이의 높은 상관 관계로 인해, 치과 발달 단계에 의한 연령 평가는 어린이와 청소년의 연령을 평가하는 중요한 기준입니다. 그러나 젊은이들에게는 치과 성숙에 근거한 치과 연령을 추정하는 것은 세 번째 어금니를 제외하고 치과 성장이 거의 완료 되었기 때문에 그 한계가 있습니다. 젊은이들과 청소년의 나이를 결정하는 법적 목적은 그들이 다수의 나이에 도달했는지에 대한 정확한 추정치와 과학적 증거를 제공하는 것입니다. 한국의 청소년과 청년들의 의학적 수립 관행에서, 나이는 Lee의 방법을 사용하여 추정되었으며, 18 세의 법적 임계 값은 Oh et al 5에 의해보고 된 데이터에 기초하여 예측되었다.
머신 러닝은 많은 양의 데이터를 반복적으로 배우고 분류하고 자체적으로 문제를 해결하며 데이터 프로그래밍을 주도하는 인공 지능 (AI) 유형입니다. 기계 학습은 대량의 데이터에서 유용한 숨겨진 패턴을 발견 할 수 있습니다. 대조적으로, 노동 집약적이고 시간이 많이 걸리는 고전적인 방법은 수동으로 처리하기 어려운 많은 양의 복잡한 데이터를 다룰 때 제한이있을 수있다. 따라서 최근에 많은 연구가 최신 컴퓨터 기술을 사용하여 인간 오류를 최소화하고 다차원 데이터 8,9,10,11,12를 효율적으로 처리했습니다. 특히, 딥 러닝은 의료 이미지 분석에 널리 사용되어 왔으며, 방사선 사진을 자동으로 분석함으로써 연령 추정을위한 다양한 방법이 연령 추정의 정확성과 효율성을 향상시키는 것으로보고되었다 13,14,16,17,18,19,20 . 예를 들어, Halabi et al 13은 CNN (Convolutional Neural Networks)을 기반으로 한 기계 학습 알고리즘을 개발하여 어린이 손의 방사선 사진을 사용하여 골격 연령을 추정했습니다. 이 연구는 기계 학습을 의료 이미지에 적용하는 모델을 제안하고 이러한 방법이 진단 정확도를 향상시킬 수 있음을 보여줍니다. Li et al14는 딥 러닝 CNN을 사용한 골반 X- 선 이미지로부터 추정 된 연령을 추정하고이를 골화 단계 추정을 사용한 회귀 결과와 비교했다. 그들은 딥 러닝 CNN 모델이 전통적인 회귀 모델과 동일한 연령 추정 성능을 보여 주었다는 것을 발견했습니다. Guo et al.의 연구 [15]는 치과 오르토 포토를 기반으로 한 CNN 기술의 연령 내성 분류 성능을 평가했으며, CNN 모델의 결과는 인간이 연령 분류 성능을 능가한다는 것을 증명했다.
기계 학습을 사용한 연령 추정에 대한 대부분의 연구 딥 러닝 방법 13,15,16,17,18,19,20. 딥 러닝을 기반으로 한 연령 추정은 전통적인 방법보다 더 정확한 것으로보고됩니다. 그러나이 접근법은 추정에 사용 된 연령 지표와 같은 연령 추정치에 대한 과학적 근거를 제시 할 기회가 거의 없습니다. 누가 검사를 수행하는지에 대한 법적 분쟁도 있습니다. 따라서 딥 러닝에 근거한 연령 추정은 행정 및 사법 당국에 의해 받아들이 기 어렵다. 데이터 마이닝 (DM)은 많은 양의 데이터 사이의 유용한 상관 관계를 발견하는 방법으로 예상 할뿐만 아니라 예기치 않은 정보를 발견 할 수있는 기술입니다. 기계 학습은 종종 데이터 마이닝에 사용되며 데이터 마이닝 및 머신 러닝은 동일한 주요 알고리즘을 사용하여 데이터의 패턴을 발견합니다. 치과 발달을 사용한 연령 추정은 시험관의 표적 치아의 성숙도에 대한 평가를 기반으로하며,이 평가는 각 목표 치아에 대한 단계로 표현됩니다. DM은 치과 평가 단계와 실제 연령 사이의 상관 관계를 분석하는 데 사용될 수 있으며 전통적인 통계 분석을 대체 할 가능성이 있습니다. 따라서, 연령 추정에 DM 기술을 적용하면 법 의학적 책임에 대해 걱정하지 않고 법의학 연령 추정에서 머신 러닝을 구현할 수 있습니다. 법의학 실습에 사용되는 전통적인 수동 방법 및 치과 연령을 결정하기위한 EBM 기반 방법에 대한 가능한 대안에 대한 몇 가지 비교 연구가 발표되었습니다. Shen et al23은 DM 모델이 전통적인 카메라 공식보다 더 정확하다는 것을 보여 주었다. Galibourg 등은 Demirdjian Criterion25에 따라 연령을 예측하기 위해 다른 DM 방법을 적용했으며 결과는 DM 방법이 프랑스 인구의 연령을 추정하는 데 Demirdjian 및 Willems 방법보다 성능이 우수하다는 것을 보여 주었다.
한국 청소년과 청년의 치과 연령을 추정하기 위해 Lee의 방법 4는 한국 법의학 실습에 널리 사용됩니다. 이 방법은 전통적인 통계 분석 (예 : 다중 회귀)을 사용하여 한국 대상과 연대기의 관계를 조사합니다. 이 연구에서 전통적인 통계적 방법을 사용하여 얻은 연령 추정 방법은 "전통적인 방법"으로 정의됩니다. Lee의 방법은 전통적인 방법이며 Oh et al. 5; 그러나 한국 법의학 관행에서 DM 모델에 기초한 연령 추정의 적용 가능성은 여전히 의문의 여지가있다. 우리의 목표는 DM 모델을 기반으로 연령 추정의 잠재적 유용성을 과학적으로 검증하는 것이 었습니다. 이 연구의 목적은 (1) 치과 연령 추정에서 2 개의 DM 모델의 정확도를 비교하고 (2) 18 세의 7 DM 모델의 분류 성능과 비교하는 것이 었습니다. 두 턱의 세 번째 어금니.
단계 및 치아 유형별 연대순 연령의 평균 및 표준 편차는 보충 표 S1 (훈련 세트), 보충 표 S2 (내부 테스트 세트) 및 보충 표 S3 (외부 테스트 세트)에 온라인으로 표시됩니다. 훈련 세트에서 얻은 내부 및 관찰자 신뢰도에 대한 카파 값은 각각 0.951 및 0.947이었다. 카파 값에 대한 P 값 및 95% 신뢰 구간은 온라인 보충 표 S4에 나와 있습니다. 카파 값은 Landis 및 Koch26의 기준과 일치하여“거의 완벽한”것으로 해석되었습니다.
MAE (평균 절대 오차)를 비교할 때, 기존 메소드는 다층 퍼셉트론 (MLP)을 제외하고 모든 성별 및 외부 남성 테스트 세트에서 DM 모델보다 약간 능가합니다. 내부 MAE 테스트 세트의 기존 모델과 DM 모델의 차이는 남성의 경우 0.12–0.19 년, 여성의 경우 0.17–0.21 년이었습니다. 외부 테스트 배터리의 경우 차이가 더 작습니다 (남성의 경우 0.001–0.05 년, 여성의 경우 0.05–0.09 년). 또한 루트 평균 제곱 오차 (RMSE)는 기존 방법보다 약간 낮으며, 차이가 작은 차이 (남성 내부 테스트 세트의 경우 0.17–0.24, 0.2–0.24, 외부 테스트 세트의 경우 0.03–0.07, 0.04–0.08). ). MLP는 여성 외부 테스트 세트의 경우를 제외하고는 단일 레이어 퍼셉트론 (SLP)보다 약간 더 나은 성능을 보여줍니다. MAE 및 RMSE의 경우 외부 테스트 세트는 모든 성별 및 모델에 대한 내부 테스트 세트보다 높은 점수를받습니다. 모든 MAE 및 RMSE는 표 1 및도 1에 나와 있습니다.
기존 및 데이터 마이닝 회귀 모델의 Mae 및 Rmse. 평균 절대 오차 MAE, 루트 평균 제곱 오차 RMSE, 단일 레이어 퍼셉트론 SLP, 다층 퍼셉트론 MLP, 전통적인 CM 방법.
기존 및 DM 모델의 분류 성능 (18 년 컷오프)은 민감도, 특이성, PPV (Positive Predictive Value), NPV (Negative Predictive Value) 및 수신기 작동 특성 곡선 (AUROC)의 면적 측면에서 입증되었습니다. 27 (표 2, 그림 2 및 보충 그림 1 온라인). 내부 테스트 배터리의 민감도 측면에서, 전통적인 방법은 남성들 사이에서 가장 잘 수행되었으며 여성들에게는 더 나빴습니다. 그러나 전통적인 방법과 SD 간의 분류 성능 차이는 남성 (MLP)의 9.7%, 여성의 경우 2.4%에 불과합니다 (XGBOOST). DM 모델 중에서, 로지스틱 회귀 (LR)는 두 남녀 모두에서 더 나은 감도를 보여 주었다. 내부 테스트 세트의 특이성과 관련하여, 4 개의 SD 모델은 남성에서 잘 작동하는 반면, 전통적인 모델은 여성에서 더 잘 수행 된 것으로 관찰되었습니다. 남성 및 여성의 분류 성능 차이는 각각 13.3% (MLP) 및 13.1% (MLP)이며, 모델 간 분류 성능의 차이가 감도를 초과 함을 나타냅니다. DM 모델 중에서 SVM (Support Vector Machine), 의사 결정 트리 (DT) 및 RF (Random Forest) 모델은 남성 중에서 가장 잘 수행되었으며 LR 모델은 여성 중에서 가장 잘 수행되었습니다. 전통적인 모델과 모든 SD 모델의 AUROC는 남성의 0.925 (K-Nearest Neighbor (KNN)보다 크며 18 세의 샘플을 판별하는 데있어 우수한 분류 성능을 보여줍니다. 외부 테스트 세트의 경우 내부 테스트 세트와 비교하여 감도, 특이성 및 AUROC 측면에서 분류 성능이 감소했습니다. 또한, 최고 및 최악의 모델의 분류 성능 간의 민감도와 특이성의 차이는 10%에서 25% 사이였으며 내부 테스트 세트의 차이보다 컸습니다.
데이터 마이닝 분류 모델의 감도 및 특이성 18 년 컷오프의 전통적인 방법과 비교했습니다. Knn K 가장 가까운 이웃, SVM 지원 벡터 머신, LR 로지스틱 회귀, DT 의사 결정 트리, RF 랜덤 포레스트, XGB XGBOOST, MLP 다층 퍼셉트론, 전통적인 CM 방법.
이 연구의 첫 번째 단계는 7 개의 DM 모델에서 얻은 치과 연령 추정치의 정확도를 전통적인 회귀를 사용하여 얻은 것과 비교하는 것이 었습니다. MAE와 RMSE는 남녀 모두에 대한 내부 테스트 세트에서 평가되었으며, 전통적인 방법과 DM 모델의 차이는 MAE의 경우 44 ~ 77 일, RMSE의 경우 62 ~ 88 일이었습니다. 이 연구에서 전통적인 방법은 약간 더 정확했지만, 그러한 작은 차이가 임상 적 또는 실질적인 중요성을 가지고 있는지 결론을 내리는 것은 어렵다. 이 결과는 DM 모델을 사용한 치과 연령 추정의 정확도가 전통적인 방법의 정확도와 거의 동일하다는 것을 나타냅니다. 이 연구에서와 동일한 연령대에서 치아를 기록하는 동일한 기술을 사용하여 DM 모델의 정확성을 전통적인 통계 방법과 비교하지 않았기 때문에 이전 연구의 결과와 직접 비교하는 것은 어렵습니다. Galibourg et al24는 2 ~ 24 세의 프랑스 인구에서 두 가지 전통적인 방법 (Demirjian Method25 및 Willems Method29)과 10 개의 DM 모델을 비교했습니다. 그들은 모든 DM 모델이 전통적인 방법보다 더 정확하다고보고했으며, MAE에서 0.20과 0.38 년, Willems 및 Demirdjian 방법에 비해 RMSE에서 각각 0.25 및 0.47 년의 차이가 있다고보고했습니다. Halibourg 연구에 나와있는 SD 모델과 전통적인 방법 사이의 불일치는 Demirdjian 방법이 연구에 근거한 프랑스 캐나다인 이외의 인구의 치과 연령을 정확하게 추정하지 못한다는 수많은 보고서를 고려합니다. 이 연구에서. Tai et al 34는 MLP 알고리즘을 사용하여 1636 년 중국 치열 교정 사진에서 치아 나이를 예측하고 정확도를 Demirjian 및 Willems 방법의 결과와 비교했습니다. 그들은 MLP가 전통적인 방법보다 정확도가 높다고보고했다. Demirdjian 방법과 전통적인 방법의 차이는 <0.32 년이며 Willems 방법은 0.28 년이며, 이는 본 연구의 결과와 유사합니다. 이러한 이전 연구의 결과 24,34는 또한 본 연구의 결과와 일치하며 DM 모델의 연령 추정 정확도와 전통적인 방법은 유사하다. 그러나 제시된 결과를 바탕으로, 나이를 추정하기 위해 DM 모델을 사용하면 비교 및 기준 이전 연구가 없기 때문에 기존 방법을 대체 할 수 있다고 조심스럽게 결론을 내릴 수 있습니다. 이 연구에서 얻은 결과를 확인하기 위해 더 큰 샘플을 사용한 후속 연구가 필요합니다.
치과 연령 추정에서 SD의 정확도를 테스트하는 연구 중 일부는 우리 연구보다 정확도가 높았습니다. Stepanovsky et al 35는 22 세에서 20.5 세 사이의 976 체코 거주자의 파노라마 방사선 사진에 22 개의 SD 모델을 적용했으며 각 모델의 정확도를 테스트했습니다. 그들은 Moorrees et al 36이 제안한 분류 기준을 사용하여 총 16 개의 상단 및 하단 왼쪽 영구 치아의 개발을 평가했습니다. MAE는 0.64 ~ 0.94 년이며 RMSE는 0.85 ~ 1.27 년이며,이 연구에 사용 된 두 DM 모델보다 정확합니다. Shen et al23은 Cameriere 방법을 사용하여 5 ~ 13 세의 동부 중국 거주자의 왼쪽 하악골에서 7 개의 영구 치아의 치과 연령을 추정하고 선형 회귀, SVM 및 RF를 사용하여 추정되는 연령과 비교했습니다. 그들은 세 가지 DM 모델 모두 기존 카메리 에어 공식에 비해 정확도가 높다는 것을 보여주었습니다. Shen의 연구에서 MAE와 RMSE는이 연구의 DM 모델보다 낮았습니다. Stepanovsky et al. 35 및 Shen et al. 23은 연구 샘플에 젊은 대상체가 포함되어 있기 때문일 수 있습니다. 치아 발달 중에 치아의 수가 증가함에 따라 치아 발달 참가자의 연령 추정치가 더 정확 해지므로, 연구 참가자가 더 젊을 때 결과 연령 추정 방법의 정확도가 손상 될 수 있습니다. 또한, 연령 추정에서 MLP의 오류는 SLP보다 약간 작으므로 MLP는 SLP보다 정확합니다. MLP는 MLP38의 숨겨진 층으로 인해 연령 추정에 대해 약간 더 나은 것으로 간주됩니다. 그러나 여성의 외부 샘플에 대한 예외가 있습니다 (SLP 1.45, MLP 1.49). MLP가 연령을 평가할 때 SLP보다 더 정확하다는 발견에는 추가 후 향적 연구가 필요합니다.
18 년 임계 값에서 DM 모델의 분류 성능과 전통적인 방법도 비교되었습니다. 내부 테스트 세트의 모든 테스트 된 SD 모델과 전통적인 방법은 18 세의 샘플에 대해 실제로 허용되는 차별 수준을 보여주었습니다. 남성과 여성의 민감도는 각각 87.7%와 94.9%를 초과했으며 특이성은 89.3%와 84.7%보다 컸습니다. 모든 테스트 된 모델의 AUROC도 0.925를 초과합니다. 우리가 아는 한, 치과 성숙도에 따라 18 년 분류에 대한 DM 모델의 성능을 테스트 한 연구는 없습니다. 우리는이 연구 결과를 파노라마 방사선 사진에서 딥 러닝 모델의 분류 성능과 비교할 수 있습니다. Guo et al.15는 특정 연령 임계 값에 대한 Demirjian의 방법을 기반으로 CNN 기반 딥 러닝 모델의 분류 성능을 계산했습니다. 수동 방법의 민감도와 특이성은 각각 87.7%와 95.5%였으며 CNN 모델의 민감도와 특이성은 각각 89.2% 및 86.6%를 초과했습니다. 그들은 딥 러닝 모델이 연령 임계 값을 분류 할 때 수동 평가를 대체하거나 능가 할 수 있다고 결론 지었다. 이 연구의 결과는 유사한 분류 성능을 보여 주었다. DM 모델을 사용한 분류는 연령 추정을위한 기존의 통계적 방법을 대체 할 수 있다고 믿어집니다. 모델 중에서 DM LR은 수컷 샘플의 감도와 여성 샘플의 감도 및 특이성 측면에서 최고의 모델이었습니다. LR은 남성의 특이성에서 2 위를 차지합니다. 또한 LR은보다 사용자 친화적 인 DM35 모델 중 하나로 간주되며 덜 복잡하고 처리가 어렵습니다. 이러한 결과를 바탕으로 LR은 한국 인구에서 18 세의 가장 좋은 컷오프 분류 모델로 간주되었습니다.
전반적으로, 외부 테스트 세트에서 연령 추정 또는 분류 성능의 정확도는 내부 테스트 세트의 결과에 비해 열악하거나 낮았습니다. 일부 보고서에 따르면 한국 인구에 기반한 연령 추정치가 일본 인구에 적용될 때 분류 정확도 또는 효율성이 감소하고 현재의 연구에서 유사한 패턴이 발견되었습니다. 이 열화 경향은 DM 모델에서도 관찰되었습니다. 따라서, 분석 프로세스에서 DM을 사용하더라도 연령을 정확하게 추정하기 위해서는 기존의 방법과 같은 고유 인구 데이터에서 파생 된 방법이 5,39,40,41,42를 선호해야합니다. 딥 러닝 모델이 유사한 경향을 보여줄 수 있는지 여부는 확실하지 않기 때문에, 인공 지능이 제한된 연령의 이러한 인종적 불일치를 극복 할 수 있는지 확인하기 위해 동일한 샘플의 전통적인 방법, DM 모델 및 딥 러닝 모델을 사용하여 분류 정확도와 효율성을 비교하는 연구가 필요합니다. 평가.
우리는 전통적인 방법이 한국의 법의학 연령 추정 관행에서 DM 모델을 기반으로 연령 추정으로 대체 될 수 있음을 보여줍니다. 또한 법의학 연령 평가를위한 기계 학습을 구현할 가능성을 발견했습니다. 그러나 결과를 결정적으로 결정하기 위해이 연구에 불충분 한 수의 참가자와 같은 명확한 한계가 있으며,이 연구의 결과를 비교하고 확인하기위한 이전 연구가 부족합니다. 앞으로 DM 연구는 전통적인 방법에 비해 실용성을 향상시키기 위해 더 많은 수의 샘플과 더 다양한 인구로 수행되어야합니다. 인공 지능을 사용하여 여러 인구에서 연령을 추정 할 수있는 타당성을 검증하려면 DM 및 딥 러닝 모델의 분류 정확도와 효율성을 동일한 샘플의 전통적인 방법과 비교하기위한 미래의 연구가 필요합니다.
이 연구는 15 세에서 23 세 사이의 한국과 일본 성인에서 수집 한 2,657 개의 직교 사진을 사용했습니다. 한국 방사선 사진은 900 개의 훈련 세트 (19.42 ± 2.65 년)와 900 개의 내부 테스트 세트 (19.52 ± 2.59 년)로 나뉩니다. 교육 세트는 한 기관 (서울 세인트 메리 병원)에서 수집되었으며, 자체 시험 세트는 두 기관 (서울 대학교 치과 병원 및 연성 대학 치과 병원)에서 수집되었습니다. 또한 외부 테스트를 위해 다른 인구 기반 데이터 (Iwate Medical University, Japan)에서 857 개의 방사선 사진을 수집했습니다. 일본 대상의 방사선 사진 (19.31 ± 2.60 년)이 외부 테스트 세트로 선택되었습니다. 치과 치료 중에 촬영 한 탁자 방사선 사진에 대한 치과 발달 단계를 분석하기 위해 후 향적으로 데이터를 수집 하였다. 수집 된 모든 데이터는 성별, 생년월일 및 방사선 사진 날짜를 제외하고 익명이었습니다. 포함 및 제외 기준은 이전에 발표 된 연구 4, 5와 동일했습니다. 샘플의 실제 연령은 방사선 사진을 찍은 날로부터 생년월일을 빼서 계산되었습니다. 샘플 그룹은 9 명의 연령 그룹으로 나뉘 었습니다. 나이와 성별 분포는 표 3에 나와 있습니다.이 연구는 헬싱키 선언에 따라 수행되었으며 가톨릭 대학교 (KC22WISI0328)의 서울 세인트 메리 병원의 기관 검토위원회 (IRB)에 의해 승인되었습니다. 이 연구의 후 향적 설계로 인해 치료 목적으로 방사선 학적 검사를받는 모든 환자로부터 사전 동의를 얻을 수 없었습니다. 서울 한국 대학교 세인트 메리 병원 (IRB)은 사전 동의에 대한 요구 사항을 면제했다.
bimaxillary 2 차 및 3 차 어금니의 발달 단계는 demircan criteria25에 따라 평가되었다. 각 턱의 왼쪽과 오른쪽에 동일한 유형의 치아가 발견되면 하나의 치아 만 선택되었습니다. 양쪽의 상 동성이 발달 단계에있는 경우, 발달 단계가 낮은 치아가 추정 된 연령의 불확실성을 설명하기 위해 선택되었습니다. 훈련 세트에서 무작위로 선택된 방사선 사진은 2 명의 숙련 된 관찰자에 의해 점수를 매기고 사전 보석화 후 치과 성숙 단계를 결정하기 위해 interobserver 신뢰성을 테스트했습니다. 일차 관찰자에 의해 3 개월 간격으로 두 번의 관찰자 신뢰도를 평가 하였다.
훈련 세트에서 각 턱의 두 번째 및 세 번째 어금니의 성별 및 발달 단계는 다른 DM 모델로 훈련 된 1 차 관찰자에 의해 추정되었으며 실제 연령은 목표 값으로 설정되었습니다. 기계 학습에 널리 사용되는 SLP 및 MLP 모델은 회귀 알고리즘에 대해 테스트되었습니다. DM 모델은 4 개의 치아의 발달 단계를 사용하여 선형 함수를 결합하고 이러한 데이터를 결합하여 연령을 추정합니다. SLP는 가장 간단한 신경망이며 숨겨진 층을 포함하지 않습니다. SLP는 노드 간의 임계 값 전송을 기반으로 작동합니다. 회귀의 SLP 모델은 다중 선형 회귀와 수학적으로 유사합니다. SLP 모델과 달리 MLP 모델에는 비선형 활성화 기능이있는 여러 개의 숨겨진 층이 있습니다. 우리의 실험은 비선형 활성화 기능을 갖는 20 개의 숨겨진 노드만으로 숨겨진 층을 사용했습니다. 최적화 방법으로 기울기 하강을 사용하고 기계 학습 모델을 훈련시키기위한 손실 기능으로 MAE 및 RMSE를 사용하십시오. 가장 잘 획득 된 회귀 모델은 내부 및 외부 테스트 세트에 적용되었으며 치아의 나이가 추정되었습니다.
샘플이 18 세인지 여부를 예측하기 위해 훈련 세트에서 4 개의 톱니의 성숙도를 사용하는 분류 알고리즘이 개발되었습니다. 모델을 구축하기 위해, 우리는 7 개의 표현 머신 러닝 알고리즘 6,43 : (1) LR, (2) KNN, (3) SVM, (4) DT, (5) RF, (6) 및 (7) MLP를 도출했습니다. . LR은 가장 널리 사용되는 분류 알고리즘 중 하나입니다. 회귀 분석을 사용하여 특정 범주에 속하는 데이터의 확률을 0에서 1까지 예측 하고이 확률에 따라 데이터를 더 가능성이 높은 범주에 속하는 것으로 분류하는 감독 된 학습 알고리즘입니다. 주로 이진 분류에 사용됩니다. KNN은 가장 간단한 기계 학습 알고리즘 중 하나입니다. 새 입력 데이터가 주어지면 K 데이터가 기존 세트에 가깝게 찾은 다음 가장 높은 주파수로 클래스로 분류합니다. 우리는 고려 된 이웃의 수에 대해 3을 설정했습니다 (k). SVM은 커널 함수를 사용하여 선형 공간을 Fields46이라는 비선형 공간으로 확장하여 두 클래스 사이의 거리를 최대화하는 알고리즘입니다. 이 모델의 경우 다항식 커널의 과복 마취제로서 바이어스 = 1, power = 1 및 gamma = 1을 사용합니다. DT는 트리 구조에서 결정 규칙을 나타내어 여러 하위 그룹으로 전체 데이터 세트를 나누기위한 알고리즘으로 다양한 필드에 적용되었습니다 47. 이 모델은 2 노드 당 최소 레코드 수로 구성되며 GINI 인덱스를 품질 측정으로 사용합니다. RF는 여러 DTS를 결합하여 원래 DataSET48에서 동일한 크기의 샘플을 무작위로 도출함으로써 각 샘플에 대해 약한 분류기를 생성하는 부트 스트랩 집계 방법을 사용하여 성능을 향상시키는 앙상블 방법입니다. 우리는 100 개의 트리, 10 개의 트리 깊이, 1 개의 최소 노드 크기 및 Gini Admixture Index를 노드 분리 기준으로 사용했습니다. 새로운 데이터의 분류는 다수의 투표에 의해 결정됩니다. Xgboost는 교육 데이터를 사용하여 이전 모델의 실제 값과 예측 된 값 사이의 오류를 사용하여 Gradients 49를 사용하여 오류를 증대시키는 방법을 사용하여 부스팅 기술을 결합한 알고리즘입니다. 성능이 우수하고 리소스 효율성이 우수하고 과적으로 적합한 보정 기능으로서 높은 신뢰성으로 인해 널리 사용되는 알고리즘입니다. 이 모델에는 400 개의 지지대가 장착되어 있습니다. MLP는 하나 이상의 퍼셉트론이 입력 및 출력 계층 사이에 하나 이상의 숨겨진 계층을 갖는 다중 층을 형성하는 신경망이다. 이를 사용하면 입력 계층을 추가하고 결과 값을 얻을 때 예측 된 결과 값이 실제 결과 값과 비교되고 오류가 전파됩니다. 우리는 각 층에 20 개의 숨겨진 뉴런이있는 숨겨진 층을 만들었습니다. 우리가 개발 한 각 모델은 감도, 특이성, PPV, NPV 및 Auroc를 계산하여 분류 성능을 테스트하기 위해 내부 및 외부 세트에 적용되었습니다. 민감도는 18 세 이상으로 추정되는 샘플의 비율로 18 세 이상으로 추정됩니다. 특이성은 18 세 미만의 샘플의 비율이며 18 세 미만으로 추정됩니다.
훈련 세트에서 평가 된 치과 단계는 통계 분석을 위해 수치 단계로 전환되었습니다. 다변량 선형 및 로지스틱 회귀 분석을 수행하여 각 성별에 대한 예측 모델을 개발하고 연령을 추정하는 데 사용할 수있는 회귀 공식을 도출했습니다. 우리는 이러한 공식을 사용하여 내부 및 외부 테스트 세트 모두에 대한 치아 나이를 추정했습니다. 표 4는이 연구에 사용 된 회귀 및 분류 모델을 보여줍니다.
Cohen 's Kappa 통계를 사용하여 내부 및 관측자 신뢰도를 계산했습니다. DM 및 기존 회귀 모델의 정확도를 테스트하기 위해 내부 및 외부 테스트 세트의 예상 및 실제 연령을 사용하여 MAE 및 RMSE를 계산했습니다. 이러한 오류는 일반적으로 모델 예측의 정확도를 평가하는 데 사용됩니다. 오류가 작을수록 예측 정확도가 높아집니다 24. DM 및 기존 회귀를 사용하여 계산 된 내부 및 외부 테스트 세트의 MAE 및 RMSE를 비교하십시오. 전통적인 통계에서 18 년 컷오프의 분류 성능은 2 × 2 우발성 테이블을 사용하여 평가되었습니다. 시험 세트의 계산 된 감도, 특이성, PPV, NPV 및 AUROC를 DM 분류 모델의 측정 된 값과 비교 하였다. 데이터는 데이터 특성에 따라 평균 ± 표준 편차 또는 숫자 (%)로 표시됩니다. 양측 p 값 <0.05는 통계적으로 유의 한 것으로 간주되었다. 모든 일상적인 통계 분석은 SAS 버전 9.4 (SAS Institute, Cary, NC)를 사용하여 수행되었습니다. DM 회귀 모델은 수학 연산을 위해 특별히 Keras50 2.4 백엔드 및 Tensorflow51 1.8.0을 사용하여 Python에서 구현되었습니다. DM 분류 모델은 Waikato 지식 분석 환경과 Konstanz Information Miner (KNIM) 4.6.152 분석 플랫폼에서 구현되었습니다.
저자는 연구의 결론을 뒷받침하는 데이터가 기사 및 보충 자료에서 찾을 수 있음을 인정합니다. 연구 중에 생성 및/또는 분석 된 데이터 세트는 합리적인 요청에 따라 해당 저자로부터 제공됩니다.
Ritz-Timme, S. et al. 연령 평가 : 법의학 실습의 특정 요구 사항을 충족시키기위한 최신 기술. 국제성. J. 법 의학. 113, 129–136 (2000).
Schmeling, A., Reisinger, W., Geserik, G. 및 Olze, A. 형사 기소 목적으로 살아있는 피험자의 법의학 연령 평가의 현재 상태. 법의학. 약. 병리학. 1, 239–246 (2005).
Pan, J. et al. 중국 동부에서 5 세에서 16 세 사이의 어린이의 치과 연령을 평가하기위한 수정 된 방법. 객관적인. 구강 조사. 25, 3463–3474 (2021).
Lee, SS 등 한국에서 제 2 및 세 번째 어금니 발달의 연대기 및 법의학 연령 평가를위한 적용. 국제성. J. 법 의학. 124, 659–665 (2010).
Oh, S., Kumagai, A., Kim, Sy 및 Lee, SS 연령 추정의 정확도 및 한국인과 일본어의 두 번째 및 세 번째 어금니의 성숙도에 따른 18 년 임계 값의 추정. PLOS ONE 17, E0271247 (2022).
Kim, Jy, et al. 수술 전 기계 학습 기반 데이터 분석은 OSA 환자의 수면 수술 치료 결과를 예측할 수 있습니다. 과학. 보고서 11, 14911 (2021).
Han, M. et al. 인간의 개입 유무에 관계없이 기계 학습으로 인한 정확한 연령 추정? 국제성. J. 법 의학. 136, 821–831 (2022).
Khan, S. 및 Shaheen, M. 데이터 마이닝에서 데이터 마이닝까지. J.Information. 과학. https://doi.org/10.1177/01655515211030872 (2021).
Khan, S. and Shaheen, M. Wisrule : 연관 규칙 마이닝을위한 최초의인지 알고리즘. J.Information. 과학. https://doi.org/10.1177/01655515221108695 (2022).
Shaheen M. 및 Abdullah U. Karm : 상황 기반 협회 규칙을 기반으로 한 전통적인 데이터 마이닝. 믿다. 매트. 계속하다. 68, 3305–3322 (2021).
Muhammad M., Rehman Z., Shaheen M., Khan M. 및 Habib M. 텍스트 데이터를 사용한 딥 러닝 기반 시맨틱 유사성 탐지. 알리다. 기술. 제어. https://doi.org/10.5755/j01.itc.49.4.27118 (2020).
Tabish, M., Tanoli, Z. 및 Shahin, M. 스포츠 비디오에서 활동을 인식하는 시스템. 멀티미디어. 도구 응용 프로그램 https://doi.org/10.1007/S11042-021-10519-6 (2021).
Halabi, Ss et al. 소아 뼈 시대의 RSNA 머신 러닝 챌린지. 방사선학 290, 498–503 (2019).
Li, Y. et al. 딥 러닝을 사용한 골반 엑스레이의 법의학 연령 추정. 유로. 방사. 29, 2322–2329 (2019).
Guo, YC 등 수동 방법과 직교 투영 이미지의 깊은 컨볼 루션 신경 네트워크를 사용한 정확한 연령 분류. 국제성. J. 법 의학. 135, 1589–1597 (2021).
앨라배마 Dalora et al. 다른 기계 학습 방법을 사용한 뼈 연령 추정 : 체계적인 문헌 검토 및 메타 분석. PLOS ONE 14, E0220242 (2019).
Du, H., Li, G., Cheng, K. 및 Yang, J. Cone-Beam 컴퓨터 단층 촬영을 사용한 첫 번째 어금니의 펄프 챔버 부피를 기반으로 아프리카 계 미국인 및 중국의 인구 별 연령 추정. 국제성. J. 법 의학. 136, 811–819 (2022).
Kim S., Lee YH, Noh YK, Park FK 및 OH KS는 인공 지능 기반 이미지를 사용하여 살아있는 사람들의 연령 그룹을 결정합니다. 과학. 보고서 11, 1073 (2021).
Stern, D., Payer, C., Giuliani, N. 및 Urschler, M. 다변량 MRI 데이터의 자동 연령 추정 및 다수 연령 분류. IEEE J. BIOMED. 건강 경고. 23, 1392–1403 (2019).
Cheng, Q., Ge, Z., Du, H. 및 Li, G. 딥 러닝 및 레벨 세트를 통합하여 원뿔 빔 컴퓨터 단층 촬영에서 제 1 어금니의 3D 펄프 챔버 세분화를 기반으로 한 연령 추정. 국제성. J. 법 의학. 135, 365–373 (2021).
Wu, WT, et al. 임상 빅 데이터의 데이터 마이닝 : 공통 데이터베이스, 단계 및 방법 모델. 세계. 약. 의지. 8, 44 (2021).
Yang, J. et al. 빅 데이터 시대의 의료 데이터베이스 및 데이터 마이닝 기술 소개. J. Avid. 기본 의학. 13, 57–69 (2020).
Shen, S. et al. 기계 학습을 사용하여 치아 나이를 추정하는 카메라의 방법. BMC 구강 건강 21, 641 (2021).
Galliburg A. et al. Demirdjian 스테이징 방법을 사용하여 치과 연령을 예측하기위한 다양한 기계 학습 방법의 비교. 국제성. J. 법 의학. 135, 665–675 (2021).
Demirdjian, A., Goldstein, H. 및 Tanner, JM 치과 연령을 평가하기위한 새로운 시스템. 흡입. 생물학. 45, 211–227 (1973).
Landis, Jr 및 Koch, 범주 데이터에 대한 관찰자 계약의 GG 측정. 생체 인식 33, 159–174 (1977).
Bhattacharjee S, Prakash D, Kim C, Kim HK 및 Choi HK. 1 차 뇌종양의 분화를위한 인공 지능 기술을 사용한 2 차원 자기 공명 영상의 조직, 형태 학적 및 통계 분석. 건강 정보. 의지. https://doi.org/10.4258/hir.2022.28.1.46 (2022).

시간 후 : 1 월 -04-2024

한국 청소년과 청년들 사이에서 전통적인 치과 연령 추정 방법에 대한 데이터 마이닝 모델 검증