KR101824691B1 - Method for differentiation of fat-poor angiomyolipoma from clear cell renal cell carcinoma in contrast-enhanced mdct images using quantitative feature classification - Google Patents
Method for differentiation of fat-poor angiomyolipoma from clear cell renal cell carcinoma in contrast-enhanced mdct images using quantitative feature classification Download PDFInfo
- Publication number
- KR101824691B1 KR101824691B1 KR1020170002050A KR20170002050A KR101824691B1 KR 101824691 B1 KR101824691 B1 KR 101824691B1 KR 1020170002050 A KR1020170002050 A KR 1020170002050A KR 20170002050 A KR20170002050 A KR 20170002050A KR 101824691 B1 KR101824691 B1 KR 101824691B1
- Authority
- KR
- South Korea
- Prior art keywords
- features
- classification
- feature
- cell carcinoma
- renal cell
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/30—Determination of transform parameters for the alignment of images, i.e. image registration
- G06T7/33—Determination of transform parameters for the alignment of images, i.e. image registration using feature-based methods
- G06T7/337—Determination of transform parameters for the alignment of images, i.e. image registration using feature-based methods involving reference images or patches
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B6/00—Apparatus or devices for radiation diagnosis; Apparatus or devices for radiation diagnosis combined with radiation therapy equipment
- A61B6/02—Arrangements for diagnosis sequentially in different planes; Stereoscopic radiation diagnosis
- A61B6/03—Computed tomography [CT]
-
- G06N99/005—
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/40—Image enhancement or restoration using histogram techniques
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/11—Region-based segmentation
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/40—Analysis of texture
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/90—Determination of colour characteristics
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10072—Tomographic images
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Medical Informatics (AREA)
- Radiology & Medical Imaging (AREA)
- Animal Behavior & Ethology (AREA)
- Optics & Photonics (AREA)
- Biomedical Technology (AREA)
- Heart & Thoracic Surgery (AREA)
- Molecular Biology (AREA)
- Surgery (AREA)
- Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Public Health (AREA)
- Veterinary Medicine (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- High Energy & Nuclear Physics (AREA)
- Biophysics (AREA)
- Image Analysis (AREA)
Abstract
본 발명의 일 실시예에 의한 조영 증강된 다중검출 컴퓨터 단층 촬영 영상에서 정량적 특징 분류를 사용하여 지방이 적은 혈관근지방종과 투명세포 신세포암을 구별하기 위한 방법은, (a) 복수의 조영 증강된 다중검출 컴퓨터 단층 촬영(MDCT) 트레이닝 영상들에서 분리된 신장 종양 영역으로부터 히스토그램 특징들, 밝기값 백분율 특징들, 및 질감 특징들을 추출하는 단계; (b) 상기 추출된 특징들을 복수의 특징 선택 방법과 복수의 기계 학습 기반의 분류 방법의 조합에 적용하여 최상의 분류 성능을 나타내는 특징들 및 분류 방법을 각각 최적의 분류 특징들 및 최적의 기계 학습 분류 방법으로서 선택하는 단계; (c) 상기 선택된 분류 특징들을 상기 선택된 기계 학습 분류 방법에 적용하여 분류 모델을 획득하는 단계; (d) 조영 증강된 다중검출 컴퓨터 단층 촬영 테스트 영상에서 분리된 신장 종양 영역으로부터 상기 최적의 분류 특징들을 추출하는 단계; 및 (e) 상기 추출된 최적의 분류 특징들을 상기 분류 모델에 적용하여 지방이 적은 혈관근지방종(fp-AML)과 투명세포 신세포암(ccRCC)을 구별하는 단계를 포함한다.A method for distinguishing an aneurysmal lipoma and a clear cell renal cell cancer using quantitative feature classification in a contrast enhanced multi-detector computed tomography image according to an embodiment of the present invention includes: (a) Extracting histogram features, brightness value percent features, and texture features from the isolated kidney tumor region in multi-detected computed tomography (MDCT) training images; (b) applying the extracted features to a combination of a plurality of feature selection methods and a plurality of machine learning-based classification methods to classify features and classification methods that exhibit the best classification performance as optimal classification features and optimal machine learning classification Selecting as a method; (c) applying the selected classification features to the selected machine learning classification method to obtain a classification model; (d) extracting the optimal classification features from the isolated kidney tumor region in a contrast enhanced multi-detector computed tomography test image; And (e) applying the extracted best-fit classification features to the classification model to distinguish between low-fat, angiomatous lipoma (fp-AML) and clear cell renal cell carcinoma (ccRCC).
Description
본 발명은 조영 증강된 다중검출 컴퓨터 단층 촬영(CE MDCT: contrast-enhanced multi-detector computer tomography) 영상에서 정량적 특징 분류를 사용하여 지방이 적은 혈관근지방종과 투명세포 신세포암을 구별하기 위한 방법에 관한 것이다.The present invention relates to a method for distinguishing between low-fat, angiomatous lipoma and clear cell renal cell carcinoma using quantitative feature classification in contrast-enhanced multi-detector computer tomography (CE) MDMT .
신세포암(RCC: renal cell carcinoma)은 전 세계적으로 9번째로 가장 널리 퍼진 암이고, 이 암의 진단은 컴퓨터 단층 촬영(CT: computational tomography)을 사용하는 진단이 증가하면서 증가하고 있다. 측면 통증, 측면 종양 및 혈뇨를 포함하는, RCC의 고전적인 증상에도 불구하고, 대부분의 종양들은 CT와 초음파 이미징의 발전 때문에 증상 없이 우연히 발견된다. 더욱이, RCC 케이스의 85%는 직경이 4㎝ 미만인 증상이 없는 종양으로서 보고되었다. 직경이 4㎝ 미만인 신장 종양으로 지칭되는, 이들 작은 신장 종양(SRM: small renal masses)에 있어서, 20% 내지 40%는 혈관근지방종(AML: angiomyolipoma)을 포함하는, 양성 타입의 종양인 것으로 알려져 왔다. 따라서, 불필요한 수술을 회피하기 위하여 수술 전 악성 SRM과 양성 SRM을 구별하는 것이 제안되어왔다. 일반적으로, AML의 대부분의 케이스는 CT 영상에서 보이는 지방의 존재에 의해 RCC와 시각적으로 구별될 수 있다. 하지만, 이러한 육안으로 보이는 지방은 AML 케이스의 약 5%에서 CT 영상에서 가시적이지 않다. 따라서, 지방이 적은 AML(fp-AML)으로 지칭되는, 이러한 서브-타입의 AML은, 도 1에 도시된 바와 같이, 정상적인 신장 실질과 비교하여 균질성 및 극도로 밀집한 특성 양자를 나타내기 때문에, 두 가지 조건 사이에서 시각적인 유사도로 인하여 RCC와 구별하기가 어렵다.Renal cell carcinoma (RCC) is the 9th most prevalent cancer in the world. Diagnosis of this cancer is increasing with increasing diagnosis using computational tomography (CT). Despite the classic symptoms of RCC, including side pain, lateral tumors and hematuria, most tumors are found incidentally without symptoms due to the development of CT and ultrasound imaging. Furthermore, 85% of the RCC cases have been reported as unsympathetic tumors of less than 4 cm in diameter. In these small renal masses (SRM), referred to as renal tumors of less than 4 cm in diameter, 20% to 40% are known to be benign type tumors, including angiomyolipoma (AML) come. Therefore, it has been proposed to distinguish between malignant SRM and benign SRM before surgery to avoid unnecessary surgery. In general, most cases of AML can be visually distinguished from RCC by the presence of visible fat in CT images. However, this visible fat is not visible in CT images in about 5% of AML cases. Thus, this sub-type of AML, referred to as low fat AML (fp-AML), exhibits both homogeneous and extremely dense characteristics compared to normal kidney parenchyma, as shown in Figure 1, It is difficult to distinguish it from RCC because of the visual similarity between branch conditions.
신장 CT 영상에서 fp-AML과 RCC를 구별하기 위하여 다수의 접근법들이 조사되었다. 조사자들은 조영 증강되지 않은 CT에서의 영상 특성이 두 가지 서브 유형의 종양을 더 정확하게 분류한다는 것을 고려하여 일반적으로 조영 증강되지 않은 CT 영상을 사용하였다. Chaudhry 등(Chaudhry et al.)은 통계 분석에 의하여 fp-AML과 투명세포 신세포암(ccRCC) 및 유두상 신세포암(pRCC)을 구별하기 위하여 조영 증강되지 않은 CT 영상으로부터 추출된 히스토그램 특징들의 잠재력을 조사하였다. Schieda 등(Schieda et al.)은 Fisher 정확 테스트로 fp-AML과 3가지 유형의 RCC를 분리하기 위하여 밀도 비(density ratios), 종양 석회화(mass calcification) 및 저음영 가장자리(hypodense rim)와 같은 영상 패턴들뿐만 아니라 성별과 나이와 같은 환자 정보를 포함하여, 다수의 특징들을 평가하였다. Hodgdon 등(Hodgdon et al.)은 조영 증강되지 않은 CT 영상에서 fp-AML과 RCC를 분류하기 위하여 명암도 동시발생 행렬(GLCM: gray-level co-occurrence matrices)과 명암도 연속거리 행렬(GLRLM: gray-level run-length matrices)에 기반하여 질감 특징들과 함께 히스토그램 평균 및 편차와 같은 히스토그램 특징들을 사용하여 서포트 벡터 머신(SVM: support vector machine) 분류기를 개발하였다.A number of approaches have been investigated to differentiate fp-AML and RCC from renal CT images. Investigators have used CT images that are not normally enhanced in view of the fact that image features on nonenhanced CT can more accurately classify the two subtypes of tumors. Chaudhry et al. (2003) used histogram features extracted from nonenhanced CT images to distinguish fp-AML from clear cell renal cell carcinoma (ccRCC) and papillary renal cell carcinoma (pRCC) by statistical analysis The potential was investigated. Schieda et al. (Schieda et al.) Used a Fisher exact test to identify imaging patterns such as density ratios, mass calcification, and hypodense rim to separate fp-AML and three types of RCCs. , As well as patient information such as sex and age. Hodgdon et al. (Hodgdon et al.) Used gray-level co-occurrence matrices (GLCM) and gray-scale continuous distance matrix (GLRLM) to classify fp-AML and RCC in non- level run-length matrices, we have developed a support vector machine (SVM) classifier using histogram features such as histogram mean and variance with texture features.
조영 증강되지 않은 CT 영상들이 위상 CT 영상들에 비해 두 가지 유형의 종양들을 구별하는데 사용될 때 이점을 가지고 있는 것으로 알려져 있을지라도, 대부분의 접근법들은 신장 종양을 분류하기 위하여 조영 증강되지 않은 CT 영상과 조영 증강된(CE) CT 영상 양자를 포함한다. Lee-Felker 등(Lee-Felker et al.)은 네 가지 유형의 위상 영상들, 즉 조영 증강되지 않은 위상, 피질수질 위상, 신장 조영 위상 및 배설 위상을 사용하여, RCC의 서브 유형을 분류하기 위하여 형태학적 특징과 증강 패턴(enhancement pattern)을 평가하였다. Sung 등(Sung et al.)은 조영 증강되지 않은 그리고 초기 배설 위상 CT의 카이-제곱(chi-square) 테스트를 통해 fp-AML과 RCC를 구별하기 위하여 둥근 정도(degree of roundness)와 캡슐의 존재를 포함하는 다수의 형태학적 특징들과 증강 패턴들을 평가하였다. Ishigami 등(Ishigami et al.)은 종양 감쇠 및 증강 패턴들을 사용하여 5가지 유형의 신장 종양들(fp-AML, ccRCC, pRCC, chRCC 및 호산성과립세포종(oncocytoma))을 특징화하기 위하여, CT의 3가지 위상, 즉 조영 증강되지 않은 위상, 피질수질 위상 및 지연된 위상을 사용하였다. Kim 등(Kim et al.)은 CT의 3가지 위상(조영 증강되지 않은 위상, 피질수질 위상 및 초기 배설 위상)의 증강 패턴들을 가지고 양측검정(two-tailed) t-테스트를 사용하여 fp-AML, ccRCC, pRCC 및 chRCC를 분류하였다. Xie 등(Xie et al.)은 워시-인(wash-in) 및 워시아웃(washout) 특성에 기반한 통계 분석을 사용하여 fp-AML과 ccRCC를 분리하기 위하여 CT의 4가지 위상(조영 중강되지 않은 위상, 피질수질 위상, 신장 조영 위상 및 지연된 위상)을 사용하였다. 다중-위상 영상들을 사용하는 것은 상이한 위상들의 영상들 간의 증강 패턴들과 같은 특징들의 확장된 선택을 포함하여, 특징-기반 분류에 이점을 제공한다. 하지만, 다중-위상 영상 분석은 또한 다수의 제한을 가지고 있다. 첫째, 상이한 위상들의 영상들 간에 증강 패턴들을 평가하기 위하여, 다양한 위상들의 영상들에서 동일한 종양의 복수의 수동 분할 및 다중-위상 영상들 간의 비강체 정합과 같은 시간 소모적인 프로세스들이 종양 영역들을 매칭하는데 요구된다. 더욱이, 대부분의 상기 연구들은 전문가에 의해 수동으로 기록된 정량적인 영상 특징들을 평가하였다. 예를 들어, 위치(외장성(exophytic), 실질내부(intra-parenchymal) 또는 내장성(endophytic)), 형상(둥근(round) 또는 둥글지 않은(non-round)), 증강 패턴(초기 워시아웃(early washout), 점진적(gradual) 또는 장기적인(prolonged)), 및 감쇠 유형(hype-, iso- 또는 hyper-attenuation)은 다중-선택 포맷으로 방사선 전문의에 의해 입력된 영상들에서 수동으로 평가되었다. 상기 정량적인 특징 평가 프로세스는 시간 소모적일 뿐만 아니라 관찰자간 변동성 및 관찰자내 변동성에 의해 제한된다. 최근에, Lee 등(Lee et al.)은 히스토그램 평균, 왜도(skewness), 엔트로피(entropy) 및 GLCM 질감 패턴들에 기반하여 단지 CE CT 영상들 및 정량적인 영상을 사용하여, 3개의 SRM 서브유형들(물혹(cyst), 지방-가시적인(fat-visible) AML, 및 ccRCC)을 분류하는 유망한 결과를 보여주었다.Although unenhanced CT images are known to have advantages when used to distinguish between two types of tumors compared to phase CT images, most approaches are based on CT images that are not enhanced, And augmented (CE) CT images. Lee-Felker et al. (Lee-Felker et al.) Used four types of phase images to classify subtypes of RCC using non-enhancement phase, cortical water phase, renal contrast phase, and excretory phase Morphological features and enhancement patterns were evaluated. Sung et al. Reported that the degree of roundness and the presence of capsules in order to differentiate fp-AML from RCC by chi-square testing of nonenhanced and early excretory phase CT ≪ / RTI > and morphological features and enhancement patterns were evaluated. Ishigami et al. (Ishigami et al.) Used CTLs to characterize five types of renal tumors (fp-AML, ccRCC, pRCC, chRCC and oncocytoma) using tumor attenuation and enhancement patterns , Which is a non-enhancement phase, a cortical water quality phase, and a delayed phase. Kim et al. Used a two-tailed t-test with the enhancement patterns of the three phases of CT (unenhanced phase, cortical water phase and initial excreted phase) , ccRCC, pRCC and chRCC. Xie et al. Used a statistical analysis based on wash-in and washout characteristics to compare the four phases of the CT (unenhanced) to the fc-AML and ccRCC Phase, cortical water quality, renal contrast, and delayed phase). Using multi-phase images, including extended selection of features such as enhancement patterns between images of different phases, provides an advantage in feature-based classification. However, multi-phase image analysis also has a number of limitations. First, in order to evaluate the enhancement patterns between images of different phases, time-consuming processes such as non-rigid matching between multiple passive segmentation and multi-phase images of the same tumor in images of various phases, Is required. Moreover, most of the above studies evaluated quantitative image features manually recorded by an expert. For example, the position (exophytic, intra-parenchymal or endophytic), shape (round or non-round), augmentation pattern (initial washout (early washout, gradual or prolonged), and damping type (hype-, iso- or hyper-attenuation) were manually evaluated in images entered by a radiologist in a multi-selection format. The quantitative feature evaluation process is not only time consuming but also limited by inter-observer variability and intra-observer variability. Recently, Lee et al. (2004) used CE CT images and quantitative images based on histogram mean, skewness, entropy, and GLCM texture patterns, Type (cyst, fat-visible AML, and ccRCC).
본 발명이 해결하고자 하는 과제는 조영 증강된 다중검출 컴퓨터 단층 촬영 영상에서 히스토그램 및 질감 패턴들에 대한 정량적인 분류를 사용하여 양성의 지방이 적은 혈관근지방종(fp-AML)과 악성 투명 세포 신세포암(ccRCC)을 구별할 수 있는, 조영 증강된 다중검출 컴퓨터 단층 촬영 영상에서 정량적 특징 분류를 사용하여 지방이 적은 혈관근지방종과 투명세포 신세포암을 구별하기 위한 방법을 제공하는 것이다.The present invention is directed to quantitative classification of histograms and texture patterns in contrast enhanced multi-detector computed tomography (CT) images to detect positive angiomatous lipoma (fp-AML) It is intended to provide a method for distinguishing between low-fat, angiomatous lipoma and clear cell renal cell carcinoma, using quantitative characterization in contrast enhanced multi-detector computed tomography images, which can distinguish cancer (ccRCC).
상기 과제를 해결하기 위한 본 발명의 일 실시예에 의한 조영 증강된 다중검출 컴퓨터 단층 촬영 영상에서 정량적 특징 분류를 사용하여 지방이 적은 혈관근지방종과 투명세포 신세포암을 구별하기 위한 방법은,According to an aspect of the present invention, there is provided a method for distinguishing an aneurysmal lipoma and a clear cell renal cell cancer using quantitative feature classification in a contrast enhanced multi-
(a) 복수의 조영 증강된 다중검출 컴퓨터 단층 촬영(MDCT) 트레이닝 영상들에서 분리된 신장 종양 영역으로부터 히스토그램 특징들, 밝기값 백분율 특징들, 및 질감 특징들을 추출하는 단계;(a) extracting histogram features, brightness value percentage features, and texture features from a separate kidney tumor region in a plurality of contrast enhanced multiple detection computerized tomography (MDCT) training images;
(b) 상기 추출된 특징들을 복수의 특징 선택 방법과 복수의 기계 학습 기반의 분류 방법의 조합에 적용하여 최상의 분류 성능을 나타내는 특징들 및 분류 방법을 각각 최적의 분류 특징들 및 최적의 기계 학습 분류 방법으로서 선택하는 단계;(b) applying the extracted features to a combination of a plurality of feature selection methods and a plurality of machine learning-based classification methods to classify features and classification methods that exhibit the best classification performance as optimal classification features and optimal machine learning classification Selecting as a method;
(c) 상기 선택된 분류 특징들을 상기 선택된 기계 학습 분류 방법에 적용하여 분류 모델을 획득하는 단계;(c) applying the selected classification features to the selected machine learning classification method to obtain a classification model;
(d) 조영 증강된 다중검출 컴퓨터 단층 촬영 테스트 영상에서 분리된 신장 종양 영역으로부터 상기 최적의 분류 특징들을 추출하는 단계; 및(d) extracting the optimal classification features from the isolated kidney tumor region in a contrast enhanced multi-detector computed tomography test image; And
(e) 상기 추출된 최적의 분류 특징들을 상기 분류 모델에 적용하여 지방이 적은 혈관근지방종(fp-AML)과 투명세포 신세포암(ccRCC)을 구별하는 단계를 포함한다.(e) applying the extracted best-fit classification features to the classification model to distinguish between low-fat aneurysmal lipoma (fp-AML) and clear cell renal cell carcinoma (ccRCC).
본 발명의 일 실시예에 의한 조영 증강된 다중검출 컴퓨터 단층 촬영 영상에서 정량적 특징 분류를 사용하여 지방이 적은 혈관근지방종을 투명세포 신세포암과 구별하기 위한 방법에 있어서, 상기 단계 (b)에서 상기 최적의 분류 특징들을 선택하는 단계는,A method for distinguishing an aneurysmal lipoma from a clear cell renal cell cancer using quantitative feature classification in a contrast enhanced multi-detection computed tomography image according to an embodiment of the present invention, Wherein the selecting the optimal classification features comprises:
(b-1) 곡선 아래 면적(AUC: area-under curve) 분석, ReliefF 특징 선택 방법 및 주 성분 분석(PCA: principal component analysis)에 따라 각각 20개의 특징들을 선택하는 단계; 및selecting 20 features according to an area-under curve (AUC) analysis, a ReliefF feature selection method, and a principal component analysis (PCA); And
(b-2) 상기 곡선 아래 면적(AUC: area-under curve) 분석에 의해 선택된 특징들과, 상기 ReliefF 특징 선택 방법에 의해 선택된 특징들 및 상기 주 성분 분석(PCA: principal component analysis)에 의해 선택된 특징들 중 공통적인 특징들을 상기 최적의 분류 특징들로서 선택하는 단계를 포함할 수 있다.(b-2) selecting features selected by the area-under curve analysis (AUC), features selected by the ReliefF feature selection method and selected by the principal component analysis (PCA) And selecting common features among the features as the optimal classification features.
또한, 본 발명의 일 실시예에 의한 조영 증강된 다중검출 컴퓨터 단층 촬영 영상에서 정량적 특징 분류를 사용하여 지방이 적은 혈관근지방종을 투명세포 신세포암과 구별하기 위한 방법에 있어서, 상기 최적의 분류 특징들은, 최대 밝기값, 190과 210의 임계값을 넘는 포지티브 픽셀들의 백분율, 75%와 95%의 백분위 밝기값, 및 GLCM 합 엔트로피(sum entropy)와 GLRLM 롱-런 엠퍼시스(long-run emphasis)를 포함할 수 있다.The present invention also provides a method for distinguishing an aneurysmal lipoma from a clear cell renal cell cancer using quantitative feature classification in a contrast enhanced multi-detection computed tomography image according to an embodiment of the present invention, Features include a maximum brightness value, a percentage of positive pixels above the threshold of 190 and 210, a percent brightness value of 75% and 95%, and a GLCM sum entropy and GLRLM long-run emphasis ).
또한, 본 발명의 일 실시예에 의한 조영 증강된 다중검출 컴퓨터 단층 촬영 영상에서 정량적 특징 분류를 사용하여 지방이 적은 혈관근지방종을 투명세포 신세포암과 구별하기 위한 방법에 있어서, 상기 최적의 기계 학습 기반의 분류 방법은, k-근접 이웃(kNN; k nearest neighbor) 분류 방법 또는 랜덤-포레스트(RF: random forest) 분류 방법을 포함할 수 있다.In addition, a method for distinguishing an aneurysmal lipoma from a clear cell renal cell cancer using quantitative feature classification in a contrast enhanced multi-detection computed tomography image according to an embodiment of the present invention, The learning-based classification method may include a kNN (k nearest neighbor) classification method or a random-forest (RF) classification method.
또한, 본 발명의 일 실시예에 의한 조영 증강된 다중검출 컴퓨터 단층 촬영 영상에서 정량적 특징 분류를 사용하여 지방이 적은 혈관근지방종을 투명세포 신세포암과 구별하기 위한 방법에 있어서, 상기 복수의 조영 증강된 다중검출 컴퓨터 단층 촬영(MDCT) 트레이닝 영상들은 지방이 적은 혈관근지방종(fp-AML)을 갖는 환자들로부터 획득된 트레이닝 영상들 및 투명세포 신세포암(ccRCC)을 갖는 환자들로부터 획득된 트레이닝 영상들을 포함할 수 있다. The present invention also provides a method for distinguishing an aneurysmal lipoma from a clear cell renal cell cancer using quantitative feature classification in a contrast enhanced multi-detection computed tomography image according to an embodiment of the present invention, Enhanced multiple-detection computed tomography (MDCT) training images were obtained from patients with clear-cell renal cell carcinoma (ccRCC) and training images obtained from patients with low-fat angioplasticoma (fp-AML) Training images.
본 발명의 일 실시예에 의한 조영 증강된 다중검출 컴퓨터 단층 촬영 영상에서 정량적 특징 분류를 사용하여 지방이 적은 혈관근지방종과 투명세포 신세포암을 구별하기 위한 방법에 의하면, 신장 조영 증강된 다중검출 컴퓨터 단층 촬영 영상에서 지방이 적은 혈관근지방종(fp-AML)과 투명세포 신세포암(ccRCC)의 히스토그램 및 질감 특징들을 분리하고, 추출된 최대 밝기값, 190과 210의 임계값을 넘는 포지티브 픽셀들의 백분율, 75%와 95%의 백분위 밝기값, 및 GLCM 합 엔트로피(sum entropy)와 GLRLM 롱-런 엠퍼시스(long-run emphasis)를 포함하는 7개의 특징들 및 기계 학습에 기반하여 지방이 적은 혈관근지방종과 투명세포 신세포암을 구별할 수 있다.According to one embodiment of the present invention, in a method for distinguishing an aneurysmal lipoma and a clear cell renal cell cancer from a fat-poor aneurysm using quantitative feature classification in an enhanced multi-detection CT image, The histogram and texture features of low-fat lipoangioma (fp-AML) and clear cell renal cell carcinoma (ccRCC) were separated on a computed tomography image and the extracted maximum brightness value, positive pixels greater than the threshold of 190 and 210 Based on the seven characteristics and machine learning, including the percentage of percentile, 75% and 95% percentile brightness values, and GLCM sum entropy and GLRLM long-run emphasis, It is possible to distinguish between angiomyolipoma and clear cell renal cell carcinoma.
도 1은 조영 증강된 신장 CT 영상에 도시된 fp-AML(좌측, 화살표)과 투명 세포 RCC(우측, 화살표)를 도시한 도면.
도 2a는 본 발명의 일 실시예에 의한 조영 증강된 다중검출 컴퓨터 단층 촬영 영상에서 정량적 특징 분류를 사용하여 지방이 적은 혈관근지방종과 투명세포 신세포암을 구별하기 위한 방법의 흐름도.
도 2b는 본 발명의 일 실시예에 의한 조영 증강된 다중검출 컴퓨터 단층 촬영 영상에서 정량적 특징 분류를 사용하여 지방이 적은 혈관근지방종과 투명세포 신세포암을 구별하기 위한 방법의 개념도.
도 3은 fp-AML(상부 줄) 및 ccRCC(하부 줄)에 대한 ROI 윤곽의 예를 도시한 도면.
도 4는 fp-AML과 ccRCC 환자들에 대한 정규화된 특징들의 히트 맵; x 축은 히스토그램 및 질감 특징들이고 y 축은 클러스터링된 환자를 도시한 도면.
도 5는 AUC 분석으로부터 측정된 AUC(상부) 및 ReliefF 선택으로부터 계산된 평균 ReliefF 가중치(하부)를 도시한 도면.
도 6은 PCA-변환된 트레이닝 특징들의 특징 히트 맵; (a)는 원래의 증가된 트레이닝 특징들(상부)을 도시한 도면이고 (b)는 PCA-변환된 트레이닝 특징들(하부)을 도시한 도면.
도 7a, 도 7b 및 도 7c는 (a) AUC, (b) ReliefF 및 (c) PCA의 특징 선택에 기반하여, 4개의 분류기 모델들을 가지고 수행한 분류 방법의 ROC 커브를 도시한 도면.
도 8a, 도 8b 및 도 8c는 정확도 대 (a) AUC, (b) ReliefF 및 (c) PCA의 특징 선택 방법에 기반한 분류기 모델들에 대한 특징들의 수의 선 그래프.
도 9a 내지 도 9e는 정확도 대 분류기 모델들과 특징 선택 방법들에 대한 (a) 민감도, (b) 특이도, (c) PPV, (d) NPV 및 (e) AUC를 포함하는 5개의 분류 성능들의 선 그래프.1 shows fp-AML (left arrow, arrow) and transparent cell RCC (right arrow, arrow) shown in a contrast enhanced kidney CT image.
FIG. 2A is a flow chart of a method for distinguishing an aneurysmal lipoma of low fat from a clear cell renal cell carcinoma using quantitative feature classification in a contrast enhanced multi-detector computed tomography image according to an embodiment of the present invention.
FIG. 2B is a conceptual diagram of a method for distinguishing between an aneurysmal lipoma of low fat and a clear cell renal cell carcinoma using quantitative feature classification in a contrast enhanced multi-detection computed tomography image according to an embodiment of the present invention.
Figure 3 shows an example of ROI contours for fp-AML (upper row) and ccRCC (lower row).
Figure 4 shows a heat map of normalized features for fp-AML and ccRCC patients; The x-axis is the histogram and texture features and the y-axis is the clustered patient.
Figure 5 shows the average ReliefF weights (bottom) calculated from AUC (top) and ReliefF selection measured from AUC analysis.
Figure 6 is a characteristic heat map of PCA-transformed training features; (a) shows original enhanced training features (upper) and (b) shows PCA-converted training features (lower).
Figures 7a, 7b and 7c show ROC curves of a classification method performed with four classifier models, based on (a) AUC, (b) ReliefF and (c) feature selection of PCA.
Figures 8A, 8B and 8C are line graphs of the number of features for classifier models based on accuracy versus (a) AUC, (b) ReliefF, and (c) PCA feature selection methods.
Figures 9a-9e illustrate five classification performances including (a) sensitivity, (b) specificity, (c) PPV, (d) NPV and (e) AUC for accuracy versus classifier models and feature selection methods Line graph.
본 발명의 목적, 특정한 장점들 및 신규한 특징들은 첨부된 도면들과 연관되어지는 이하의 상세한 설명과 바람직한 실시예들로부터 더욱 명백해질 것이다.BRIEF DESCRIPTION OF THE DRAWINGS The objectives, specific advantages and novel features of the present invention will become more apparent from the following detailed description taken in conjunction with the accompanying drawings, in which: FIG.
이에 앞서 본 명세서 및 청구범위에 사용된 용어나 단어는 통상적이고 사전적인 의미로 해석되어서는 아니되며, 발명자가 그 자신의 발명을 가장 최선의 방법으로 설명하기 위해 용어의 개념을 적절하게 정의할 수 있는 원칙에 입각하여 본 발명의 기술적 사상에 부합되는 의미와 개념으로 해석되어야 한다.Prior to that, terms and words used in the present specification and claims should not be construed in a conventional and dictionary sense, and the inventor may properly define the concept of the term in order to best explain its invention Should be construed in accordance with the principles and the meanings and concepts consistent with the technical idea of the present invention.
본 명세서에서 각 도면의 구성요소들에 참조번호를 부가함에 있어서, 동일한 구성 요소들에 한해서는 비록 다른 도면상에 표시되더라도 가능한 한 동일한 번호를 가지도록 하고 있음에 유의하여야 한다.It should be noted that, in the present specification, the reference numerals are added to the constituent elements of the drawings, and the same constituent elements are assigned the same number as much as possible even if they are displayed on different drawings.
또한, "제1", "제2", "일면", "타면" 등의 용어는, 하나의 구성요소를 다른 구성요소로부터 구별하기 위해 사용되는 것으로, 구성요소가 상기 용어들에 의해 제한되는 것은 아니다.Also, the terms "first", "second", "one side", "other side", etc. are used to distinguish one element from another, It is not.
이하, 본 발명을 설명함에 있어, 본 발명의 요지를 불필요하게 흐릴 수 있는 관련된 공지 기술에 대한 상세한 설명은 생략한다.DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS In the following description of the present invention, a detailed description of known arts which may unnecessarily obscure the gist of the present invention will be omitted.
이하, 첨부된 도면을 참조하여 본 발명의 바람직한 실시형태를 상세히 설명하기로 한다.Hereinafter, preferred embodiments of the present invention will be described in detail with reference to the accompanying drawings.
도 2a는 본 발명의 일 실시예에 의한 조영 증강된 다중검출 컴퓨터 단층 촬영 영상에서 정량적 특징 분류를 사용하여 지방이 적은 혈관근지방종과 투명세포 신세포암을 구별하기 위한 방법의 흐름도이다.FIG. 2A is a flow chart of a method for distinguishing an aneurysmal lipoma of low fat from a clear cell renal cell carcinoma using quantitative feature classification in a contrast enhanced multi-detection computed tomography image according to an embodiment of the present invention.
도 2a를 참조하면, 단계 S200에서, 복수의 조영 증강된 다중검출 컴퓨터 단층 촬영(MDCT) 트레이닝 영상들에서 분리된 신장 종양 영역으로부터 히스토그램 특징들, 밝기값 백분율 특징들, 및 질감 특징들을 추출한다.Referring to FIG. 2A, in step S200, histogram features, brightness value percentage features, and texture features are extracted from a separate kidney tumor region in a plurality of contrast enhanced multi-detection computerized tomography (MDCT) training images.
단계 S202에서, 상기 추출된 특징들을 복수의 특징 선택 방법과 복수의 기계 학습 기반의 분류 방법의 조합에 적용하여 최상의 분류 성능을 나타내는 특징들 및 분류 방법을 각각 최적의 분류 특징들 및 최적의 기계 학습 분류 방법으로서 선택한다.In step S202, the extracted features are applied to a combination of a plurality of feature selection methods and a plurality of machine learning-based classification methods, so that the features and classification methods exhibiting the best classification performance are respectively referred to as optimal classification features and optimal machine learning As the classification method.
단계 S204에서, 상기 선택된 분류 특징들을 상기 선택된 기계 학습 분류 방법에 적용하여 분류 모델을 획득한다.In step S204, the selected classification features are applied to the selected machine learning classification method to obtain a classification model.
단계 S206에서, 조영 증강된 다중검출 컴퓨터 단층 촬영 테스트 영상에서 분리된 신장 종양 영역으로부터 상기 최적의 분류 특징들을 추출한다.In step S206, the optimal classification features are extracted from the isolated kidney tumor area in the contrast enhanced multi-detection computerized tomography test image.
단계 S208에서, 상기 추출된 최적의 분류 특징들을 상기 분류 모델에 적용하여 지방이 적은 혈관근지방종과 투명세포 신세포암을 구별한다.In step S208, the extracted optimal classification features are applied to the classification model to distinguish aneurysmal lipoma of low fat from clear cell renal cell carcinoma.
본 발명의 일 실시예에 의한 조영 증강된 다중검출 컴퓨터 단층 촬영 영상에서 정량적 특징 분류를 사용하여 지방이 적은 혈관근지방종과 투명세포 신세포암을 구별하기 위한 방법은, 조영 증강된 다중검출 컴퓨터 단층 촬영(CE MDCT) 영상으로부터의 히스토그램 및 질감 패턴들에 대한 정량적인 특징 분류를 사용하여 양성의 지방이 적은 혈관근지방종(fp-AML: fat-poor angiomyolipoma)과 악성 투명-세포 신세포암(ccRCC: clear-cell renal cell carcinoma)을 구별하기 위한 컴퓨터 기반 분류 방법이다.A method for distinguishing between a fat-poor angiomyolipoma and a clear cell renal cell carcinoma using quantitative feature classification in a contrast enhanced multi-detection computed tomography image according to an embodiment of the present invention includes: (Fp-AML: fat-poor angiomyolipoma) and malignant clear-cell renal cell carcinoma (ccRCC) using quantitative characterization of histogram and texture patterns from imaging (CE MDCT) : clear-cell renal cell carcinoma).
25명의 fp-AML 및 25명의 ccRCC 환자들의 50개의 CE MDCT 영상들을 포함하는 데이터 세트가 사용되었다. 이들 영상들로부터, 관심 영역(ROI: region of interest)을 정의하기 위하여 방사선 전문의에 의해 종양들이 수동으로 분리되었다. 히스토그램과 질감 특징들 및 기계 학습 분류기들을 사용하여, 두 유형의 신장 종양들을 분리하기 위한 특징 분류 방법이 제안된다. 첫째, 기본 히스토그램 특성들을 포함하는 히스토그램 특징들, 어떤 임계값들을 넘는 픽셀들의 백분율(percentages of pixels above certain thresholds)과 백분위 밝기값(percentile intensities)과 GLCM, GLRLM 및 로컬 이진 패턴(LBP: local binary pattern)에 기반하는 질감 특징들을 포함하여, 64개의 정량적인 영상 특징들이 각 ROI로부터 추출되었다. AUC 분석, ReliefF 선택 및 PCA 변환을 포함하는 다수의 특징 선택 방법이 유용한 특징들을 선택하기 위하여 적용되었다. 마지막으로, 로지스틱 회귀분석(LR: logistic regression), k-근접 이웃(kNN; k nearest neighbor), 서포트 벡터 머신(SVM: support vector machine), 및 랜덤-포레스트(RF: random forest)를 포함하는 특징 분류기들이 양성 fp-AML과 악성 ccRCC을 식별하기 위하여 선택된 특징들에 대해 트레이닝되었다. 특징 선택 및 분류 방법들의 각각의 조합이 5겹 교차 검증(5-fold cross validation) 방법을 사용하여 테스트되었고, 정확도(accuracy), 민감도(sensitivity), 특이도(specificity), 포지티브 예측값(PPV: positive predictive value), 네거티브 예측값(NPV: negative predictive value) 및 수신자 동작 특성 커브 아래 면적(AUC: area under receiver operating characteristic curve)을 사용하여 평가되었다.A dataset containing 50 CE MDCT images of 25 fp-AML and 25 ccRCC patients was used. From these images, the tumors were manually separated by a radiologist to define the region of interest (ROI). Using histogram and texture features and machine learning classifiers, a feature classification method for separating two types of kidney tumors is proposed. First, histogram features including basic histogram characteristics, percentages of pixels above certain thresholds and percentile intensities, and GLCM, GLRLM, and local binary pattern (LBP) ), 64 quantitative image features were extracted from each ROI. A number of feature selection methods including AUC analysis, ReliefF selection and PCA conversion were applied to select useful features. Finally, features that include logistic regression (LR), k nearest neighbor (kNN), support vector machine (SVM), and random-forest (RF) Classifiers were trained on selected features to identify positive fp-AML and malignant ccRCC. Each combination of feature selection and classification methods were tested using the 5-fold cross validation method and were tested for accuracy, sensitivity, specificity, positive predictive value (PPV: positive predictive value, a negative predictive value (NPV), and an area under receiver operating characteristic curve (AUC).
특징 선택에서, 상이한 특징 선택 방법들에 의해 공통적으로 선택된 특징들이 평가되었다. 최대 밝기값, 임계값 190 및 210을 넘는 픽셀들의 백분율, 및 75% 및 95%에서의 백분위 밝기값을 포함하는 5개의 히스토그램 특징들과 GLCM 합 엔트로피(sum entropy) 및 GLRLM 롱-런 엠퍼시스(long-run emphasis)를 포함하는 2개의 질감 특징들이 두 유형의 신장 종양들을 구별하기 위한 핵심적인 특징들로서 공동으로 선택되었다. 특징 분류에서, ReliefF 특징 선택을 갖는 kNN 및 RF 분류기들은 특징 선택 및 분류 방법들의 다른 선택들 중에서 최상의 성능을 보여주었고, ReliefF+kNN 및 ReliefF+RF는 각각 0.782 및 0.780의 AUC를 달성하였다.In feature selection, commonly selected features were evaluated by different feature selection methods. Five histogram features including the maximum brightness value, a threshold 190 and a percentage of pixels over 210, and a percent brightness value at 75% and 95%, and GLCM sum entropy and GLRLM long-run emphasis long-run emphasis) were jointly selected as key features to distinguish between two types of kidney tumors. In the feature classification, kNN and RF classifiers with ReliefF feature selection showed the best performance among other choices of feature selection and classification methods and ReliefF + kNN and ReliefF + RF achieved AUC of 0.782 and 0.780, respectively.
본 발명의 일 실시예에 의한 조영 증강된 다중검출 컴퓨터 단층 촬영 영상에서 정량적 특징 분류를 사용하여 지방이 적은 혈관근지방종과 투명세포 신세포암을 구별하기 위한 방법에서, 밝은 밝기값 영역에 대한 히스토그램 특성 및 종양 내부의 이질성에 대한 질감 패턴들에 기반한 특징들이 fp-AML과 ccRCC를 분류하기 위한 핵심적인 특징들로서 선택되었고, 특징 선택과 분류 방법들의 적합한 조합을 통하여 양성 종양과 악성 종양을 구별하는 최상의 성능을 달성하였다. 본 발명은 조영 증강된 CT 영상에서 신장 종양에 대한 악성 종양과 연관된 유용한 특징들을 평가하는 데 사용될 수 있다.In a method for distinguishing an aneurysmal lipoma and a clear cell renal cell cancer using quantitative feature classification in a contrast enhanced multi-detection computed tomography image according to an embodiment of the present invention, a histogram Features based on texture and heterogeneity of tumor internal heterogeneity were selected as key features for classifying fp-AML and ccRCC, and the best combination of feature selection and classification methods to distinguish benign and malignant tumors Performance. The present invention can be used to evaluate useful features associated with malignant tumors for kidney tumors in contrast enhanced CT images.
하기에, 도 2 내지 도 9를 참조하여, 본 발명의 일 실시예에 의한 조영 증강된 다중검출 컴퓨터 단층 촬영 영상에서 정량적 특징 분류를 사용하여 지방이 적은 혈관근지방종과 투명세포 신세포암을 구별하기 위한 방법에 대해 상세히 설명하기로 한다.In the following, referring to Figs. 2 to 9, a quantitative feature classification is used to distinguish an aneurysmal lipoma and a clear cell renal cell cancer from a contrast enhanced multi-detection CT image according to an embodiment of the present invention Will be described in detail.
데이터 획득Data acquisition
데이터 세트는 2013년 12월부터 2015년 7월까지 획득된, 50명의 환자들로부터의 50 SRM들을 포함한다. 이들 SRM들은 25개의 fp-AML 및 25개의 ccRCC로 구성된다. fp-AML에 대해, 상기 데이터 세트는 2년의 추적 동안 종양이 아무런 성장도 하지 않은 양성 케이스들만을 포함한다. ccRCC에 대해, 상기 데이터 세트는 외과적 제거 이후에 병리학적 보고에서 긍정적으로 진단된 악성 케이스들만을 포함한다. 환자들에 대한, 나이, 성별 및 종양 크기는 표 1에 요약된다.The data set includes 50 SRMs from 50 patients, acquired from December 2013 through July 2015. These SRMs consist of 25 fp-AML and 25 ccRCCs. For fp-AML, the data set includes only positive cases in which the tumor did not grow during the two year follow-up. For ccRCC, the data set includes only malignant cases positively diagnosed in pathological reports after surgical removal. The age, sex, and tumor size for the patients are summarized in Table 1.
(N = 25)Fp-AML
( N = 25)
(N =25)ccRCC
( N = 25)
모든 케이스들에 대한 CT 이미징은 단일 기관에서 수행되었다. 50명의 환자들에 대한 영상들은 MDCT(SOMATOM Sensation 64, Siemens Healthcare, Forchheim, Germany; LightSpeed VCT, GE Healthcare, Milwaukee, WI, USA; GE Discovery CT 750 HD, GE Healthcare, Milwaukee, WI, USA; Ingenuity CT, Philips Healthcare, Best, The Netherlands; SOMATOM Definition Flash, Siemens Healthcare, Forchheim, Germany; Revolution CT, GE Healthcare, Milwaukee, WI, USA) 시스템들을 사용하여 캡처되었다. 모든 영상은 1.0-3.0 ㎜의 슬라이스 두께, 512×512 픽셀의 해상도, 0.66×0.66 ㎟ 내지 0.77×0.77 ㎟의 범위에 있는 픽셀 크기를 가지고 축상면에 존재하였다. 모든 케이스들에서, 조영 증강되지 않은 위상 영상과 조영 증강된 위상 영상 양자가 획득되었고, 가장 늦은 지연된 위상에서의 증강된 영상들만이 사용되었다. 더욱이, 2 ml/kg의 비이온계 조영제(Xenetics, Iobitridol, Seoul, Korea)가 3 ml/s의 속도로 정맥 주사로 주입되었고, 조영 증강된 영상들이 100s 내지 120s 사이의 지연으로 획득되었다.CT imaging for all cases was performed in a single institution. Images of 50 patients were analyzed using MDCT (SOMATOM Sensation 64, Siemens Healthcare, Forchheim, Germany; LightSpeed VCT, GE Healthcare, Milwaukee, WI, USA; GE Discovery CT 750 HD, GE Healthcare, Milwaukee, , Philips Healthcare, Best, The Netherlands; SOMATOM Definition Flash, Siemens Healthcare, Forchheim, Germany; Revolution CT, GE Healthcare, Milwaukee, Wis., USA). All images were on the axial surface with a slice thickness of 1.0-3.0 mm, a resolution of 512 x 512 pixels, and a pixel size in the range of 0.66 x 0.66 mm < 2 > to 0.77 x 0.77 mm < 2 >. In all cases, both contrast enhanced and contrast enhancement phase images were obtained, and only enhancement images in the slowest retarded phase were used. Furthermore, 2 ml / kg non-ionic contrast agent (Xenetics, Iobitridol, Seoul, Korea) was injected intravenously at a rate of 3 ml / s and contrast enhanced images were obtained with a delay between 100 s and 120 s.
특징 추출Feature extraction
본 발명의 일 실시예에 의한 조영 증강된 다중검출 컴퓨터 단층 촬영 영상에서 정량적 특징 분류를 사용하여 지방이 적은 혈관근지방종과 투명세포 신세포암을 구별하기 위한 방법에 의하면, fp-AML과 ccRCC을 구별하기 위한 CE MDCT 영상들에서 SRM들에 대한 분류 방법을 제공한다. 본 발명의 일 실시예에 의한 조영 증강된 다중검출 컴퓨터 단층 촬영 영상에서 정량적 특징 분류를 사용하여 지방이 적은 혈관근지방종과 투명세포 신세포암을 구별하기 위한 방법은 3가지 주요 단계들을 포함한다: (1) 특징 추출, (2) 특징 선택, 및 (3) 분류. 본 발명의 일 실시예에 의한 조영 증강된 다중검출 컴퓨터 단층 촬영 영상에서 정량적 특징 분류를 사용하여 지방이 적은 혈관근지방종과 투명세포 신세포암을 구별하기 위한 방법은 도 2a에 요약된다.According to one embodiment of the present invention, fP-AML and ccRCC are used to distinguish between a fat-poor angiomyolipoma and a clear cell renal cell carcinoma using quantitative feature classification in a multi-detection CT scan image of the present invention. We provide classification methods for SRMs in CE MDCT images to distinguish them. A method for distinguishing between low fat aneurysmal lipoma and clear cell renal cell carcinoma using quantitative feature classification in a contrast enhanced multi-detector computed tomography image according to an embodiment of the present invention includes three main steps: (1) feature extraction, (2) feature selection, and (3) classification. A method for distinguishing between a fat-poor angiomyolipoma and a clear cell renal cell carcinoma using quantitative feature classification in a contrast enhanced multi-detector computed tomography image according to an embodiment of the present invention is summarized in FIG.
첫째, 단계 S210에서, SRM들의 영상 특징들을 나타내는 특징들이 CE MDCT 영상들로부터 추출된다. 특징 추출을 위한 전처리 단계로서, 종양 분할이 수행되었고 관심 영역(ROI: region-of-interest)이 정의되었다. 각각의 환자 3D 영상에 대해, 방사선 전문의는 SRM의 최대 섹션이 보여지는 하나의 대표적인 슬라이스를 선택하였다. 이 대표적인 슬라이스에서, SRM은 ImageJ 소프트웨어(National Institutes of Health, Bethesda, MD, USA)를 사용하여 방사선 전문의에 의해 수동으로 분할되었다. 종양 경계 주위의 잡음이 있는 정보 없이 종양-내부 ROI를 포함시키기 위하여, 상기 수동으로 분할된 윤곽상에서, 형태학적 동작, 즉 침식을 수행함으로써 ROI가 결정되었다. 도 3은 본 발명의 일 실시예에 의한 조영 증강된 다중검출 컴퓨터 단층 촬영 영상에서 정량적 특징 분류를 사용하여 지방이 적은 혈관근지방종과 투명세포 신세포암을 구별하기 위한 방법에서 사용되는 SRM ROI들의 예를 도시한 것이다. 도 3의 상부 줄의 그림들은 fp-AML에 대한 ROI 윤곽의 예이고, 하부 줄의 그림들은 ccRCC에 대한 ROI 윤곽의 예이다.First, in step S210, features representing image features of SRMs are extracted from CE MDCT images. As a preprocessing step for feature extraction, tumor division was performed and region of interest (ROI) was defined. For each patient 3D image, the radiologist selected one representative slice showing the largest section of the SRM. In this representative slice, the SRM was manually segmented by a radiologist using ImageJ software (National Institutes of Health, Bethesda, MD, USA). ROI was determined by performing morphological operations, i.e. erosion, on the manually segmented outline to include the tumor-internal ROI without noise-bearing information around the tumor boundary. FIG. 3 is a graph showing the results of SRM ROIs used in a method for distinguishing between fat-less aneurysmal lipoma and transparent cell renal cell carcinoma using quantitative feature classification in a contrast enhanced multi-detection computed tomography image according to an embodiment of the present invention FIG. The upper row of Figure 3 is an example of an ROI outline for fp-AML, and the lower row images are an example of ROI outline for ccRCC.
분할된 SRM ROI로부터, 64개의 히스토그램과 질감 특징들이 자동으로 추출되었다. 특징들의 목록은 표 2에 제시된다. 첫째, 18개의 히스토그램 특징들은 기본 히스토그램 특성들, 어떤 임계값을 넘는 픽셀들의 백분율, 및 백분위 밝기값을 포함하는, SRM의 명암도 분포를 나타낸다. 7개의 기본 히스토그램 특징들에서, 평균, 표준편차, 최소 및 최대 밝기값, 왜도(skewness), 첨도(kurtosis) 및 밝기값 히스토그램의 엔트로피가 포함되었다. 어떤 임계값을 넘는 픽셀들의 백분율을 갖는 6개의 특징들에서, 명암도 밝기값이 소정의 임계값을 넘는 픽셀들의 비율이 계산되었다. 백분위 밝기값을 갖는 5개의 특징들에서, 명암도 히스토그램 상에서의 소정의 백분율의 밝기값들이 추출되었다. 둘째, 46개의 질감 특징들은, GLCM, GLRLM, 및 LBP 특징들을 포함하여, SRM 내부의 질감 패턴들을 나타내었다. 14개의 GLCM과 22개의 GLRLM 특징들에서, 1 픽셀의 픽셀 거리를 가지고, 4가지 상이한 방향들, 0°, 45°, 90° 및 135°에 따른 질감들이 계산되었고 이들 간의 평균 및 표준 편차들이 사용되었다. LBP 특징들에 관해, 기껏해야 2 이진 전이들을 포함하는, 9 회전-불변 균일 패턴들이 256개의 이진 패턴들로부터 선택되었고, 반면에 나머지 비-균일 패턴들은 10개의 이진 패턴들이 전체적으로 획득되도록 단일 빈(bin)에 지정되었다. 잡음에 강건한 질감 패턴들을 추출하기 위하여, GLCM, GLRLM 및 LBP가 256 내지 64 레벨까지의 히스토그램을 조정함으로써 중간-레벨 ROI 영상들에 대해 계산되었다. 모든 추출된 특징들은 특징 선택 및 분류 프로세스에서 사용되었다.From the segmented SRM ROI, 64 histograms and texture features were automatically extracted. A list of features is provided in Table 2. First, eighteen histogram features represent the intensity distribution of the SRM, including the basic histogram characteristics, the percentage of pixels over a certain threshold, and the percent brightness value. The seven basic histogram features included the mean, standard deviation, minimum and maximum brightness values, skewness, kurtosis, and entropy of the brightness value histogram. In six features with a percentage of pixels above a certain threshold, the ratio of pixels whose intensity brightness values exceeded a predetermined threshold value was calculated. In the five features with percentile brightness values, a predetermined percentage of brightness values on the intensity histogram were extracted. Second, the 46 texture features represented texture patterns within the SRM, including GLCM, GLRLM, and LBP features. In the 14 GLCM and 22 GLRLM features, textures with four pixels in different directions, 0 °, 45 °, 90 ° and 135 ° were calculated with a pixel distance of 1 pixel and mean and standard deviations between them were used . With respect to LBP features, nine rotation-invariant uniform patterns, including at most two binary transitions, were selected from 256 binary patterns while the remaining non-uniform patterns were selected from a single bin ( bin). To extract noise robust texture patterns, GLCM, GLRLM, and LBP were computed for mid-level ROI images by adjusting histograms from 256 to 64 levels. All extracted features were used in the feature selection and classification process.
Features (feature numbers) Categories (No. of features):
Features (feature numbers)
Histogram mean (1), standard deviation (2), minimum (3) and maximum (4) intensities, skewness (5), kurtosis (6), and entropy (7) Histogram features (7):
Histogram mean (1), standard deviation (2), minimum (3) and maximum (4) intensities, skewness, kurtosis,
8-bit intensity thresholds with 150 (8), 170 (9), 190 (10), 210 (11), 230 (12), 250 (13) Percentages of pixels above thresholds (6):
8-bit intensity thresholds with 150 (8), 170 (9), 190 (10), 210 (11), 230 (12)
5% (14), 25% (15), 50% (16), 75% (17), 95% (18) Percentile intensities at (5):
5% (14), 25% (15), 50% (16), 75% (17), 95% (18)
Four direction mean and standard deviation of angular second moment (19,20), contrast (21,22), sum average (23,24), sum variance (25,26), sum entropy (27,28), entropy (29,30), and difference entropy (31,32) GLCM features (14):
(21,22), sum average (23,24), sum variance (25,26), sum entropy (27,28), entropy (29,20) , 30), and difference entropy (31,32)
Four direction mean and standard deviation of short run emphasis (33,34), long run emphasis (35,36), gray-level non-uniformity (37,38), run length non-uniformity (39,40), run percentage (41,42), low gray-level run emphasis (43,44), high gray-level run emphasis (45,46), short run low gray-level emphasis (47,48), short run high gray-level emphasis (49,50), long run low gray-level emphasis (51,52), long run high gray-level emphasis (53,54) GLRLM features (22):
Run-length non-uniformity (39,40), run-percentage (35,36), gray-level non-uniformity Level run emphasis 43,44, high gray-
10uniform patterns in LBP histogram LBP features (10):
10Uniform patterns in LBP histogram
특징 선택Feature selection
단계 S212에서, 추출된 특징들로부터, 분류기의 성능을 증대하기 위하여 몇몇 특징들이 선택되었고 그룹화되었다. 특징 분류에 있어서, 적합한 특징들의 선택은 트레이닝된 분류기의 분별력을 개선하는데 중요한 역할을 한다. 3가지 특징-선택 방법들, 곡선 아래 면적(AUC: area-under curve) 분석, ReliefF 방법 및 주 성분 분석(PCA: principal component analysis)이 본 발명에서 이용되었다.In step S212, from the extracted features, several features were selected and grouped to enhance the performance of the classifier. In feature classification, the selection of suitable features plays an important role in improving the discriminatory power of the trained classifier. Three feature-selection methods, area-under curve (AUC) analysis, ReliefF method and principal component analysis (PCA) were used in the present invention.
AUC 분석에서, fp-AML과 ccRCC를 분류하는데 사용되는 각 특징의 정량적인 평가가 수행되었다. SRM의 두 클래스들을 구별할 때의 성능을 평가하기 위하여, 각 특징에 대한 수신자-동작-특성(ROC: receiver-operating-characteristic) 커브 및 커브 아래 면적(AUC: area-under curve)이 계산되었다. 상기 ROC 커브 및 AUC는 특징 값들의 임계값들을 연속적으로 변경하면서 그리고 참 양성(true positive) 및 거짓 양성(false positive) 비율을 측정하면서 계산되었다. 상기 AUC 분석은 상이한 유형의 SRM을 분류하기 위한 각각의 개별적인 특징의 분별력을 제공한다. 계산된 AUC 점수를 가지고, 특징들의 순위가 매겨지며 상위 NF 특징들이 분류된 목록으로부터 선택되었으며, 상기에서 NF는 선택된 특징들의 수이다. In the AUC analysis, a quantitative assessment of each feature used to classify fp-AML and ccRCC was performed. Receiver-operating-characteristic (ROC) curves and area-under curves (AUC) for each feature were calculated to evaluate the performance of distinguishing the two classes of SRM. The ROC curve and AUC were calculated while continuously changing the thresholds of the feature values and measuring the true positive and false positive ratios. The AUC analysis provides discriminatory power of each individual feature to classify different types of SRM. With the calculated AUC score, the features are ranked and the top N F features are selected from the sorted list, where N F is the number of features selected.
ReliefF 선택 방법에서, 특징 중요도와 관련된 가중치들이 계산되었고 상위 가중치들을 가지고 특징들을 선택함으로써 특징 선택이 수행되었다. 상기 ReliefF 방법은 그것의 저차(low-order) 다항 시간 효율, 양호한 잡음 허용 오차 및 특징 상호작용에 대한 강건함 때문에 이진 분류의 영역에서 가장 일반적으로 사용되는 특징 선택 방법들 중 하나이다. 상기 ReliefF 방법에서, 특징 가중치들은, 클래스-내 마진을 강조하고 클래스-간 마진에 대해 벌칙을 주면서, 그들을 반복적으로 갱신함으로써 계산된다. 상기 ReliefF 선택 단계에서, 특징 조합의 판별력은 선택 결과에 반영되는 반면에, AUC 분석은 단지 특징들을 개별적으로 평가한다.In the ReliefF selection method, weights related to feature importance were calculated and feature selection was performed by selecting features with higher weights. The ReliefF method is one of the most commonly used feature selection methods in the realm of binary classification due to its low-order polynomial time efficiency, good noise tolerance and robustness to feature interactions. In the ReliefF method, feature weights are calculated by repeatedly updating them, emphasizing in-class margins and penalizing for inter-class margins. In the ReliefF selection step, the discriminating power of the feature combination is reflected in the selection result, while the AUC analysis only evaluates the features individually.
PCA 변환 방법에서, 특징들을 새로운 좌표계상에 투영함으로써 특징들이 변환된다. 정보의 손실없이 특징들의 크기를 효과적으로 감소시키기 위하여, PCA 방법은 두 제약들을 가지고 새로운 좌표계를 계산한다. 첫째, 좌표들은 서로 직교하여 상관되지 않는다. 둘째, 좌표들은 투영된 특징점들의 변화 레벨이 최대화되는 제약에 의해 결정된다. 선택된 특징들의 값들을 유지하는, 상기한 선택 방법들과는 대조적으로, PCA는 특징들의 중요도를 강조하기 위하여 특징 공간 투영에 의해 특징 값들을 변환한다. 특징들의 판별력이 물론 PCA-변환된 특징들 중에서 순위가 매겨지기 때문에, 첫번째 NF 특징들은 본 발명의 일 실시예에서 변환된 특징들로부터 선택되었다.In the PCA transformation method, features are transformed by projecting features onto a new coordinate system. To effectively reduce the size of features without loss of information, the PCA method computes a new coordinate system with two constraints. First, the coordinates are not orthogonal to each other and correlated. Second, the coordinates are determined by the constraint that the level of change of the projected feature points is maximized. In contrast to the selection methods described above, which maintain the values of the selected features, the PCA transforms the feature values by feature space projection to emphasize the importance of the features. The first N F features were selected from the transformed features in one embodiment of the present invention, since the discriminatory power of the features as well as the PCA-transformed features are ranked.
다양한 유형의 특징 선택 방법들을 사용하여, 다중 선택 방법에 의해 순위가 공동으로 상위에 매겨진 핵심적인 특징들이 획득되었고 분석되었다. 더욱이, 분류기 동작과 질병 특성 간의 관계의 심층적인 분석을 위하여 특징 선택과 분류 방법들의 다양한 조합과 연관된 성능 능력이 평가되었다.Using various types of feature selection methods, core features ranked jointly by multiple selection methods were obtained and analyzed. Furthermore, performance capabilities associated with various combinations of feature selection and classification methods have been evaluated for in-depth analysis of the relationship between classifier behavior and disease characteristics.
분류Classification
마지막으로, 단계 S214에서, 기계-학습 분류기를 통해 선택된 특징들의 분류가 수행되었다. 본 발명의 일 실시예에서, 로지스틱 회귀분석(LR), k 근접 이웃(kNN), 서포트 벡터 머신(SVM), 및 랜덤-포레스트(RF) 분류기를 포함하는, 4개의 분류기 모델들이 fp-AML과 ccRCC을 구별하는데 사용되었다. LR에서, 출력 클래스는 입력 특징들의 가중된 선형 조합으로서 간주되었고, 문제는 선형 조합에서 최적의 가중치 세트를 찾는 것이다. kNN에서, 출력 클래스는 주어진 보이지 않는 데이터(unseen data)에 대해 k 이웃 데이터를 관찰함으로써 결정된다. 실험에서, 관찰된 이웃들의 수는 실험적으로 k=50으로 결정되었다. SVM에서, 특징 공간에 대한 초평면(hyperplane)은 이진 클래스 데이터를 구별하기 위하여 결정된다. 실험에서, 원형 기반 함수(RBF: radial basis function)를 갖는 커널이 채택되었다. RF에서, 과적합(overfitting)을 회피하기 위하여 다중 랜덤 결정 트리(RDT: random decision tree)가 배깅되었다(bagged). 실험에서, RF 분류기를 형성하기 위한 RDT의 수는 실험적으로 nT=50으로 결정되었다. Finally, in step S214, classification of the features selected through the machine-learning classifier has been performed. In one embodiment of the present invention, four classifier models, including a logistic regression analysis (LR), a k-nearest neighbor (kNN), a support vector machine (SVM), and a random- ccRCC. < / RTI > In LR, the output class has been considered as a weighted linear combination of input features, and the problem is to find the optimal set of weights in a linear combination. In kNN, the output class is determined by observing k neighbor data for given unseen data. In the experiment, the number of observed neighbors was experimentally determined as k = 50. In the SVM, the hyperplane for the feature space is determined to distinguish binary class data. In the experiment, a kernel with a radial basis function (RBF) was adopted. In RF, a random decision tree (RDT) is bagged to avoid overfitting. In the experiment, the number of RDTs to form an RF classifier was experimentally determined to be n T = 50.
분류기 모델들은 5겹 교차 검증(5-fold cross validation) 방법을 사용하여 트레이닝되었고, 검증 방법에서 50명의 환자들로부터의 데이터는 랜덤하게 5개의 그룹들로 분할되었으며, 하나의 그룹은 테스트 데이터로서 사용되었고, 나머지 4개의 그룹들은 트레이닝 데이터로서 사용되었다. 데이터 인스턴스들의 수가 제한되기 때문에(N=50), 분류기 모델들은 트레이닝 단계에서 데이터 치우침(data bias) 및 과적합에 의해 크게 영향을 받을 수 있다. 이러한 어려움을 극복하기 위하여, 원래의 트레이닝 데이터 세트로부터 유도된 새로운 트레이닝 데이터가 추가되는, 데이터 증가 기법이 적용되었다. 실험에서, 트레이닝 데이터 증가는 (1) 랜덤하게 데이터를 선택하는 것, (2) 0.1도의 각 해상도(angle resolution)를 가지고 데이터를 회전시키는 것, 및 (3) 수직축을 따라 데이터를 랜덤하게 뒤집는 것(flipping)을 가지고 수행되었다. 증가된 데이터의 수가 또한 실험적으로 ND=2NC로서 결정되었는데, NC=500은 단일 질병 클래스에 대한 증가된 데이터의 크기이다.Classifier models were trained using a 5-fold cross validation method, and data from 50 patients in the verification method were randomly divided into five groups, one group being used as test data And the remaining four groups were used as training data. Because of the limited number of data instances (N = 50), classifier models can be greatly affected by data bias and over-sum in the training phase. To overcome this difficulty, a data increment technique has been applied in which new training data derived from the original training data set is added. In the experiment, the training data increment is (1) selecting the data at random, (2) rotating the data with an angle resolution of 0.1 degrees, and (3) randomly flipping the data along the vertical axis (flipping). The number of increased data was also experimentally determined as N D = 2 N C , where N C = 500 is the magnitude of the increased data for a single disease class.
결과result
양성 fp-AML과 악성 ccRCC을 구별하는 성능을 검증하기 위하여, 25명의 fp-AML 환자들과 25명의 ccRCC 환자들을 포함하는 데이터 세트에 대해 본 발명의 일 실시예에 의한 조영 증강된 다중검출 컴퓨터 단층 촬영 영상에서 정량적 특징 분류를 사용하여 지방이 적은 혈관근지방종과 투명세포 신세포암을 구별하기 위한 방법이 테스트되었다. 실험은 데이터 세트를 5개의 세트로 랜덤하게 겹침으로써 5겹 교차 검증을 사용하여 수행되었다. 랜덤 겹침이 50회 수행되었고 겹침 치우침을 회피하기 위하여 점수들이 평균화되었다. 특징 선택 접근법에서, 각 특징 선택 방법에 의해 선택된 20개의 특징들이 목록화되었고 분석되었다. 모든 3가지 선택 방법으로부터 상위 20개의 리스트들에서 공통적으로 선택된 핵심 특징들이 평가되었다. 특징 분류에서, 6개의 평가 기준이 분류 결과에서 판단되었다: 정확도(accuracy), 민감도(sensitivity), 특이도(specificity), 포지티브 예측값(PPV: positive predictive value), 네거티브 예측값(NPV: negative predictive value) 및 AUC. 정확도는 악성 종양에 상관없이 예측된 케이스와 실제 케이스 사이의 겹침을 나타낸다. 민감도와 PPV는 각각 실제 fp-AML 케이스들과 예측된 fp-AML 케이스들에 대한 참 양성(true positive) 비율이다. 특이도와 NPV는 대응적으로 실제 ccRCC 케이스들과 예측된 ccRCC 케이스들에 대한 참 음성(true negative)의 비율이다. 마지막으로, AUC는 양성 fp-AML과 악성 ccRCC을 정확하게 구별하는 분류기의 확률을 나타낸다. 4개의 분류기 모델들의 성능이 특징 선택 방법의 선택과 선택된 특징들의 수(NF)에 관하여 평가되었고 분석되었다.To verify the ability to distinguish between benign fp-AML and malignant ccRCC, a data set comprising 25 fp-AML patients and 25 ccRCC patients was subjected to contrast enhanced multi-detection computer tomography Methods were used to distinguish between low fat, aneurysmal lipoma and clear cell renal cell carcinoma, using quantitative characterization in radiographic images. Experiments were performed using five-fold crossover validation by randomly superimposing the data set into five sets. The random overlap was performed 50 times and the scores were averaged to avoid overlapping bias. In the feature selection approach, twenty features selected by each feature selection method were cataloged and analyzed. Commonly selected core features from the top 20 lists from all three selection methods were evaluated. In the feature classification, six evaluation criteria were determined from the classification results: accuracy, sensitivity, specificity, positive predictive value (PPV), negative predictive value (NPV) And AUC. Accuracy represents the overlap between predicted and actual cases, regardless of malignancy. Sensitivity and PPV are true positive ratios for actual fp-AML cases and predicted fp-AML cases, respectively. Specificity and NPV are correspondingly the ratio of true ccRCC cases and true negative for predicted ccRCC cases. Finally, AUC represents the probability of a classifier that accurately discriminates between benign fp-AML and malignant ccRCC. The performance of the four classifier models was evaluated and analyzed for the choice of feature selection method and the number of selected features (N F ).
도 4는 50명의 환자들로부터 추출된 64개의 정규화된 원래의 특징들의 히트 맵(hit map)을 도시한 것이다. 그것은 fp-AML과 ccRCC에 대한 영상 특징들의 분포들 간의 차이가 거의 인지할 수 없다는 것을 보여준다. 따라서 이들 특징들을 가지고 관용적인 분류 방법들을 사용하여 두 질병들을 구별하는 것은 도전적인데, 스튜던트 t 테스트와 같은 통계 분석 방법들이 이전의 대부분의 연구에서 구별 성능을 평가하기 위하여 단일 특징에 대해 수행되었다. 이들 원래의 특징들로부터 형성된 증가된 트레이닝 특징들로부터, AUC 분석, ReliefF 선택 및 PCA 변환의 3개의 특징 선택 방법들이 두 클래스들을 구별하는 분별력의 측면에서 특징들에 순위를 매기는데 적용되었다.Figure 4 shows a hit map of 64 normalized original features extracted from 50 patients. It shows that the difference between distributions of image features for fp-AML and ccRCC is hardly noticeable. It is therefore challenging to distinguish between the two diseases using conventional classification methods with these characteristics, and statistical methods such as the Student t test have been performed on a single feature to evaluate discrimination performance in most previous studies. From the increased training features formed from these original features, three feature selection methods, AUC analysis, ReliefF selection and PCA transformation, were applied to rank features in terms of discrimination to distinguish between the two classes.
AUC 특징 선택에서, 개별 특징들의 분별력 양은 도 5의 상부 줄에 도시된 바와 같이 AUC에 의해 측정되었다. 다수의 특징들, 특히 히스토그램 특징들 및 GLCM 질감 특징들은, 두 SRM 클래스들을 분리하는데 있어서 아주 높은 AUC를 나타내었다. 상위 20개의 AUC를 갖는 특징들의 목록은, 표 3에 주어진다. 상위 20개의 AUC 목록에는, 3개의 기본적인 히스토그램 특징들, 2개의 히스토그램 백분율 특징들, 2개의 히스토그램 백분위 밝기값, 7개의 GLCM 질감 특징들, 4개의 GLRLM 질감 특징들 및 2개의 LBP 특징들이 포함된다.In the AUC feature selection, the discriminatory power of the individual features was measured by AUC as shown in the upper row of FIG. Many features, particularly histogram features and GLCM texture features, exhibited a very high AUC in separating the two SRM classes. A list of features with the top 20 AUCs is given in Table 3. The top 20 AUC lists include three basic histogram features, two histogram percent features, two histogram percentile brightness values, seven GLCM texture features, four GLRLM texture features, and two LBP features.
ReliefF 특징 선택에서, 도 5의 하부 줄에 도시된 바와 같이, 특징 중요성 가중치가 계산되었다. 비록 몇몇 질감 특징들이 또한 선택될 중요한 가중치들을 나타낼지라도, 히스토그램 특징들이 높은 특징 가중치를 달성한다는 것이 주목되었다. 상위 20개의 ReliefF 가중치들을 갖는 특징들의 목록이 표 3에 요약된다. 이 표는 상위 ReliefF 가중된 특징 목록에 존재하였던 6개의 기본적인 히스토그램 특징들, 4개의 히스토그램 백분율 특징들, 3개의 히스토그램 백분위 밝기값, 3개의 GLCM 질감 특징들, 3개의 GLRLM 질감 특징들, 및 하나의 LBP 특징을 보여준다. In the ReliefF feature selection, feature importance weights were calculated, as shown in the bottom row of FIG. It has been noted that even though some texture features also represent important weights to be selected, histogram features achieve high feature weights. A list of features with the top 20 ReliefF weights is summarized in Table 3. This table includes six basic histogram features, four histogram percent features, three histogram percentile brightness values, three GLCM texture features, three GLRLM texture features, and one LBP characteristics.
PCA 특징 선택에서, 특징들은 다른 좌표계로 변환되었기 때문에, 도 6에 도시된 바와 같이, 원래의 특징들의 상위 선택 목록은 상기 2가지 선택 방법들에 대해 요약된 바와 같이 직접적으로 생성될 수 없다. 그 대신, PCA 특징 선택 방법에서 특징 중요도들을 평가하기 위하여 제1 주 성분(PC: principal component)에 대한 선형적인 조합이 평균화되었다. PCA-변환된 특징들에서 특징들의 분별력은 도 6b의 맨 좌측 컬럼에 도시된 제1 PC에서 최대화되었다는 것을 고려하면, 제1 PC에 대한 더 높은 가중치들을 갖는 원래의 특징들이 중요한 분별력을 갖는 의미있는 특징들로서 고려될 수 있다. 상위 20개의 평균 제1 PC 가중치들의 목록이 표 3에 제시된다. 이 목록에서, 2개의 기본적인 히스토그램 특징들, 4개의 히스토그램 백분율 특징들, 4개의 히스토그램 백분위 밝기값, 7개의 GLCM 질감 특징들 및 3개의 GLRLM 질감 특징들이 포함된다.In the PCA feature selection, features are converted to different coordinate systems, so that an upper selection list of original features can not be generated directly as summarized for the two selection methods, as shown in FIG. Instead, a linear combination for the first principal component (PC) was averaged to evaluate feature importance in the PCA feature selection method. Considering that the discriminative power of the features in the PCA-transformed features is maximized in the first PC shown in the leftmost column of FIG. 6B, the original features with higher weights for the first PC are significant Can be considered as features. A list of the top 20 average first PC weights is shown in Table 3. In this list, two basic histogram features, four histogram percent features, four histogram percentile brightness values, seven GLCM texture features and three GLRLM texture features are included.
3개의 특징 선택 방법들에서 상위 20개의 선택 점수 또는 가중치들을 갖는 특징들의 3개의 목록들로부터, 2개 목록 또는 3개 목록에서 발생하는 특징들을 발견하는 것은 분류 태스크에 대한 의미있는 특징들을 조사할 때 유용하다. AUC 및 ReliefF 선택에서, 7개의 히스토그램 특징들 및 4개의 질감 특징들을 포함하여, 20개의 특징들 중 11개의 특징들이 일반적으로 목록화되었다. AUC와 PCA 선택에서, 5개의 히스토그램 특징들과 6개의 질감 특징들을 포함하여, 20개의 특징들 중 11개의 특징들이 양 케이스에서 선택되었다. ReliefF 및 PCA 선택 사이에서, 8개의 히스토그램 특징들과 2개의 질감 특징들을 포함하여, 20개의 특징들 중 10개의 특징들이 공통적으로 선택되었다. 모든 3개의 목록들상에서, 5개의 히스토그램 특징들, 즉 히스토그램 최대 밝기값(4), 190(10)과 210(11)의 임계값을 넘는 포지티브 픽셀들의 백분율, 75%(17)와 95%(18)의 백분위 밝기값, 및 GLCM 합 엔트로피(sum entropy)(27)와 GLRLM 롱-런 엠퍼시스(long-run emphasis)(35)의 2개의 질감 특징들이 공통적으로 목록에 존재하였다.From the three lists of features having the top 20 selection scores or weights in the three feature selection methods, finding features that occur in two lists or three lists can be useful when examining meaningful features for a classification task useful. In the AUC and ReliefF selections, eleven features of the twenty features, including seven histogram features and four texture features, are generally listed. In the AUC and PCA selections, eleven features of the twenty features, including five histogram features and six texture features, were selected in both cases. Between the ReliefF and PCA selections, ten features of the twenty features were commonly selected, including eight histogram features and two texture features. On all three lists, the five histogram features, the histogram
그 다음 본 발명의 일 실시예에 의한 조영 증강된 다중검출 CT 영상에서 정량적 특징 분류를 사용하여 지방이 적은 혈관근지방종과 투명세포 신세포암을 구별하기 위한 방법이 fp-AML과 ccRCC을 구별하기 위하여 선택된 특징들에 적용되었다. 표 4는 정확도, 민감도, 특이도, PPV 및 NPV에 따라 측정된, 3개의 상이한 특징 선택 방법들을 가지고 4개의 상이한 분류기들의 성능을 나타낸 것이다. A method for distinguishing between low-fat aneurysmal lipoma and clear cell renal cell carcinoma using quantitative feature classification in contrast enhanced multidetector CT images according to an embodiment of the present invention distinguishes between fp-AML and ccRCC It was applied to selected features. Table 4 shows the performance of four different classifiers with three different feature selection methods, measured according to accuracy, sensitivity, specificity, PPV and NPV.
AUC 선택에서, kNN은 가장 좋은 전체 성능을 나타내었고, 다른 것들은 유사한 점수들을 달성하였다. ReliefF 선택에서, kNN과 RF는 다른 것들보다 더 강력한 성능을 보여주었다. PCA 선택에서, LR과 RF는 kNN과 SVM보다 더 높은 점수를 달성하였다. 분류기 모델의 측면에서, LR은 다른 특징 선택 방법들보다 PCA 선택을 사용하여 더 강력한 성능을 보여주었다. 다른 분류기 모델들, 즉 kNN, SVM 및 RF는 ReliefF 선택을 사용하여 최선의 성능을 달성하였다. 전체 결과로부터, kNN과 ReliefF 선택은 다른 분류 방법들을 능가하였다.In the AUC selection, kNN showed the best overall performance, and others achieved similar scores. In ReliefF selection, kNN and RF showed stronger performance than others. In the PCA selection, LR and RF achieved higher scores than kNN and SVM. In terms of the classifier model, LR showed stronger performance using PCA selection than other feature selection methods. Other classifier models, kNN, SVM and RF, achieved best performance using ReliefF selection. From the overall results, kNN and ReliefF selection outperformed other classification methods.
도 7은 상이한 분류기 모델들 및 상이한 특징 선택 방법들을 사용하는 본 발명의 제안된 분류 방법의 ROC 커브를 도시한 것이다. 표 4에서 분석된 바와 같이, kNN은 AUC 선택시 다른 모델들 중에서 가장 가파른 커브를 보여주었다. kNN과 RF 커브들은 ReliefF 선택시 LR과 SVM보다 상부에 위치하고, LR과 RF의 커브들은 PCA 선택시 그들의 나머지보다 상부에 위치한다. 상기 커브들 및 AUC로부터, ReliefF 선택을 갖는 kNN과 RF는 분류기 모델들 및 특징 선택 방법들의 다른 선택들 중에서 최상의 성능을 보여주었다는 것을 확인할 수 있다.Figure 7 illustrates the ROC curve of the proposed classification method of the present invention using different classifier models and different feature selection methods. As analyzed in Table 4, kNN showed the steepest curve among the other models when choosing AUC. The kNN and RF curves are located above the LR and SVM when ReliefF is selected, and the LR and RF curves are above the rest of them when the PCA is selected. From these curves and AUC, it can be seen that kNN and RF with ReliefF selection showed the best performance among other choices of classifier models and feature selection methods.
특징 선택에 관해 분류기 모델들의 거동을 조사하기 위하여, 상이한 수의 선택된 특징들(NF)을 가지고 본 발명의 제안된 분류 방법의 분류 성능 능력이 측정되었다. 도 8은 여기에서 평가된 4개의 분류기 모델들 및 3개의 특징 선택 방법들의 분류 정확도 및 NF의 선 그래프를 도시한 것이다. AUC 선택시, RF의 정확도는 NF가 감소함에 따라 감소하는 반면에, kNN과 SVM에 대한 정확도는 비교적 안정적인데, LR의 정확도는 NF>40인 경우 빠르게 감소하고, NF<40인 경우 증가한다. ReliefF 선택 프로세스에서, RF의 정확도는 NF가 감소함에 따라 다시 감소하는 반면에, 다른 모델들의 경우 증가한다. 특히, LR은 NF<30인 경우 정확도가 급격히 증가함을 보여준다. PCA 선택시, LR, kNN 및 SVM의 정확도는 NF가 감소함에 따라 증가하는 반면에, RF의 정확도는 비교적 안정적으로 유지된다. 특히 PCA 선택시, 완전한 PCA-변환된 특징들(NF=64)를 갖는 SVM에 대한 정확도는 심하게 저하되는 반면에, NF=35인 경우 정확도는 기대 수준까지 급격히 증가한다. NF를 갖는 분류기 거동으로부터, ReliefF 선택 방법은 NF의 선택에 상관없이 대부분의 분류기 모델들에 대해 효과적이고, PCA 선택은 작은 NF 값들을 가지고 특히 잘 동작함이 명백하다. 분류기 모델들의 다른 성능 측정, 이 경우 민감도, 특이도, PPV, NPV 및 AUC 레벨은, 도 9에 도시된 바와 같이, 정확도 경향과 유사한 경향을 나타내었다.To investigate the behavior of classifier models on feature selection, the classification performance capabilities of the proposed classification method of the present invention were measured with different numbers of selected features (N F ). FIG. 8 shows a line graph of classification accuracy and N F of four classifier models and three feature selection methods evaluated here. When AUC is selected, the accuracy of RF decreases with decreasing N F , while the accuracy with respect to kNN and SVM is relatively stable. The accuracy of LR decreases rapidly when N F > 40, and when N F <40 . In the ReliefF selection process, the accuracy of the RF decreases again as N F decreases, but increases for other models. In particular, the LR shows a sharp increase in accuracy when N F <30. When PCA is selected, the accuracy of LR, kNN, and SVM increases with decreasing N F , while the accuracy of RF remains relatively stable. Especially for PCA selection, the accuracy for SVM with full PCA-converted features (N F = 64) is severely degraded, whereas for N F = 35 the accuracy increases sharply to the expected level. From the classifier behavior with N F , the ReliefF selection method is effective for most classifier models regardless of the choice of N F , and the PCA selection is small N F It is obvious that it works particularly well with values. Other performance measures of classifier models, in this case sensitivity, specificity, PPV, NPV and AUC levels, showed a tendency similar to the accuracy trend, as shown in FIG.
논의Argument
본 발명의 일 실시예에서는, 기계-학습 분류기들과 함께 히스토그램 특징들과 질감 특징들을 사용하여 CE MDCT 영상들에서 fp-AML과 ccRCC를 구별하기 위한 방법이 제안되었다. 임상적인 중요성에도 불구하고, 두 가지 유형의 SRM들을 구별하는 것은 그들의 유사한 외관으로 인하여 도전적인 것으로 알려져있다. 두 가지 유형의 SRM들을 구별하기 위하여, 특징 추출, 선택 및 분류 단계들로 구성되는 CE MDCT 영상들에 대한 특징 분류 방법이 개발되었다. 특징 추출에서, 히스토그램과 질감 패턴들에 대해 64개의 특징들이 종양 ROI의 중앙 슬라이스로부터 추출되었다. 특징 선택의 프로세스 동안, 두 클래스의 SRM들의 분리에서 사용된 일 그룹의 핵심 특징들이 다양한 선택 방법들에 의해 선택되었다. 마지막으로 특징 분류에 있어서, 보이지 않는 SRM 데이터를 분류하기 위하여 선택된 특징들을 사용하여 다수의 분류기 모델들이 트레이닝되었다. 데이터 세트에 대한 실험에서, 3가지 선택 방법들에 의해 공통적으로 선택된 핵심 특징들이 평가되었고, 특징 선택과 분류기 모델들의 다양한 선택과 연관된 성능 평가가 수행되었다.In one embodiment of the invention, a method has been proposed for distinguishing fp-AML from ccRCC in CE MDCT images using histogram features and texture features with machine-learning classifiers. Despite its clinical importance, it is known that distinguishing between two types of SRMs is challenging due to their similar appearance. To distinguish between the two types of SRMs, feature classification methods have been developed for CE MDCT images consisting of feature extraction, selection and classification steps. In feature extraction, 64 features for the histogram and texture patterns were extracted from the central slice of the tumor ROI. During the process of feature selection, a group of core features used in the separation of the SRMs of the two classes was selected by various selection methods. Finally, for feature classification, multiple classifier models were trained using selected features to classify invisible SRM data. In the experiment on the data set, the core features that were selected in common by the three selection methods were evaluated, and the performance evaluation related to the feature selection and the various selection of the classifier models was performed.
본 발명의 일 실시예에 의한 조영 증강된 다중검출 컴퓨터 단층 촬영 영상에서 정량적 특징 분류를 사용하여 지방이 적은 혈관근지방종과 투명세포 신세포암을 구별하기 위한 방법은 많은 이익을 제공한다. 첫째, 특징 추출, 선택 및 분류가 단지 CE CT 영상들에 대해서만 수행되었다. 대부분의 이전의 연구들에서, 조영 증강되지 않은 영상과 조영 증강된(CE) CT 영상들 양자를 포함하는 다중-위상 영상들이 입력 영상들로서 사용되었고 상이한 위상들 간의 증강 패턴들이 영상 특징들로서 평가되었다. 다중-위상 영상들로부터 증강 패턴들을 계산하는 것은 시간 소모적인데, 그것은 종양 ROI들을 매칭시키기 위하여 영상들 간의 비강체 정합뿐만 아니라 상이한 위상들의 영상들에서 동일한 종양의 복수의 수동 분할을 필요로 하기 때문이다. 본 발명의 일 실시예에서는, 비교적 단순하고, 복수의 ROI 정의 또는 다중-위상 영상들 간의 비강체 정합을 필요로 하지 않는, CE MDCT 영상들을 사용하는 특징 분류 방법이 제안되었다. 더욱이, 대부분의 기존의 방법들이 다중-위상 영상들에 집중한 반면에, 본 발명은 그 능력을 고려할 때 조영 증강된 영상들에 특정적인 유용한 영상 특징들 및 분류 모델들을 평가하는데 기여한다.Methods for distinguishing between low-fat aneurysmal lipoma and clear cell renal cell carcinoma using quantitative feature classification in a contrast enhanced multi-detector computed tomography image according to an embodiment of the present invention provide many benefits. First, feature extraction, selection, and classification were performed only on CE CT images. In most previous studies, multi-phase images including both nonenhanced and enhanced CT (CE) CT images were used as input images and enhancement patterns between different phases were evaluated as image features. Computing the enhancement patterns from multi-phase images is time consuming because it requires multiple passive segmentation of the same tumor in images of different phases as well as non-rigid matching between images to match tumor ROIs . In one embodiment of the present invention, a feature classification method using CE MDCT images has been proposed that is relatively simple and does not require non-rigid matching between multiple ROI definitions or multi-phase images. Moreover, while most existing methods focus on multi-phase images, the present invention contributes to evaluating useful image features and classification models that are specific to contrast enhanced images when considering their capabilities.
둘째, 본 발명의 일 실시예에 의한 조영 증강된 다중검출 컴퓨터 단층 촬영 영상에서 정량적 특징 분류를 사용하여 지방이 적은 혈관근지방종과 투명세포 신세포암을 구별하기 위한 방법에서는 단지 정량적인 영상 특징들만이 평가되고 분석된다. 대부분의 이전의 방법들은 위치(외장성(exophytic), 실질내부(intra-parenchymal) 또는 내장성(endophytic)), 형상(둥근(round) 또는 둥글지 않은(non-round)), 증강 패턴(초기 워시아웃(early washout), 점진적(gradual) 또는 장기적인(prolonged)), 및 감쇠 유형(hype-, iso- 또는 hyper-attenuation)과 같은, 정성적인 영상 특징들을 사용하였다. 이들 정성적인 특징들은 다중-선택 포맷으로 방사선 전문의에 의해 수동으로 평가되었고 기록되었다. 이들 특징들은 일반적으로 전문가에 의해 인정된 바와 같은 소중한 정보를 제공하지만, 특징 평가의 프로세스가 시간 소모적일 뿐만 아니라, 관찰자-간 변동성 및 관찰자-내 변동성의 위험을 지니고 있다. 대조적으로, 본 발명의 일 실시예에 의한 조영 증강된 다중검출 컴퓨터 단층 촬영 영상에서 정량적 특징 분류를 사용하여 지방이 적은 혈관근지방종과 투명세포 신세포암을 구별하기 위한 방법은 CT 영상들의 종양 ROI으로부터 자동으로 계산된 단지 정량적인 영상 특징들만을 사용한다.Secondly, in a method for distinguishing an aneurysmal lipoma and a clear cell renal cell cancer using quantitative feature classification in a contrast enhanced multi-detection computed tomography image according to an embodiment of the present invention, only quantitative image features Are evaluated and analyzed. Most of the previous methods have been used to determine the location (exophytic, intra-parenchymal or endophytic), shape (round or non-round) We used qualitative image features such as early washout, gradual or prolonged, and attenuation type (hype-, iso- or hyper-attenuation). These qualitative features were manually evaluated and recorded by the radiologist in a multi-selection format. These features generally provide valuable information as acknowledged by experts, but the process of characterization is time consuming as well as the risk of intra-observer variability and intra-observer variability. In contrast, a method for distinguishing between low-fat aneurysmal lipoma and clear cell renal cell carcinoma using quantitative feature classification in contrast enhanced multi-detector computed tomography images according to an embodiment of the present invention is based on the tumor ROI Using only quantitative image features that are automatically calculated from the images.
실험 결과에서, 본 발명에서 제안된 분류 방법을 사용하여 수많은 관찰이 기록되었다. 첫째, 특징 선택 프로세스에서, 표 3에 도시된 바와 같이, 3가지 선택 방법들에 의해 선택된 상위 20개의 특징 목록들에서 7개의 특징들이 공통적으로 선택되었음을 보여주었다. 이들 7개의 핵심 특징들에서, 최대 밝기값의 5개의 히스토그램 특징들, 임계값 190 및 210을 넘는 픽셀들의 백분율, 및 75%와 95% 백분위 밝기값은 SRM에서 밝은 밝기값을 갖는 영역들의 히스토그램 특징들을 공동으로 나타낸다. 이전의 방법들은, 가시성에 상관없이 fp-AML에서의 지방의 존재로 인하여 fp-AML을 다양한 서브유형의 RCC와 구별하는데 있어서 CT 감쇠 측정치들의 히스토그램 분석이 이점을 가질 수 있다는 것을 보여주었다. 그들은 fp-AML에서의 가시적인 지방의 부재에도 불구하고, 종양에서의 지방의 존재는 fp-AML과 서브유형의 RCC의 감쇠 히스토그램에서의 사소하지만 존재하는 차이를 초래한다는 가설을 제기하였다. 본 발명의 일 실시예에 의한 조영 증강된 다중검출 컴퓨터 단층 촬영 영상에서 정량적 특징 분류를 사용하여 지방이 적은 혈관근지방종과 투명세포 신세포암을 구별하기 위한 방법의 결과는, 높은 감쇠도를 갖는 히스토그램들이 또한 fp-AML과 RCC 간에 약간 다를 수 있다는 점에서 유사한 결과를 보여주고, 이것은 밝은 밝기값을 갖는 영역의 히스토그램 특성과 연관된 히스토그램 특징들의 선택을 주로 초래한다. 나머지 2개의 질감 특징들인, GLCM 합 엔트로피와 GLRLM 롱-런 엠퍼시스(long-run emphasis)는, 종양 내부의 이질적인 질감 패턴들을 제공한다. 조영 증강되지 않은 CT 영상들을 포함하는 다수의 연구는, fp-AML이 RCC에 비해 낮은 수준의 병변 이질성을 보여주지만, 그 차이는 거의 보이지 않고 단지 정량적인 질감 분석에 의해 단지 액세스가능하다는 것을 나타내었다. 병변 이질성의 정도는, 또한 이질성-관련 질감 패턴들의 선택의 주 프로세스 동안 나타낸 바와 같이, CE CT 영상들 상의 두 가지 유형의 SRM을 구별하기 위한 중요한 특징임이 관찰될 수 있다.In the experimental results, a number of observations were recorded using the classification method proposed in the present invention. First, in the feature selection process, as shown in Table 3, seven features were commonly selected in the top 20 feature lists selected by the three selection methods. In these seven key features, the five histogram features of the maximum brightness value, the percentage of pixels above thresholds 190 and 210, and the 75% and 95% percentile brightness values are the histogram features of areas with bright brightness values in the SRM . Previous methods have shown that histogram analysis of CT attenuation measurements can have an advantage in distinguishing fp-AML from RCCs of various subtypes due to the presence of fat in fp-AML, regardless of visibility. They hypothesized that despite the absence of visible fat in fp-AML, the presence of fat in the tumor results in a small but present difference in the damping histogram of the fp-AML and subtype RCCs. The results of the method for differentiating between fat-less aneurysmal lipoma and clear cell renal cell carcinoma using quantitative feature classification in a contrast enhanced multi-detector computed tomography image according to an embodiment of the present invention are as follows: Histograms also show similar results in that they may also be slightly different between fp-AML and RCC, which mainly results in the selection of histogram features associated with histogram characteristics of regions with bright brightness values. The remaining two texture features, GLCM sum entropy and GLRLM long-run emphasis, provide heterogeneous texture patterns within the tumor. A number of studies involving contrast-enhanced CT images have shown that although fp-AML exhibits a lower level of lesion heterogeneity than RCC, the difference is almost invisible and is only accessible by quantitative texture analysis . The degree of lesion heterogeneity can also be observed as an important feature for distinguishing between two types of SRM on CE CT images, as shown during the main process of selection of heterogeneity-related texture patterns.
둘째, 특징 분류에 있어서, 특징 선택 방법들과 분류기 모델들의 적합한 조합은 표 4 및 도 7 내지 도 9에 도시된 바와 같이, 양호한 분류 성능에 결정적이었다는 것이 확인되었다. 첫째, LR은, 사용된 특징 선택 방법에 상관없이, PCA 변환과 함께 최고의 성능을 보여주면서, 더 적은 수(NF)의 선택된 특징들을 가지고 뛰어난 성능을 보여주었다. 따라서, LR이 특징 값들의 가중된 조합을 계산함으로써 클래스 값을 예측하는 것을 고려하면, 중복된 특징들의 수를 감소시키는 것은 그것의 성능에 크리티컬한 영향을 미친다. 따라서, PCA 변환은 LR에 대한 가장 적합한 선택 방법인데, 그것은 원래의 특징 데이터로부터 중복성의 수준을 감소시키기 때문이다. 둘째, kNN은 AUC와 ReliefF 선택과 함께 NF에 관하여 비교적 일정한 점수를 보여주면서 다른 분류기 모델들에 비해 뛰어난 성능을 보여주었다. 단순한 kNN은, 클래스들이 주어진 특징 데이터에서 매우 오버랩된 경우, 다른 분류기들, 예를 들어, SVM과 RF보다 더 뛰어난 성능을 보여주는 것으로 알려져있다. 여기에서, 또한 두 클래스들의 SRM은 그것의 시각적 유사성 및 질감 유사성으로 인하여 특징 공간에서 매우 오버랩된다: 따라서, kNN은 다른 분류기 모델들 중에서 최상의 성능을 보여준다. kNN과는 대조적으로, SVM은 다른 분류기 선택 중에서 평균적인 성능을 보여주었다. SVM은 특징 공간을 상이한 클래스들로 분리하는 초평면을 계산함으로써 상이한 클래스들을 분류하기 때문에, 그것의 성능은 두 클래스들 간에 심한 오버랩에 의해 열화될 수 있다. 더욱이, PCA 변환을 사용하는 SVM의 성능은 NF>40인 경우 급격하게 감소되는 것으로 관찰되었다. 그것은, 단지 적은 수의 주 특징들만이 강조된 분포를 보여주고 반면에 나머지 특징들은 노이즈-유사 분포를 보여주기 때문에, 이들 중복된 특징들이 SVM 성능을 심각하게 저하시키는 것이라고 추론될 수 있다. 마지막으로, RF는 또한 사용된 특징 선택 방법에 상관없이 뛰어난 성능을 보여주었다: 하지만, 그것의 성능 능력은 다른 분류기들과는 대조적으로, NF가 감소함에 따라 감소하였다. 따라서, RF는 일반적으로 상기 특징들이 선택되지 않은 경우 더 나은 성능을 보여주었다. RF는 이미지 다중-트리 배깅(bagging) 프로세스들에서 특징 선택 단계들을 포함하기 때문에, RF는 부가적인 특징 선택 단계들을 필요로 하지 않고, RF가 고차원 특징 데이터에 더 적합한 경우 차원수 감소가 사실상 그것의 성능을 저하시키는 것으로 확인되었다. 결과적으로, 특징 공간의 분포 특성과 분류기 모델들의 거동으로 인하여, ReliefF+kNN 및 RF가 CE MDCT 영상에서 fp-AML과 ccRCC를 구별하기 위한 최상의 성능을 보여준 것으로 확인되었다.Second, in the feature classification, it has been confirmed that the proper combination of feature selection methods and classifier models is crucial for good classification performance, as shown in Table 4 and Figures 7-9. First, LR showed excellent performance with fewer (N F ) selected features, showing the best performance with PCA conversion, regardless of the feature selection method used. Thus, considering the prediction of class values by calculating a weighted combination of feature values, reducing the number of redundant features has a critical impact on its performance. Thus, PCA transformation is the most appropriate selection method for LR, because it reduces the level of redundancy from the original feature data. Second, kNN showed a relatively consistent score with respect to N F with AUC and ReliefF selection, and showed better performance than other classifier models. A simple kNN is known to show better performance than other classifiers, e.g., SVM and RF, when the classes are highly overlapped in the given feature data. Here too, the SRM of both classes is highly overlapped in the feature space due to its visual similarity and texture similarity: Thus, kNN shows the best performance among other classifier models. In contrast to kNN, SVM showed average performance among other classifier choices. Since the SVM classifies different classes by computing hyperplanes separating the feature space into different classes, its performance can be degraded by severe overlap between the two classes. Furthermore, the performance of SVMs using PCA transformations was observed to decrease dramatically when N F > 40. It can be inferred that these redundant features severely degrade the SVM performance, since only a small number of main features show an emphasized distribution while the remaining features show a noise-like distribution. Finally, RF also showed excellent performance regardless of the feature selection method used: however, its performance capability decreased as N F decreased, as opposed to other classifiers. Thus, RF generally showed better performance when these features were not selected. Because RF includes feature selection steps in image multi-tree bagging processes, RF does not require additional feature selection steps, and can be implemented in a way that if RF is more suitable for high dimensional feature data, It was confirmed that the performance deteriorated. As a result, ReliefF + kNN and RF showed the best performance to distinguish fp-AML from ccRCC in CE MDCT images due to the distribution of feature space and the behavior of classifier models.
결론conclusion
본 발명의 일 실시예에 의한 조영 증강된 다중검출 컴퓨터 단층 촬영 영상에서 정량적 특징 분류를 사용하여 지방이 적은 혈관근지방종과 투명세포 신세포암을 구별하기 위한 방법에 의하면, 신장 CE MDCT 영상에서 fp-AML과 ccRCC의 히스토그램 및 질감 특징들을 분리할 수 있다. 첫째, 기본적인 히스토그램 특성들, 어떤 임계값을 넘는 픽셀들의 백분율, 백분위 밝기값들, GLCM 질감들, GLRLM 질감들 및 LBP 특징들을 포함하여, 히스토그램 및 질감 특징들이 종양 ROI로부터 추출되었다. 이들 특징들을 가지고, 다양한 분류 방법들(LR, kNN, SVM 및 RF)에 따른 다양한 특징 선택 방법들(AUC 분석, ReliefF 선택 및 PCA 변환)이 fp-AML과 ccRCC을 구별하는데 적용되었다. 임상 데이터 세트에 대한 실험에서, 최대 밝기값, 190과 210의 임계값을 넘는 포지티브 픽셀들의 백분율, 75%와 95%의 백분위 밝기값, 및 GLCM 합 엔트로피(sum entropy)와 GLRLM 롱-런 엠퍼시스(long-run emphasis)를 포함하여, 밝은 밝기값 영역들의 히스토그램 특성들 및 질감 이질성에 기반하여 7개의 특징들이 두 유형의 SRM을 구별하기 위한 핵심적인 특징으로서 선택되었다. 이들 특징 선택과 분류 방법들의 선택 중에서, ReliefF 선택을 갖는 kNN 및 RF 분류가 두 SRM의 히스토그램 및 질감 패턴들을 분류하는데 있어서 최상의 성능을 보여주었는데, ReliefF+kNN 및 ReliefF+RF의 AUC 값들은 각각 0.782 및 0.780이었다. 실험 결과를 통해, 본 발명의 일 실시예에 의한 조영 증강된 다중검출 컴퓨터 단층 촬영 영상에서 정량적 특징 분류를 사용하여 지방이 적은 혈관근지방종과 투명세포 신세포암을 구별하기 위한 방법이 양성 SRM과 악성 SRM을 구별하기 위하여 정량적인 영상 특징들을 평가하는데 사용될 수 있다는 것을 확인하였다.According to a method for distinguishing between a fat-poor angiomyolipoma and a clear cell renal cell carcinoma using quantitative feature classification in a contrast enhanced multi-detection computed tomography image according to an embodiment of the present invention, in a renal CE MDCT image, -Histogram and texture features of AML and ccRCC can be separated. First, histogram and texture features were extracted from the tumor ROI, including basic histogram characteristics, percent of pixels over a certain threshold, percentile brightness values, GLCM textures, GLRLM textures, and LBP features. With these characteristics, various feature selection methods (AUC analysis, ReliefF selection and PCA conversion) according to various classification methods (LR, kNN, SVM and RF) have been applied to distinguish fp-AML from ccRCC. In experiments on clinical data sets, the maximum brightness values, the percentage of positive pixels above the threshold of 190 and 210, the percentile brightness values of 75% and 95%, and the GLCM sum entropy and GLRLM long- Seven features have been selected as key features to distinguish between the two types of SRMs, based on histogram properties and texture heterogeneity of light brightness value regions, including long-run emphasis. Among these feature selection and selection of classification methods, kNN and RF classification with ReliefF selection showed the best performance in classifying the histogram and texture patterns of two SRMs. The AUC values of ReliefF + kNN and ReliefF + RF were 0.782 0.780. Based on the experimental results, a method for discriminating between fat-less aneurysmal lipoma and transparent cell renal cell carcinoma using quantitative feature classification in contrast enhanced multi-detector computed tomography images according to an embodiment of the present invention is described as a positive SRM It can be used to evaluate quantitative image features to differentiate malignant SRMs.
본 발명의 일 실시예에 의한 조영 증강된 다중검출 컴퓨터 단층 촬영 영상에서 정량적 특징 분류를 사용하여 지방이 적은 혈관근지방종과 투명세포 신세포암을 구별하기 위한 방법은 제어부 및 메모리를 포함하는 장치에서 제어부에 의해 수행될 수 있다.A method for distinguishing an aneurysmal lipoma of low fat from a clear cell renal cell cancer using quantitative feature classification in a contrast enhanced multi-detection computed tomography image according to an embodiment of the present invention includes a controller and a memory May be performed by a control unit.
이상 본 발명을 구체적인 실시예를 통하여 상세하게 설명하였으나, 이는 본 발명을 구체적으로 설명하기 위한 것으로, 본 발명은 이에 한정되지 않으며, 본 발명의 기술적 사상 내에서 당 분야의 통상의 지식을 가진 자에 의해 그 변형이나 개량이 가능함은 명백하다고 할 것이다.While the present invention has been particularly shown and described with reference to exemplary embodiments thereof, it is to be understood that the invention is not limited to the disclosed exemplary embodiments. It is clear that the present invention can be modified or improved.
본 발명의 단순한 변형 내지 변경은 모두 본 발명의 영역에 속하는 것으로, 본 발명의 구체적인 보호 범위는 첨부된 청구범위에 의하여 명확해질 것이다.It will be understood by those skilled in the art that various changes in form and details may be made therein without departing from the spirit and scope of the invention as defined by the appended claims.
S200 : 특징 추출 단계
S202 : 특징 선택 및 분류 방법 선택 단계
S204 : 분류 모델 획득 단계
S206 : 테스트 영상에서 분류 특징 추출 단계
S208 : fp-AML과 ccRCC 구별 단계
S210 : 특징 추출 단계
S212 : 특징 선택 단계
S214 : 특징 분류 단계S200: Feature extraction step
S202: Step of selecting a feature and selecting a classification method
S204: Classification model acquisition step
S206: Classification feature extraction step in the test image
S208: Step for distinguishing fp-AML from ccRCC
S210: Feature extraction step
S212: Feature selection step
S214: Character classification step
Claims (5)
(b) 상기 추출된 특징들을 복수의 특징 선택 방법과 복수의 기계 학습 기반의 분류 방법의 조합에 적용하여 최상의 분류 성능을 나타내는 특징들 및 분류 방법을 각각 최적의 분류 특징들 및 최적의 기계 학습 분류 방법으로서 선택하는 단계;
(c) 상기 선택된 분류 특징들을 상기 선택된 기계 학습 분류 방법에 적용하여 분류 모델을 획득하는 단계;
(d) 조영 증강된 다중검출 컴퓨터 단층 촬영 테스트 영상에서 분리된 신장 종양 영역으로부터 상기 최적의 분류 특징들을 추출하는 단계; 및
(e) 상기 추출된 최적의 분류 특징들을 상기 분류 모델에 적용하여 지방이 적은 혈관근지방종(fp-AML)과 투명세포 신세포암(ccRCC)을 구별하는 단계를 포함하는, 조영 증강된 다중검출 컴퓨터 단층 촬영 영상에서 정량적 특징 분류를 사용하여 지방이 적은 혈관근지방종과 투명세포 신세포암을 구별하기 위한 방법.(a) extracting histogram features, brightness value percentage features, and texture features from a separate kidney tumor region in a plurality of contrast enhanced multiple detection computerized tomography (MDCT) training images;
(b) applying the extracted features to a combination of a plurality of feature selection methods and a plurality of machine learning-based classification methods to classify features and classification methods that exhibit the best classification performance as optimal classification features and optimal machine learning classification Selecting as a method;
(c) applying the selected classification features to the selected machine learning classification method to obtain a classification model;
(d) extracting the optimal classification features from the isolated kidney tumor region in a contrast enhanced multi-detector computed tomography test image; And
(e) applying the extracted best-fit classification features to the classification model to distinguish between low-fat, angiomatous lipoma (fp-AML) and clear cell renal cell carcinoma (ccRCC) METHODS FOR DIFFERENTIATING TRANSITIONAL CELL CARCINOMA WITH LIVER AMBULANCE LYMPHOCYTE USING QUALITATIVE FEATURE CLASSIFICATIONS IN COMPUTER TOMOGRAPHIC IMAGES.
상기 단계 (b)에서 상기 최적의 분류 특징들을 선택하는 단계는,
(b-1) 곡선 아래 면적(AUC: area-under curve) 분석, ReliefF 특징 선택 방법 및 주 성분 분석(PCA: principal component analysis)에 따라 각각 20개의 특징들을 선택하는 단계; 및
(b-2) 상기 곡선 아래 면적(AUC: area-under curve) 분석에 의해 선택된 특징들과, 상기 ReliefF 특징 선택 방법에 의해 선택된 특징들 및 상기 주 성분 분석(PCA: principal component analysis)에 의해 선택된 특징들 중 공통적인 특징들을 상기 최적의 분류 특징들로서 선택하는 단계를 포함하는, 조영 증강된 다중검출 컴퓨터 단층 촬영 영상에서 정량적 특징 분류를 사용하여 지방이 적은 혈관근지방종과 투명세포 신세포암을 구별하기 위한 방법.The method according to claim 1,
Wherein the selecting of the optimal classification features in step (b)
selecting 20 features according to an area-under curve (AUC) analysis, a ReliefF feature selection method, and a principal component analysis (PCA); And
(b-2) selecting features selected by the area-under curve analysis (AUC), features selected by the ReliefF feature selection method and selected by the principal component analysis (PCA) Discriminating an aneurysmal lipoma of low fat and clear cell renal cell carcinoma using quantitative characterization in a contrast enhanced multi-detector computed tomography image, comprising selecting common features among the features as the optimal classification features Lt; / RTI >
상기 최적의 분류 특징들은,
최대 밝기값, 190과 210의 임계값을 넘는 포지티브 픽셀들의 백분율, 75%와 95%의 백분위 밝기값, 및 GLCM 합 엔트로피(sum entropy)와 GLRLM 롱-런 엠퍼시스(long-run emphasis)를 포함하는, 조영 증강된 다중검출 컴퓨터 단층 촬영 영상에서 정량적 특징 분류를 사용하여 지방이 적은 혈관근지방종과 투명세포 신세포암을 구별하기 위한 방법.The method of claim 2,
The optimal classification features include,
A maximum brightness value, a percentage of positive pixels above the threshold of 190 and 210, a percentile brightness value of 75% and 95%, and a GLCM sum entropy and GLRLM long-run emphasis A method for differentiating between low fat, aneurysmal lipoma and clear cell renal cell carcinoma using quantitative characterization in contrast enhanced multisection computed tomography images.
상기 최적의 기계 학습 기반의 분류 방법은,
k-근접 이웃(kNN; k nearest neighbor) 분류 방법 또는 랜덤-포레스트(RF: random forest) 분류 방법을 포함하는, 조영 증강된 다중검출 컴퓨터 단층 촬영 영상에서 정량적 특징 분류를 사용하여 지방이 적은 혈관근지방종과 투명세포 신세포암을 구별하기 위한 방법.The method according to claim 1,
The optimal machine learning based classification method comprises:
using a quantitative feature classification on contrast enhanced multi-detector computed tomography images, including k-nearest neighbor classification (kNN) or random-forest (RF) classification methods, A method for distinguishing between lipoma and clear cell renal cell carcinoma.
상기 복수의 조영 증강된 다중검출 컴퓨터 단층 촬영(MDCT) 트레이닝 영상들은 지방이 적은 혈관근지방종(fp-AML)을 갖는 환자들로부터 획득된 트레이닝 영상들 및 투명세포 신세포암(ccRCC)을 갖는 환자들로부터 획득된 트레이닝 영상들을 포함하는, 조영 증강된 다중검출 컴퓨터 단층 촬영 영상에서 정량적 특징 분류를 사용하여 지방이 적은 혈관근지방종과 투명세포 신세포암을 구별하기 위한 방법.The method according to claim 1,
The plurality of contrast enhanced multi-detection computerized tomography (MDCT) training images are obtained from training images obtained from patients with low-fat angioplasticoma (fp-AML) and patients with clear cell renal cell carcinoma (ccRCC) A method for distinguishing between an adipocyte lipoma of low fat and clear cell renal cell carcinoma using quantitative feature classification in a contrast enhanced multi-detector computed tomography image, comprising training images obtained from the subject.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| KR1020170002050A KR101824691B1 (en) | 2017-01-05 | 2017-01-05 | Method for differentiation of fat-poor angiomyolipoma from clear cell renal cell carcinoma in contrast-enhanced mdct images using quantitative feature classification |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| KR1020170002050A KR101824691B1 (en) | 2017-01-05 | 2017-01-05 | Method for differentiation of fat-poor angiomyolipoma from clear cell renal cell carcinoma in contrast-enhanced mdct images using quantitative feature classification |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| KR101824691B1 true KR101824691B1 (en) | 2018-02-02 |
Family
ID=61223136
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| KR1020170002050A Active KR101824691B1 (en) | 2017-01-05 | 2017-01-05 | Method for differentiation of fat-poor angiomyolipoma from clear cell renal cell carcinoma in contrast-enhanced mdct images using quantitative feature classification |
Country Status (1)
| Country | Link |
|---|---|
| KR (1) | KR101824691B1 (en) |
Cited By (9)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR102009233B1 (en) * | 2018-11-28 | 2019-08-09 | 아주대학교산학협력단 | Apparatus for predicting liver fibrosis using ct image analysis and method thereof |
| KR102067340B1 (en) * | 2018-07-16 | 2020-01-16 | 한국과학기술원 | Method for generating breast masses according to the lesion characteristics and the system thereof |
| KR20200080626A (en) * | 2018-12-27 | 2020-07-07 | 연세대학교 산학협력단 | Method for providing information of lesion diagnosis and device for providing information of lesion diagnosis using the same |
| CN112784855A (en) * | 2021-01-28 | 2021-05-11 | 佛山科学技术学院 | PCA-based retina layering method for accelerating random forest training |
| CN113545317A (en) * | 2021-07-23 | 2021-10-26 | 武汉赛尔朗灵科技有限公司 | Human renal vascular smooth muscle lipoma PCDX mouse model and establishing method thereof |
| KR20210138932A (en) * | 2020-05-13 | 2021-11-22 | 연세대학교 산학협력단 | Method for providing information of lesions on the ear and device for providing information of lesions on the ear using the same |
| KR20210145359A (en) * | 2020-05-25 | 2021-12-02 | 연세대학교 산학협력단 | Method for providing information on diagnosing renal failure and device using the same |
| CN115082465A (en) * | 2022-08-22 | 2022-09-20 | 南通玖溯环保科技有限公司 | Wool and cashmere classification method based on scanning electron microscope image processing |
| KR20220135942A (en) * | 2021-03-31 | 2022-10-07 | 고려대학교 산학협력단 | Dignosis apparatus for renal cancer |
Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2007216007A (en) * | 2006-01-25 | 2007-08-30 | Siemens Medical Solutions Usa Inc | Method and system for labeling and identifying lymph node in medical image |
| KR20120056312A (en) * | 2010-11-01 | 2012-06-04 | 전남대학교산학협력단 | System for detecting pulmonary embolism and method therefor |
-
2017
- 2017-01-05 KR KR1020170002050A patent/KR101824691B1/en active Active
Patent Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2007216007A (en) * | 2006-01-25 | 2007-08-30 | Siemens Medical Solutions Usa Inc | Method and system for labeling and identifying lymph node in medical image |
| KR20120056312A (en) * | 2010-11-01 | 2012-06-04 | 전남대학교산학협력단 | System for detecting pulmonary embolism and method therefor |
Non-Patent Citations (3)
| Title |
|---|
| 김창수 외5인, 컴퓨터 단층영상에서 TIA를 이용한 간경화의 컴퓨터 보조진단, 한국콘텐츠학회논문지, vol 12 no. 4, 2012.3.9 * |
| 논문:CHAO LI ET AL., * |
| 논문:LEE HS ET AL., * |
Cited By (14)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR102067340B1 (en) * | 2018-07-16 | 2020-01-16 | 한국과학기술원 | Method for generating breast masses according to the lesion characteristics and the system thereof |
| KR102009233B1 (en) * | 2018-11-28 | 2019-08-09 | 아주대학교산학협력단 | Apparatus for predicting liver fibrosis using ct image analysis and method thereof |
| WO2020111493A1 (en) * | 2018-11-28 | 2020-06-04 | 아주대학교산학협력단 | Device for predicting liver fibrosis by using ct image analysis and method therefor |
| KR20200080626A (en) * | 2018-12-27 | 2020-07-07 | 연세대학교 산학협력단 | Method for providing information of lesion diagnosis and device for providing information of lesion diagnosis using the same |
| KR102209382B1 (en) * | 2018-12-27 | 2021-01-28 | 연세대학교 산학협력단 | Method for providing information of lesion diagnosis and device for providing information of lesion diagnosis using the same |
| KR102344084B1 (en) * | 2020-05-13 | 2021-12-27 | 연세대학교 산학협력단 | Method for providing information of lesions on the ear and device for providing information of lesions on the ear using the same |
| KR20210138932A (en) * | 2020-05-13 | 2021-11-22 | 연세대학교 산학협력단 | Method for providing information of lesions on the ear and device for providing information of lesions on the ear using the same |
| KR20210145359A (en) * | 2020-05-25 | 2021-12-02 | 연세대학교 산학협력단 | Method for providing information on diagnosing renal failure and device using the same |
| KR102472886B1 (en) * | 2020-05-25 | 2022-12-01 | 연세대학교 산학협력단 | Method for providing information on diagnosing renal failure and device using the same |
| CN112784855A (en) * | 2021-01-28 | 2021-05-11 | 佛山科学技术学院 | PCA-based retina layering method for accelerating random forest training |
| KR20220135942A (en) * | 2021-03-31 | 2022-10-07 | 고려대학교 산학협력단 | Dignosis apparatus for renal cancer |
| KR102557802B1 (en) | 2021-03-31 | 2023-07-21 | 고려대학교 산학협력단 | Dignosis apparatus for renal cancer |
| CN113545317A (en) * | 2021-07-23 | 2021-10-26 | 武汉赛尔朗灵科技有限公司 | Human renal vascular smooth muscle lipoma PCDX mouse model and establishing method thereof |
| CN115082465A (en) * | 2022-08-22 | 2022-09-20 | 南通玖溯环保科技有限公司 | Wool and cashmere classification method based on scanning electron microscope image processing |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| KR101824691B1 (en) | Method for differentiation of fat-poor angiomyolipoma from clear cell renal cell carcinoma in contrast-enhanced mdct images using quantitative feature classification | |
| Lee et al. | Differentiation of fat‐poor angiomyolipoma from clear cell renal cell carcinoma in contrast‐enhanced MDCT images using quantitative feature classification | |
| Gurcan et al. | Lung nodule detection on thoracic computed tomography images: Preliminary evaluation of a computer‐aided diagnosis system | |
| Garapati et al. | Urinary bladder cancer staging in CT urography using machine learning | |
| KR102058348B1 (en) | Apparatus and method for classification of angiomyolipoma wihtout visible fat and clear cell renal cell carcinoma in ct images using deep learning and sahpe features | |
| CN109447065B (en) | Method and device for identifying mammary gland image | |
| Abdel-Nasser et al. | Analysis of tissue abnormality and breast density in mammographic images using a uniform local directional pattern | |
| US8687867B1 (en) | Computer-aided detection and classification of suspicious masses in breast imagery | |
| El-Baz et al. | Automatic detection of 2D and 3D lung nodules in chest spiral CT scans | |
| Park et al. | Computer-aided detection of early interstitial lung diseases using low-dose CT images | |
| Shi et al. | Characterization of mammographic masses based on level set segmentation with new image features and patient information | |
| US5872859A (en) | Training/optimization of computer aided detection schemes based on measures of overall image quality | |
| Delogu et al. | Characterization of mammographic masses using a gradient-based segmentation algorithm and a neural classifier | |
| US20170221201A1 (en) | Medical image processing apparatus and breast image processing method thereof | |
| JPH11501538A (en) | Method and system for detecting lesions in medical images | |
| Jacobs et al. | Computer-aided detection of ground glass nodules in thoracic CT images using shape, intensity and context features | |
| Akram et al. | Pulmonary nodules detection and classification using hybrid features from computerized tomographic images | |
| TWI587844B (en) | Medical image processing apparatus and breast image processing method thereof | |
| Sarath et al. | A two-stage multiple instance learning framework for the detection of breast cancer in mammograms | |
| Loizidou et al. | Identification and classification of benign and malignant masses based on subtraction of temporally sequential digital mammograms | |
| Lee et al. | Potential of computer-aided diagnosis to improve CT lung cancer screening | |
| Helal et al. | Validation of artificial intelligence contrast mammography in diagnosis of breast cancer: Relationship to histopathological results | |
| Karale et al. | A screening CAD tool for the detection of microcalcification clusters in mammograms | |
| Loizidou et al. | Benign and malignant breast mass detection and classification in digital mammography: The effect of subtracting temporally consecutive mammograms | |
| Alolfe et al. | Development of a computer-aided classification system for cancer detection from digital mammograms |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20170105 |
|
| PA0201 | Request for examination | ||
| E701 | Decision to grant or registration of patent right | ||
| PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20180122 |
|
| GRNT | Written decision to grant | ||
| PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20180126 Patent event code: PR07011E01D |
|
| PR1002 | Payment of registration fee |
Payment date: 20180129 End annual number: 3 Start annual number: 1 |
|
| PG1601 | Publication of registration | ||
| PR1001 | Payment of annual fee |
Payment date: 20210126 Start annual number: 4 End annual number: 4 |
|
| PR1001 | Payment of annual fee |
Payment date: 20220103 Start annual number: 5 End annual number: 5 |
|
| PR1001 | Payment of annual fee |
Payment date: 20221226 Start annual number: 6 End annual number: 6 |
|
| PR1001 | Payment of annual fee |
Payment date: 20231219 Start annual number: 7 End annual number: 7 |