KR102570278B1 - 교사 모델로부터 학생 모델을 트레이닝하는데 사용되는 학습 데이터를 생성하는 장치 및 방법 - Google Patents
교사 모델로부터 학생 모델을 트레이닝하는데 사용되는 학습 데이터를 생성하는 장치 및 방법 Download PDFInfo
- Publication number
- KR102570278B1 KR102570278B1 KR1020170096902A KR20170096902A KR102570278B1 KR 102570278 B1 KR102570278 B1 KR 102570278B1 KR 1020170096902 A KR1020170096902 A KR 1020170096902A KR 20170096902 A KR20170096902 A KR 20170096902A KR 102570278 B1 KR102570278 B1 KR 102570278B1
- Authority
- KR
- South Korea
- Prior art keywords
- probability
- data
- model
- label
- input data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/30—Authentication, i.e. establishing the identity or authorisation of security principals
- G06F21/31—User authentication
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/096—Transfer learning
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
- G06F18/2148—Generating training patterns; Bootstrap methods, e.g. bagging or boosting characterised by the process organisation or structure, e.g. boosting cascade
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/217—Validation; Performance evaluation; Active pattern learning techniques
- G06F18/2178—Validation; Performance evaluation; Active pattern learning techniques based on feedback of a supervisor
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/047—Probabilistic or stochastic networks
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0495—Quantised networks; Sparse networks; Compressed networks
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/09—Supervised learning
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N7/00—Computing arrangements based on specific mathematical models
- G06N7/01—Probabilistic graphical models, e.g. probabilistic networks
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/778—Active pattern-learning, e.g. online learning of image or video features
- G06V10/7784—Active pattern-learning, e.g. online learning of image or video features based on feedback from supervisors
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Data Mining & Analysis (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Databases & Information Systems (AREA)
- Multimedia (AREA)
- Computer Security & Cryptography (AREA)
- Medical Informatics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Probability & Statistics with Applications (AREA)
- Computer Hardware Design (AREA)
- Computational Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Algebra (AREA)
- Image Analysis (AREA)
Abstract
Description
도 2는 일실시예에 따른 학습 데이터 생성 장치가 레이블 값들을 정제하여 학습 데이터를 생성하는 동작을 설명하기 위한 흐름도이다.
도 3은 일실시예에 따른 학습 데이터 생성 장치가 생성한 학습 데이터를 이용하여 학생 모델을 트레이닝하는 동작을 설명하기 위한 흐름도이다.
도 4는 일실시예에 따른 학습 데이터 생성 장치에 의해 학습된 학생 모델을 이용하는 데이터 인식 장치가 수행하는 동작을 설명하기 위한 흐름도이다.
도 5는 다른 일실시예에 따른 학습 데이터 생성 장치가 사전에 트레이닝된 교사 모델 앙상블을 이용하여 학생 모델을 트레이닝하는 동작을 개략적으로 설명하기 위한 도면이다.
도 6은 일실시예에 따른 학습 데이터 생성 장치의 구조를 개념적으로 도시한 도면이다.
도 7은 일실시예에 따른 데이터 인식 장치의 구조를 개념적으로 도시한 도면이다.
120: 교사 모델
130: 레이블 값들
140: 변경된 레이블 값들
150: 학생 모델
Claims (13)
- 학습 데이터 생성 장치가 입력 데이터를 교사 모델에 입력하여, 상기 교사 모델로부터 상기 입력 데이터에 대한 레이블 값을 획득하는 단계;
상기 학습 데이터 생성 장치가 상기 레이블 값을 복수의 확률 임계치와 비교하여, 상기 레이블 값을 상기 복수의 확률 임계치로 구분되는 복수의 구간 중 어느 하나로 분류하는 단계; 및
상기 학습 데이터 생성 장치가 상기 레이블 값이 분류된 구간의 식별자 및 상기 입력 데이터를 병합하여, 상기 교사 모델에 대응하는 학생 모델-상기 학생 모델은, 상기 교사 모델과 별개의 모델임.-을 트레이닝하기 위한 학습 데이터를 생성하는 단계
를 포함하고
상기 레이블 값은,
상기 교사 모델로부터 예측된 상기 입력 데이터가 클래스들 각각에 대응하는 확률 값을 포함하고,
상기 복수의 구간은,
0보다 큰 제1 확률 임계치 이상이고, 1보다 작은 제2 확률 임계치-상기 제2 확률 임계치는, 상기 제1 확률 임계치보다 큼- 이하인 무시(ignore) 구간을 포함하고,
상기 분류하는 단계는,
상기 레이블 값이 상기 제1 확률 임계치 이상이고, 상기 제2 확률 임계치 이하인 경우, 상기 레이블 값을 상기 학생 모델의 트레이닝에 적용하지 않는 상기 무시 구간으로 분류하는,
학습 데이터 생성 방법. - 제1항에 있어서,
상기 분류하는 단계는,
상기 레이블 값이 상기 제2 확률 임계치 이상인 경우, 상기 레이블 값을 상기 복수의 구간 중에서 상기 입력 데이터가 상기 레이블 값과 관련된 클래스에 대응함을 나타내는 긍정(positive) 구간으로 분류하는 학습 데이터 생성 방법. - 제1항에 있어서,
상기 분류하는 단계는,
상기 레이블 값이 상기 제1 확률 임계치 이하인 경우, 상기 레이블 값을 상기 복수의 구간 중에서 상기 입력 데이터가 상기 레이블 값과 관련된 클래스에 대응하지 않음을 나타내는 부정(negative) 구간으로 분류하는 학습 데이터 생성 방법. - 삭제
- 제1항에 있어서,
상기 학생 모델은,
상기 교사 모델에 포함된 히든 레이어의 수 이하의 히든 레이어를 포함하거나 또는 상기 교사 모델에 포함된 필터의 수 이하의 필터를 포함하는 학습 데이터 생성 방법. - 데이터 인식 장치가 인식하고자 하는 대상 데이터를 수신하는 단계; 및
상기 데이터 인식 장치가 트레이닝된 학생 모델을 이용하여 상기 대상 데이터를 인식하는 단계
를 포함하고,
상기 학생 모델은,
상기 학생 모델에 대응하는 교사 모델-상기 교사 모델은, 상기 학생 모델과 별개의 모델임.-에 입력 데이터를 입력함으로써 획득된 레이블 값을 복수의 확률 임계치로 구분되는 복수의 구간 중 어느 하나로 분류한 결과에 기초하여 생성된 학습 데이터에 의해 트레이닝되고,
상기 학습 데이터는,
학습 데이터 생성 장치가 상기 학생 모델에 대응하는 교사 모델에 의해 입력 데이터가 클래스들 각각에 대응하는 확률 값을 포함하는 레이블 값을 예측하고,
상기 학습 데이터 생성 장치가 상기 레이블 값을 복수의 확률 임계치와 비교하여, 상기 레이블 값을 상기 복수의 확률 임계치로 구분되는 복수의 구간 중 어느 하나로 분류하고,
상기 학습 데이터 생성 장치가 상기 레이블 값이 분류된 구간의 식별자 및 상기 입력 데이터를 병합하여 생성되고,
상기 레이블 값이 0보다 큰 제1 확률 임계치 이상이고, 1보다 작은 제2 확률 임계치-상기 제2 확률 임계치는, 상기 제1 확률 임계치보다 큼- 이하인 무시(ignore) 구간으로 분류된 경우, 상기 레이블 값이 상기 학생 모델의 트레이닝에 적용되지 않는,
데이터 인식 방법. - 삭제
- 제6항에 있어서,
상기 교사 모델은,
상기 학생 모델에 포함된 히든 레이어의 수 이상의 히든 레이어를 포함하거나 또는 상기 학생 모델에 포함된 필터의 수 이상의 필터를 포함하는 데이터 인식 방법. - 입력 데이터를 저장하는 메모리; 및
프로세서
를 포함하고,
상기 프로세서는,
상기 입력 데이터를 하나 이상의 교사 모델에 입력하여, 상기 하나 이상의 교사 모델에 의해 결정되는 상기 입력 데이터가 복수의 클래스들 각각에 대응하는 확률 값을 포함하는 확률 레이블을 획득하고,
상기 확률 레이블에 포함된 확률들을 복수의 확률 임계치와 비교하여, 상기 확률 레이블에 포함된 확률들을 상기 복수의 확률 임계치와 비교한 결과 값으로 변경하고,
상기 입력 데이터 및 상기 변경된 확률 레이블을 병합하여, 상기 하나 이상의 교사 모델에 대응하는 학생 모델-상기 학생 모델은, 상기 교사 모델과 별개의 모델임.-을 트레이닝하기 위한 학습 데이터를 생성하고,
상기 프로세서는,
상기 확률 레이블에 포함된 확률이 0보다 큰 제1 확률 임계치 이상이고, 1보다 작은 제2 확률 임계치-상기 제2 확률 임계치는, 상기 제1 확률 임계치보다 큼- 이하인 경우, 상기 학생 모델의 트레이닝에 상기 확률을 사용하지 않을 것을 나타내는 무시(ignore) 값으로 변경하는, 학습 데이터 생성 장치. - 제9항에 있어서,
상기 프로세서는,
상기 확률 레이블에 포함된 확률들 중에서 상기 제2 확률 임계치 이상인 확률을, 상기 입력 데이터가 상기 확률에 대응하는 클래스에 매칭됨을 나타내는 긍정(positive) 값으로 변경하는 학습 데이터 생성 장치. - 제9항에 있어서,
상기 프로세서는,
상기 확률 레이블에 포함된 확률들 중에서 제1 확률 임계치 이하인 확률을, 상기 입력 데이터가 상기 확률에 대응하는 클래스에 매칭되지 않음을 나타내는 부정(negative) 값으로 변경하는 학습 데이터 생성 장치. - 삭제
- 제9항에 있어서,
상기 프로세서는,
상기 입력 데이터를 복수의 교사 모델에 입력하는 경우, 상기 복수의 교사 모델을 포함하는 교사 모델 앙상블에 기초하여 상기 확률 레이블을 획득하는 학습 데이터 생성 장치.
Priority Applications (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| KR1020170096902A KR102570278B1 (ko) | 2017-07-31 | 2017-07-31 | 교사 모델로부터 학생 모델을 트레이닝하는데 사용되는 학습 데이터를 생성하는 장치 및 방법 |
| US15/933,609 US12039016B2 (en) | 2017-07-31 | 2018-03-23 | Method and apparatus for generating training data to train student model using teacher model |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| KR1020170096902A KR102570278B1 (ko) | 2017-07-31 | 2017-07-31 | 교사 모델로부터 학생 모델을 트레이닝하는데 사용되는 학습 데이터를 생성하는 장치 및 방법 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| KR20190013011A KR20190013011A (ko) | 2019-02-11 |
| KR102570278B1 true KR102570278B1 (ko) | 2023-08-24 |
Family
ID=65038060
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| KR1020170096902A Active KR102570278B1 (ko) | 2017-07-31 | 2017-07-31 | 교사 모델로부터 학생 모델을 트레이닝하는데 사용되는 학습 데이터를 생성하는 장치 및 방법 |
Country Status (2)
| Country | Link |
|---|---|
| US (1) | US12039016B2 (ko) |
| KR (1) | KR102570278B1 (ko) |
Families Citing this family (54)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CA3085717C (en) * | 2017-12-14 | 2023-04-18 | Google Llc | Qubit calibration |
| CN108830288A (zh) * | 2018-04-25 | 2018-11-16 | 北京市商汤科技开发有限公司 | 图像处理方法、神经网络的训练方法、装置、设备及介质 |
| US10936628B2 (en) * | 2018-05-30 | 2021-03-02 | International Business Machines Corporation | Automatic processing of ambiguously labeled data |
| US10699194B2 (en) * | 2018-06-01 | 2020-06-30 | DeepCube LTD. | System and method for mimicking a neural network without access to the original training dataset or the target model |
| US11907854B2 (en) | 2018-06-01 | 2024-02-20 | Nano Dimension Technologies, Ltd. | System and method for mimicking a neural network without access to the original training dataset or the target model |
| US11741355B2 (en) * | 2018-07-27 | 2023-08-29 | International Business Machines Corporation | Training of student neural network with teacher neural networks |
| US11610108B2 (en) * | 2018-07-27 | 2023-03-21 | International Business Machines Corporation | Training of student neural network with switched teacher neural networks |
| US10602207B2 (en) * | 2018-08-03 | 2020-03-24 | Facebook, Inc. | Neural network based content distribution in an online system |
| US11487997B2 (en) * | 2018-10-04 | 2022-11-01 | Visa International Service Association | Method, system, and computer program product for local approximation of a predictive model |
| US12330646B2 (en) | 2018-10-18 | 2025-06-17 | Autobrains Technologies Ltd | Off road assistance |
| US10748038B1 (en) | 2019-03-31 | 2020-08-18 | Cortica Ltd. | Efficient calculation of a robust signature of a media unit |
| KR20200052444A (ko) | 2018-10-30 | 2020-05-15 | 삼성전자주식회사 | 신경망을 이용하여 예측 결과를 출력하는 방법, 신경망을 생성하는 방법 및 그 장치들 |
| CN113056748A (zh) * | 2018-11-28 | 2021-06-29 | 惠普发展公司,有限责任合伙企业 | 使用深度神经网络的输出的基于事件的处理 |
| CN111598113A (zh) * | 2019-02-20 | 2020-08-28 | 富士通株式会社 | 模型优化方法、数据识别方法和数据识别装置 |
| US11694088B2 (en) * | 2019-03-13 | 2023-07-04 | Cortica Ltd. | Method for object detection using knowledge distillation |
| GB2598052B (en) * | 2019-03-22 | 2023-03-15 | Ibm | Unification of models having respective target classes with distillation |
| CN110046707B (zh) * | 2019-04-15 | 2021-08-06 | 清华大学深圳研究生院 | 一种神经网络模型的评估优化方法和系统 |
| CN111832787B (zh) * | 2019-04-23 | 2022-12-09 | 北京新唐思创教育科技有限公司 | 教师风格预测模型的训练方法及计算机存储介质 |
| KR20200128938A (ko) * | 2019-05-07 | 2020-11-17 | 삼성전자주식회사 | 모델 학습 방법 및 장치 |
| CN110390352A (zh) * | 2019-06-26 | 2019-10-29 | 华中科技大学 | 一种基于相似性哈希的图像暗数据价值评估方法 |
| JP7405145B2 (ja) * | 2019-09-05 | 2023-12-26 | 日本電気株式会社 | モデル生成装置、モデル生成方法、及び、プログラム |
| CN110826344B (zh) * | 2019-10-24 | 2022-03-01 | 北京小米智能科技有限公司 | 神经网络模型压缩方法、语料翻译方法及其装置 |
| US20210158156A1 (en) * | 2019-11-21 | 2021-05-27 | Google Llc | Distilling from Ensembles to Improve Reproducibility of Neural Networks |
| CN111104482A (zh) * | 2019-12-18 | 2020-05-05 | 北京百度网讯科技有限公司 | 数据处理方法和装置 |
| US11727248B2 (en) | 2020-04-07 | 2023-08-15 | NEC Laboratories Europe GmbH | Interpretable node embedding |
| EP4145386A4 (en) * | 2020-04-30 | 2023-10-18 | Sony Group Corporation | INFORMATION PROCESSING APPARATUS AND PROGRAM |
| CN111627428B (zh) * | 2020-05-15 | 2023-11-14 | 北京青牛技术股份有限公司 | 构建压缩的语音识别模型的方法 |
| US12423583B2 (en) * | 2020-06-01 | 2025-09-23 | Nvidia Corporation | Selecting annotations for training images using a neural network |
| KR102471434B1 (ko) * | 2020-06-29 | 2022-12-05 | 주식회사 빅트리 | 딥 러닝 네트워크로부터 경량화 딥 러닝 네트워크로 지식을 전수하는 방법 |
| US11961003B2 (en) | 2020-07-08 | 2024-04-16 | Nano Dimension Technologies, Ltd. | Training a student neural network to mimic a mentor neural network with inputs that maximize student-to-mentor disagreement |
| CN112749728A (zh) * | 2020-08-13 | 2021-05-04 | 腾讯科技(深圳)有限公司 | 学生模型训练方法、装置、计算机设备及存储介质 |
| CN112101156B (zh) * | 2020-09-02 | 2024-08-27 | 杭州海康威视数字技术股份有限公司 | 一种目标识别的方法、装置和电子设备 |
| CN112232506B (zh) * | 2020-09-10 | 2025-01-10 | 北京迈格威科技有限公司 | 网络模型训练方法、图像目标识别方法、装置和电子设备 |
| US12049116B2 (en) | 2020-09-30 | 2024-07-30 | Autobrains Technologies Ltd | Configuring an active suspension |
| CN114415163A (zh) | 2020-10-13 | 2022-04-29 | 奥特贝睿技术有限公司 | 基于摄像头的距离测量 |
| KR102512625B1 (ko) * | 2020-10-26 | 2023-03-23 | 한국생산기술연구원 | 데이터 증강을 이용하여 결함 검사를 위한 학습 방법 및 이를 수행하는 장치 |
| CN114491010B (zh) * | 2020-11-12 | 2025-06-10 | 北京金山数字娱乐科技有限公司 | 信息抽取模型的训练方法及装置 |
| KR102631406B1 (ko) * | 2020-11-20 | 2024-01-30 | 서울대학교산학협력단 | 트랜스포머 뉴럴 네트워크 경량화를 위한 지식 증류 방법 및 이를 수행하기 위한 장치 |
| CN112365384B (zh) * | 2021-01-14 | 2021-08-27 | 北京新唐思创教育科技有限公司 | 目标事件结果指标权重、影响因素值确定方法及相关装置 |
| US12257949B2 (en) | 2021-01-25 | 2025-03-25 | Autobrains Technologies Ltd | Alerting on driving affecting signal |
| CN113361384B (zh) * | 2021-06-03 | 2025-01-28 | 深圳前海微众银行股份有限公司 | 人脸识别模型压缩方法、设备、介质及计算机程序产品 |
| US12139166B2 (en) | 2021-06-07 | 2024-11-12 | Autobrains Technologies Ltd | Cabin preferences setting that is based on identification of one or more persons in the cabin |
| KR20230005779A (ko) | 2021-07-01 | 2023-01-10 | 오토브레인즈 테크놀로지스 리미티드 | 차선 경계 감지 |
| KR102710087B1 (ko) * | 2021-07-27 | 2024-09-25 | 네이버 주식회사 | 언어 모델을 이용한 데이터 생성 방법, 컴퓨터 장치, 및 컴퓨터 프로그램 |
| US12110075B2 (en) | 2021-08-05 | 2024-10-08 | AutoBrains Technologies Ltd. | Providing a prediction of a radius of a motorcycle turn |
| KR102566928B1 (ko) * | 2021-09-01 | 2023-08-14 | 주식회사 한글과컴퓨터 | 사용자 의도를 판별하는 딥러닝 모델의 강화 학습을 수행하기 위한 훈련 세트를 생성하는 전자 장치 및 그 동작 방법 |
| CN113505797B (zh) * | 2021-09-09 | 2021-12-14 | 深圳思谋信息科技有限公司 | 模型训练方法、装置、计算机设备和存储介质 |
| CN114117198B (zh) * | 2021-10-21 | 2025-04-25 | 北京快乐茄信息技术有限公司 | 模型训练方法、推荐方法、装置、电子设备和存储介质 |
| US12293560B2 (en) | 2021-10-26 | 2025-05-06 | Autobrains Technologies Ltd | Context based separation of on-/off-vehicle points of interest in videos |
| KR102816102B1 (ko) * | 2022-07-19 | 2025-05-30 | 아주대학교산학협력단 | 지식 증류 기반 3차원 객체 탐지 모델의 경량화를 수행하는 전자장치 및 경량화 방법 |
| WO2024071640A1 (ko) * | 2022-09-29 | 2024-04-04 | 삼성전자 주식회사 | 인공 지능 모델을 훈련시키는 전자 장치 및 방법 |
| KR102597288B1 (ko) * | 2022-12-15 | 2023-11-02 | 주식회사 포도 | 라이다 포인트 클라우드 데이터 분류기 경량화를 위한 지식증류 장치 및 방법 |
| CN116311102B (zh) * | 2023-03-30 | 2023-12-15 | 哈尔滨市科佳通用机电股份有限公司 | 基于改进的知识蒸馏的铁路货车故障检测方法及系统 |
| CN120317312A (zh) * | 2024-01-12 | 2025-07-15 | 华为技术有限公司 | 一种数据处理方法及相关设备 |
Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2017073373A1 (ja) * | 2015-10-30 | 2017-05-04 | 株式会社モルフォ | 学習システム、学習装置、学習方法、学習プログラム、教師データ作成装置、教師データ作成方法、教師データ作成プログラム、端末装置及び閾値変更装置 |
Family Cites Families (11)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP3247803B2 (ja) | 1994-07-27 | 2002-01-21 | シャープ株式会社 | ファジィ・ニューラルネットワーク・システム |
| US7606714B2 (en) | 2003-02-11 | 2009-10-20 | Microsoft Corporation | Natural language classification within an automated response system |
| US7287012B2 (en) | 2004-01-09 | 2007-10-23 | Microsoft Corporation | Machine-learned approach to determining document relevance for search over large electronic collections of documents |
| US7826911B1 (en) * | 2005-11-30 | 2010-11-02 | Google Inc. | Automatic selection of representative media clips |
| US8958631B2 (en) * | 2011-12-02 | 2015-02-17 | Intel Corporation | System and method for automatically defining and identifying a gesture |
| US9489373B2 (en) | 2013-07-12 | 2016-11-08 | Microsoft Technology Licensing, Llc | Interactive segment extraction in computer-human interactive learning |
| US10289962B2 (en) * | 2014-06-06 | 2019-05-14 | Google Llc | Training distilled machine learning models |
| EP3192012A4 (en) * | 2014-09-12 | 2018-01-17 | Microsoft Technology Licensing, LLC | Learning student dnn via output distribution |
| US10878320B2 (en) | 2015-07-22 | 2020-12-29 | Qualcomm Incorporated | Transfer learning in neural networks |
| KR102492318B1 (ko) * | 2015-09-18 | 2023-01-26 | 삼성전자주식회사 | 모델 학습 방법 및 장치, 및 데이터 인식 방법 |
| US10679143B2 (en) * | 2016-07-01 | 2020-06-09 | International Business Machines Corporation | Multi-layer information fusing for prediction |
-
2017
- 2017-07-31 KR KR1020170096902A patent/KR102570278B1/ko active Active
-
2018
- 2018-03-23 US US15/933,609 patent/US12039016B2/en active Active
Patent Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2017073373A1 (ja) * | 2015-10-30 | 2017-05-04 | 株式会社モルフォ | 学習システム、学習装置、学習方法、学習プログラム、教師データ作成装置、教師データ作成方法、教師データ作成プログラム、端末装置及び閾値変更装置 |
Non-Patent Citations (1)
| Title |
|---|
| Geoffrey Hinton et al., "Distilling the Knowledge in a Neural Network," arXiv:1503.02531v1 [stat.ML] 9 Mar 2015 (2015.05.09.)* |
Also Published As
| Publication number | Publication date |
|---|---|
| US20190034764A1 (en) | 2019-01-31 |
| US12039016B2 (en) | 2024-07-16 |
| KR20190013011A (ko) | 2019-02-11 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| KR102570278B1 (ko) | 교사 모델로부터 학생 모델을 트레이닝하는데 사용되는 학습 데이터를 생성하는 장치 및 방법 | |
| US11681921B2 (en) | Method of outputting prediction result using neural network, method of generating neural network, and apparatus therefor | |
| CN111797893B (zh) | 一种神经网络的训练方法、图像分类系统及相关设备 | |
| KR102595399B1 (ko) | 미지의 클래스들의 검출 및 미지의 클래스들에 대한 분류기들의 초기화 | |
| CN107430705B (zh) | 用于重新训练分类器的样本选择 | |
| US10275719B2 (en) | Hyper-parameter selection for deep convolutional networks | |
| US20240232648A1 (en) | Multimodal unsupervised meta-learning method and apparatus | |
| US11423323B2 (en) | Generating a sparse feature vector for classification | |
| US20190354842A1 (en) | Continuous relaxation of quantization for discretized deep neural networks | |
| US20170083623A1 (en) | Semantic multisensory embeddings for video search by text | |
| US20170061326A1 (en) | Method for improving performance of a trained machine learning model | |
| US11551076B2 (en) | Event-driven temporal convolution for asynchronous pulse-modulated sampled signals | |
| CN107430703A (zh) | 对细调特征的顺序图像采样和存储 | |
| CN104573669A (zh) | 图像物体检测方法 | |
| US20240303497A1 (en) | Robust test-time adaptation without error accumulation | |
| US11710344B2 (en) | Compact encoded heat maps for keypoint detection networks | |
| Iliadis et al. | Artificial Neural Networks and Machine Learning–ICANN 2023: 32nd International Conference on Artificial Neural Networks, Heraklion, Crete, Greece, September 26–29, 2023, Proceedings, Part I | |
| WO2024197443A1 (en) | Dynamic class-incremental learning without forgetting | |
| US20250103898A1 (en) | Energy-efficient anomaly detection and inference on embedded systems | |
| US11927601B2 (en) | Persistent two-stage activity recognition | |
| US20240412084A1 (en) | Out-of-distribution detection for personalizing neural network models | |
| US20250036681A1 (en) | On-device artificial intelligence video search | |
| WO2025107137A1 (en) | Pipeline for accelerating first token generation of large language models | |
| WO2024253740A1 (en) | Pre-processing for deep neural network compilation using graph neural networks | |
| BR112018002248B1 (pt) | Detecção de classes desconhecidas e inicialização de classificadores para classes desconhecidas |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20170731 |
|
| PG1501 | Laying open of application | ||
| PA0201 | Request for examination |
Patent event code: PA02012R01D Patent event date: 20200717 Comment text: Request for Examination of Application Patent event code: PA02011R01I Patent event date: 20170731 Comment text: Patent Application |
|
| E902 | Notification of reason for refusal | ||
| PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20220830 Patent event code: PE09021S01D |
|
| AMND | Amendment | ||
| E601 | Decision to refuse application | ||
| PE0601 | Decision on rejection of patent |
Patent event date: 20230322 Comment text: Decision to Refuse Application Patent event code: PE06012S01D Patent event date: 20220830 Comment text: Notification of reason for refusal Patent event code: PE06011S01I |
|
| X091 | Application refused [patent] | ||
| AMND | Amendment | ||
| PX0901 | Re-examination |
Patent event code: PX09011S01I Patent event date: 20230322 Comment text: Decision to Refuse Application Patent event code: PX09012R01I Patent event date: 20221027 Comment text: Amendment to Specification, etc. |
|
| PX0701 | Decision of registration after re-examination |
Patent event date: 20230727 Comment text: Decision to Grant Registration Patent event code: PX07013S01D Patent event date: 20230621 Comment text: Amendment to Specification, etc. Patent event code: PX07012R01I Patent event date: 20230322 Comment text: Decision to Refuse Application Patent event code: PX07011S01I Patent event date: 20221027 Comment text: Amendment to Specification, etc. Patent event code: PX07012R01I |
|
| X701 | Decision to grant (after re-examination) | ||
| GRNT | Written decision to grant | ||
| PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20230821 Patent event code: PR07011E01D |
|
| PR1002 | Payment of registration fee |
Payment date: 20230822 End annual number: 3 Start annual number: 1 |
|
| PG1601 | Publication of registration |