KR20250131372A - Distance adaptive hand gesture recognition method and apparatus based on radar and deep learning - Google Patents
Distance adaptive hand gesture recognition method and apparatus based on radar and deep learningInfo
- Publication number
- KR20250131372A KR20250131372A KR1020240027738A KR20240027738A KR20250131372A KR 20250131372 A KR20250131372 A KR 20250131372A KR 1020240027738 A KR1020240027738 A KR 1020240027738A KR 20240027738 A KR20240027738 A KR 20240027738A KR 20250131372 A KR20250131372 A KR 20250131372A
- Authority
- KR
- South Korea
- Prior art keywords
- radar
- hand
- distance
- user
- learning
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/017—Gesture based interaction, e.g. based on a set of recognized hand gestures
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01S—RADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
- G01S13/00—Systems using the reflection or reradiation of radio waves, e.g. radar systems; Analogous systems using reflection or reradiation of waves whose nature or wavelength is irrelevant or unspecified
- G01S13/02—Systems using reflection of radio waves, e.g. primary radar systems; Analogous systems
- G01S13/50—Systems of measurement based on relative movement of target
- G01S13/52—Discriminating between fixed and moving objects or between objects moving at different speeds
- G01S13/536—Discriminating between fixed and moving objects or between objects moving at different speeds using transmission of continuous unmodulated waves, amplitude-, frequency-, or phase-modulated waves
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01S—RADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
- G01S13/00—Systems using the reflection or reradiation of radio waves, e.g. radar systems; Analogous systems using reflection or reradiation of waves whose nature or wavelength is irrelevant or unspecified
- G01S13/02—Systems using reflection of radio waves, e.g. primary radar systems; Analogous systems
- G01S13/50—Systems of measurement based on relative movement of target
- G01S13/58—Velocity or trajectory determination systems; Sense-of-movement determination systems
- G01S13/62—Sense-of-movement determination
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/011—Arrangements for interaction with the human body, e.g. for user immersion in virtual reality
Landscapes
- Engineering & Computer Science (AREA)
- Radar, Positioning & Navigation (AREA)
- Remote Sensing (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Human Computer Interaction (AREA)
- Computer Networks & Wireless Communication (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
본 발명은 레이더와 사용자의 손 사이의 복수의 거리에 따른 데이터를 학습하여 복수의 학습 모델을 생성하는 과정과, 상기 레이더로부터 상기 사용자의 손을 향해 연속파를 송신하는 과정과, 상기 사용자의 손동작에 따라 반사된 연속파를 상기 레이더에서 수신하는 과정과, 상기 레이더의 수신 데이터에 대한 스펙트로그램을 생성하고, 상기 레이더로부터 상기 사용자의 손까지의 거리를 산출하는 과정과, 복수의 학습 모델 중에서 산출된 거리에 따른 학습 모델을 선택하여 추론하는 과정을 포함하는 레이더와 딥러닝 기반의 거리 적응형 손동작 인식 방법 및 장치를 제시한다.The present invention proposes a radar and deep learning-based distance-adaptive hand gesture recognition method and device, which includes a process of generating a plurality of learning models by learning data according to a plurality of distances between a radar and a user's hand, a process of transmitting a continuous wave from the radar toward the user's hand, a process of receiving a continuous wave reflected according to the user's hand gesture at the radar, a process of generating a spectrogram for the received data of the radar and calculating a distance from the radar to the user's hand, and a process of selecting a learning model according to the calculated distance from among the plurality of learning models and performing inference.
Description
본 발명은 손동작 인식 방법에 관한 것으로, 특히 주파수 편이 변조(Frequency Shift Keying; FSK) 레이더와 딥러닝 기반의 손동작 인식 방법 및 장치에 관한 것이다.The present invention relates to a hand gesture recognition method, and more particularly, to a hand gesture recognition method and device based on a frequency shift keying (FSK) radar and deep learning.
센서 기술은 사용자의 정보나 주변 정보를 습득하여 사용자로 하여금 원하는 동작을 할 수 있도록 이용되고 있으며, 최근 IoT(internet of things) 기술이 대두되면서 센서를 이용하여 스마트 디바이스를 제어할 수 있도록 하는 연구가 활발히 진행되고 있다. 그중에서 사람의 움직임을 인지하고 기계를 다루는 HMI(human machine interaction) 스마트 카, 스마트 홈과 같은 다양한 응용에서 필요성이 대두되고 있다. 특히, 손동작을 인식하여 효율적으로 기기를 제어할 수 있는 손동작 인식 시스템에 대한 연구가 활발히 진행되고 있다.Sensor technology is used to acquire user or surrounding information and enable users to perform desired actions. With the recent rise of IoT (Internet of Things) technology, research is actively underway on using sensors to control smart devices. Among these, the need for HMI (human-machine interaction), which recognizes human movement and controls machines, is emerging in various applications such as smart cars and smart homes. In particular, active research is being conducted on hand gesture recognition systems that can efficiently control devices by recognizing hand gestures.
사용자의 손동작을 획득하기 위한 기존의 방법은 사용자가 손동작을 획득하는 기기를 이용하거나, 다수의 광 센서 또는 카메라를 활용하여 손동작을 획득하였다. 그러나, 기존의 방법은 환경의 영향, 명암 및 장애물 등에 의해 사용 범위가 한정적인 단점을 가지고 있다. 또한, 기존의 방법은 동작이 큰 손동작에 대하여는 수월하게 측정이 가능하였지만, 미세한 움직임의 경우 측정하는데 있어서 어려움이 있었다.Existing methods for capturing user hand gestures have utilized devices that capture hand gestures, or multiple optical sensors or cameras. However, these methods have limitations in their usability due to environmental influences, brightness, and obstacles. Furthermore, while these methods can easily measure large hand gestures, they struggle to measure finer movements.
이러한 단점을 개선하기 위해 레이더를 이용한 손동작 인식 시스템이 필요하게 되었다. 현재 레이더를 이용한 손동작 인식 시스템은 대부분 연속파(Continuous Wave; CW) 레이더를 이용한다. 연속파 레이더는 물체의 움직임에 따라 도플러 주파수가 발생하고 이를 이용하여 물체가 움직이는 속도는 구할 수 있지만, 물체와 레이더 사이의 거리는 측정할 수 없다. 이때, 설정한 거리보다 멀어질수록 손동작에 대한 인식률은 낮아지게 된다. 따라서, 연속파 레이더를 사용한 손동작 인식 시스템은 사용자와 레이더의 위치를 제한하여 사용해야 한다는 단점이 있고, 이는 사용자에 있어서 불편함을 유발하는 요소이다.To overcome these shortcomings, hand gesture recognition systems using radar have become necessary. Currently, most hand gesture recognition systems using radar utilize continuous wave (CW) radar. CW radar generates Doppler frequencies according to the movement of an object, which can be used to determine the object's speed. However, it cannot measure the distance between the object and the radar. Consequently, the recognition rate for hand gestures decreases as the distance exceeds a preset distance. Therefore, hand gesture recognition systems using CW radar require limited positions between the user and the radar, which can be inconvenient for users.
한편, 근래들어 레이더를 이용한 손동작 인식 시스템에 인공지능을 많이 이용하고 있다. CW 레이더 및 인공지능을 이용한 손동작 인식 시스템은 CW 레이더를 통해 수신한 데이터를 이용하여 스펙트로그램(spectrogram)을 생성하고, 이렇게 생성된 스펙트로그램을 CNN을 이용한 추론을 위한 입력으로 이용한다.Meanwhile, artificial intelligence has been increasingly used in radar-based hand gesture recognition systems. Hand gesture recognition systems utilizing CW radar and AI generate spectrograms using data received via CW radar, and then use these spectrograms as input for inference using a convolutional neural network (CNN).
본 발명은 물체와 레이더 사이의 거리를 측정할 수 있는 주파수 편이 변조(Frequency Shift Keying; FSK) 레이더와 딥러닝 기반의 손동작 인식 방법을 제공한다.The present invention provides a frequency shift keying (FSK) radar capable of measuring the distance between an object and a radar and a deep learning-based hand gesture recognition method.
본 발명은 레이더와 손 사이의 다양한 거리에 따른 모델을 학습시켜 손동작에 대한 인식률을 향상시킬 수 있는 손동작 인식 방법을 제공한다.The present invention provides a hand gesture recognition method capable of improving the recognition rate of hand gestures by training a model according to various distances between a radar and a hand.
본 발명은 레이더와 손 사이의 거리를 측정한 후 그에 따른 학습 모델을 추론 시 이용함으로써 손동작에 대한 인식률을 향상시킬 수 있는 손동작 인식 방법 및 장치에 관한 것이다.The present invention relates to a hand gesture recognition method and device capable of improving the recognition rate of hand gestures by measuring the distance between a radar and a hand and then using a learning model based on the distance measured during inference.
본 발명의 일 실시 예에 따른 레이더와 딥러닝 기반의 거리 적응형 손동작 인식 방법은 레이더와 사용자의 손 사이의 복수의 거리에 따른 데이터를 학습하여 복수의 학습 모델을 생성하는 과정과, 상기 레이더로부터 상기 사용자의 손을 향해 연속파를 송신하는 과정과, 상기 사용자의 손동작에 따라 반사된 연속파를 상기 레이더에서 수신하는 과정과, 상기 레이더의 수신 데이터에 대한 스펙트로그램을 생성하고, 상기 레이더로부터 상기 사용자의 손까지의 거리를 산출하는 과정과, 복수의 학습 모델 중에서 산출된 거리에 따른 학습 모델을 선택하여 추론하는 과정을 포함한다.According to one embodiment of the present invention, a distance-adaptive hand gesture recognition method based on radar and deep learning includes a process of generating a plurality of learning models by learning data according to a plurality of distances between a radar and a user's hand, a process of transmitting a continuous wave from the radar toward the user's hand, a process of receiving a continuous wave reflected according to the user's hand gesture at the radar, a process of generating a spectrogram for the received data of the radar and calculating a distance from the radar to the user's hand, and a process of selecting a learning model according to the calculated distance from among the plurality of learning models and performing inference.
상기 복수의 학습 모델을 생성하는 과정은, 레이더와 사용자의 손 사이의 거리를 복수로 상이하게 하고, 레이더로부터 연속파를 송신한 후 각 거리에서 사용자의 손에 반사된 연속파를 수신하여 각 거리에 따른 손동작을 측정하는 과정과, 숏텀 푸리에 변환을 이용하여 복수의 거리 각각에서의 스펙트로그램을 생성하는 과정과, 레이더와 손동작 사이의 복수의 거리 각각에서 생성된 스펙트로그램을 이용하여 학습시켜 복수의 학습 모델을 생성하는 과정을 포함한다.The process of generating the above multiple learning models includes a process of making the distance between the radar and the user's hand different in multiple ways, transmitting a continuous wave from the radar and then receiving the continuous wave reflected from the user's hand at each distance to measure hand movements according to each distance, a process of generating a spectrogram at each of the multiple distances using a short-term Fourier transform, and a process of generating a multiple learning model by training using the spectrogram generated at each of the multiple distances between the radar and the hand movement.
인접한 두 거리의 데이터를 하나로 합쳐 학습시킨다.Data from two adjacent streets are combined and trained.
상기 레이더는 fa와 fb의 캐리어 주파수를 갖는 주파수 편이 변조(Frequency Shift Keying; FSK) 레이더를 이용한다.The above radar uses a frequency shift keying (FSK) radar with carrier frequencies of f a and f b .
상기 레이더와 사용자의 손 사이의 거리는 [수학식 1]에 의해 산출된다.The distance between the above radar and the user's hand is calculated by [Mathematical Formula 1].
[수학식 1][Mathematical Formula 1]
여기서, fa 및 fb는 레이더의 캐리어 주파수이며, c는 빛의 속도이고, Δφ는 수신된 두 신호의 위상차이다.Here, f a and f b are the carrier frequencies of the radar, c is the speed of light, and Δφ is the phase difference between the two received signals.
본 발명의 다른 실시 예에 따른 레이더와 딥러닝 기반의 거리 적응형 손동작 인식 장치는 연속파를 생성하여 송신하고 사용자의 손동작에 따라 반사된 신호를 수신하는 레이더와, 숏텀 푸리에 변환을 통해 스펙트로그램을 생성하는 스펙트로그램 생성부와, 상기 레이더와 사용자의 손까지의 거리를 산출하는 거리 산출부와, 상기 레이더와 상기 사용자의 손 사이의 복수의 상이한 거리에 따른 데이터를 학습하여 복수의 학습 모델을 생성하는 학습부와, 상기 학습부로부터 복수의 학습 모델 중에서 산출된 거리에 따른 학습 모델을 선택하여 추론하는 추론부를 포함한다.According to another embodiment of the present invention, a radar and deep learning-based distance-adaptive hand gesture recognition device includes a radar that generates and transmits a continuous wave and receives a signal reflected according to a user's hand gesture, a spectrogram generation unit that generates a spectrogram through a short-term Fourier transform, a distance calculation unit that calculates a distance between the radar and the user's hand, a learning unit that learns data according to a plurality of different distances between the radar and the user's hand and generates a plurality of learning models, and an inference unit that selects a learning model according to the distance calculated from among the plurality of learning models from the learning unit and makes an inference.
상기 레이더는 fa와 fb의 캐리어 주파수를 갖는 주파수 편이 변조 레이더를 이용한다.The above radar uses a frequency shift keying radar having carrier frequencies of f a and f b .
상기 레이더와 사용자의 손 사이의 거리는 [수학식 1]에 의해 산출된다.The distance between the above radar and the user's hand is calculated by [Mathematical Formula 1].
[수학식 1][Mathematical Formula 1]
여기서, fa 및 fb는 레이더의 캐리어 주파수이며, c는 빛의 속도이고, Δφ는 수신된 두 신호의 위상차이다.Here, f a and f b are the carrier frequencies of the radar, c is the speed of light, and Δφ is the phase difference between the two received signals.
상기 학습부는 인접한 두 거리의 데이터를 하나로 합쳐 학습시킨다.The above learning unit learns by combining data from two adjacent streets into one.
본 발명은 레이더와 목표와의 거리를 측정할 수 있는 FSK 레이더를 이용하여 손동작을 인식한다. 또한, 본 발명은 FSK 레이더와 목표 사이의 다양한 거리에 따른 복수의 모델을 학습시킨다. 이때, 인접한 두 위치의 데이터를 하나로 합쳐서 학습시킬 수 있다. 이렇게 학습된 모델은 CNN을 이용한 추론에 이용될 수 있는데, 추론 시 레이더와 손 사이의 거리를 측정하고, 측정 데이터를 이용하여 스펙트로그램을 생성한 후 측정 거리에 해당하는 학습 모델을 이용하여 손동작을 추론할 수 있다. 즉, 본 발명은 레이더와 손 사이의 거리에 따른 최적의 모델을 선택하여 손동작을 추론한다.The present invention recognizes hand gestures using an FSK radar capable of measuring the distance between the radar and a target. Furthermore, the present invention trains multiple models based on various distances between the FSK radar and the target. At this time, data from two adjacent locations can be combined for training. These trained models can be used for inference using a CNN. During inference, the distance between the radar and the hand is measured, a spectrogram is generated using the measured data, and then the hand gesture is inferred using the trained model corresponding to the measured distance. In other words, the present invention selects the optimal model based on the distance between the radar and the hand to infer the hand gesture.
따라서, 본 발명은 거리에 따라 최적의 모델을 선택하기 때문에 목표로 한 모든 위치에서 인식률을 향상시킬 수 있다. 또한, 인접한 두 위치의 데이터를 하나로 합쳐서 학습시켰기 때문에 그 사이에 있는 위치에 대한 인식률 또한 향상시킬 수 있다.Therefore, the present invention can improve recognition rates at all targeted locations because it selects the optimal model based on distance. Furthermore, because data from two adjacent locations is combined and trained, recognition rates for locations between them can also be improved.
도 1은 본 발명의 일 실시 예에 따른 레이더와 딥러닝 기반의 거리 적응형 손동작 인식 방법의 흐름도이다.
도 2는 본 발명의 일 실시 예에 따른 레이더와 딥러닝 기반의 거리 적응형 손동작 인식 장치의 블록도이다.
도 3은 스펙트로그램의 예시를 도시한 도면이다.
도 4는 fa와 fb의 캐리어 주파수를 갖는 FSK 레이더의 연속파의 파형도이다.
도 5는 사용자의 다양한 손동작의 예시를 도시한 사진이다.FIG. 1 is a flowchart of a radar and deep learning-based distance-adaptive hand gesture recognition method according to an embodiment of the present invention.
FIG. 2 is a block diagram of a radar and deep learning-based distance-adaptive hand gesture recognition device according to an embodiment of the present invention.
Figure 3 is a diagram illustrating an example of a spectrogram.
Figure 4 is a waveform diagram of a continuous wave of an FSK radar having carrier frequencies of f a and f b .
Figure 5 is a photograph showing examples of various hand gestures of a user.
이하, 첨부된 도면을 참조하여 본 발명의 실시 예를 상세히 설명하기로 한다. 그러나, 본 발명은 이하에서 개시되는 실시 예에 한정되는 것이 아니라 서로 다른 다양한 형태로 구현될 것이며, 단지 본 실시 예들은 본 발명의 개시가 완전하도록 하며, 통상의 지식을 가진 자에게 발명의 범주를 완전하게 알려주기 위해 제공되는 것이다.Hereinafter, embodiments of the present invention will be described in detail with reference to the attached drawings. However, the present invention is not limited to the embodiments disclosed below, but may be implemented in various different forms. These embodiments are provided solely to ensure complete disclosure of the present invention and to fully inform those of ordinary skill in the art of the scope of the invention.
도 1은 본 발명의 일 실시 예에 따른 레이더와 딥러닝 기반의 거리 적응형 손동작 인식 방법의 흐름도이고, 도 2는 이를 위한 장치의 블록도이다. 즉, 도 2는 본 발명의 일 실시 예에 따른 레이더와 딥러닝 기반의 거리 적응형 손동작 인식을 위한 장치로서, 도 2의 장치를 이용하여 도 1의 방법이 구현될 수 있다. 이러한 본 발명의 일 실시 예에 따른 손동작 인식 방법 및 장치를 도 1 및 도 2를 이용하여 설명하면 다음과 같다.FIG. 1 is a flowchart of a distance-adaptive hand gesture recognition method based on radar and deep learning according to an embodiment of the present invention, and FIG. 2 is a block diagram of a device therefor. That is, FIG. 2 is a device for distance-adaptive hand gesture recognition based on radar and deep learning according to an embodiment of the present invention, and the method of FIG. 1 can be implemented using the device of FIG. 2. The hand gesture recognition method and device according to an embodiment of the present invention will be described below using FIGS. 1 and 2.
도 1을 참조하면, 본 발명의 일 실시 예에 따른 레이더와 딥러닝 기반의 거리 적응형 손동작 인식 방법은 레이더와 손 사이의 다양한 거리에 따른 데이터를 학습하는 과정(S110)과, 레이더로부터 사용자의 손을 향해 연속파를 송신하는 과정(S120)과, 손동작을 수행하는 과정(S130)과, 손으로부터 반사된 연속파의 데이터를 레이더에서 수신하는 과정(S140)과, 레이더와 손까지의 거리를 산출하는 과정(S150)과, 산출된 거리에 따른 모델을 선택하여 추론하는 과정(S160)을 포함할 수 있다. 즉, 손동작 인식 방법을 위한 손동작 인식 장치는 도 2에 도시된 바와 같이 연속파를 생성하여 송신하고 사용자의 손동작에 따라 반사된 신호를 수신하는 레이더(100)와, 숏텀 푸리에 변환(Short Term Fourier Transform; STFT)을 통해 스펙트로그램을 생성하는 스펙트로그램 생성부(200)와, 레이더와 손까지의 거리를 산출하는 거리 산출부(300)와, 레이더와 손 사이의 다양한 거리에 따른 데이터를 학습하는 학습부(400)와, 산출된 거리에 따른 모델을 학습부로부터 선택하여 추론하는 추론부(500)를 포함할 수 있다. 이러한 본 발명의 일 실시 예에 따른 레이더와 딥러닝 기반의 거리 적응형 손동작 인식 방법을 각 과정별로 좀더 상세히 설명하면 다음과 같다.Referring to FIG. 1, a distance-adaptive hand gesture recognition method based on radar and deep learning according to an embodiment of the present invention may include a process of learning data according to various distances between a radar and a hand (S110), a process of transmitting a continuous wave from a radar toward a user's hand (S120), a process of performing a hand gesture (S130), a process of receiving data of a continuous wave reflected from a hand from a radar (S140), a process of calculating a distance from the radar to the hand (S150), and a process of selecting and inferring a model according to the calculated distance (S160). That is, a hand gesture recognition device for a hand gesture recognition method may include a radar (100) that generates and transmits a continuous wave and receives a reflected signal according to a user's hand gesture, as illustrated in FIG. 2, a spectrogram generation unit (200) that generates a spectrogram through a short-term Fourier transform (STFT), a distance calculation unit (300) that calculates a distance from the radar to the hand, a learning unit (400) that learns data according to various distances between the radar and the hand, and an inference unit (500) that selects and infers a model according to the calculated distance from the learning unit. The radar and deep learning-based distance-adaptive hand gesture recognition method according to one embodiment of the present invention will be described in more detail for each process as follows.
S110 : 레이더와 사용자의 손 사이의 다양한 거리에 따른 복수의 데이터를 인공지능 학습부(400)에 학습시킨다. 학습은 손동작을 구분할 수 있는 인공 지능 모델을 학습시키는 과정이다. 인공지능 모델로는 예를 들어 CNN(Convolutional Neural Network)이 사용될 수 있다. CNN은 딥러닝(Deep Learning)의 일종이다. 딥러닝은 인공 신경망을 활용하여 복잡한 패턴과 특징을 학습하고 인식하는 기계 학습의 한 분야로서, 심층 신경망을 구축하여 다양한 작업에 대한 자동화된 특징 추출 및 판별을 수행한다. 이러한 레이더와 사용자의 손 사이의 다양한 거리에 따른 복수의 데이터를 학습시키기 위해 다양한 거리에 따른 손동작 데이터를 측정하는 과정과, 스펙트로그램을 생성하는 과정과, 모델을 학습시키는 과정을 진행할 수 있다.S110: A plurality of data according to various distances between the radar and the user's hand is trained in the artificial intelligence learning unit (400). Training is a process of training an artificial intelligence model capable of distinguishing hand movements. For example, a CNN (Convolutional Neural Network) can be used as the artificial intelligence model. CNN is a type of deep learning. Deep learning is a field of machine learning that utilizes an artificial neural network to learn and recognize complex patterns and features, and builds a deep neural network to perform automated feature extraction and discrimination for various tasks. In order to train a plurality of data according to various distances between the radar and the user's hand, a process of measuring hand movement data according to various distances, a process of generating a spectrogram, and a process of training a model can be performed.
먼저, 레이더(100)와 사용자의 손 사이의 거리를 다양하게 하고 각 거리에 따른 손동작을 측정한다. 즉, 레이더(100)와 사용자의 손 사이에 다양한 거리를 두고 레이더를 이용하여 손동작을 측정한다. 본 발명은 레이더(100)로서 거리를 측정할 수 있는 FSK 레이더를 이용한다. 예를 들어, 30㎝ 간격으로 FSK 레이더와 손 사이의 간격을 두고 FSK 레이더를 이용하여 손동작을 측정할 수 있는데, 30㎝∼180㎝를 커버하는 것을 목표로 했다면 30㎝, 60㎝, 90㎝, 120㎝, 150㎝, 180㎝ 각각의 거리에서 측정한다. 즉, 레이더(100)로부터 사용자의 손이 30㎝ 간격으로 멀어지게 한 후 레이더(100)로부터 연속파를 송신하고 사용자의 손에 반사된 연속파를 수신하여 손동작을 측정한다.First, the distance between the radar (100) and the user's hand is varied, and hand movements according to each distance are measured. That is, hand movements are measured using the radar while maintaining various distances between the radar (100) and the user's hand. The present invention uses an FSK radar capable of measuring distances as the radar (100). For example, hand movements can be measured using the FSK radar while maintaining the distance between the FSK radar and the hand at 30 cm intervals. If the goal is to cover 30 cm to 180 cm, measurements are made at distances of 30 cm, 60 cm, 90 cm, 120 cm, 150 cm, and 180 cm, respectively. That is, after the user's hand is moved away from the radar (100) at 30 cm intervals, a continuous wave is transmitted from the radar (100), and the continuous wave reflected from the user's hand is received to measure the hand movements.
이어서, 다양한 거리에서 손동작을 측정한 후 각각의 거리에서의 스펙트로그램(spectrogram)을 생성한다. 스펙트로그램은 STFT(Short Term Fourier Transform)를 이용하여 생성할 수 있다. STFT는 시간 도메인의 신호를 주파수 도메인으로 변환하는데 사용되며, 이를 통해 신호의 주파수 특성이 시간에 따라 어떻게 변화하는지를 파악할 수 있다. 이러한 STFT는 시간 구간 분할(Time Segmentation), 각 시간 구간에 대한 푸리에 변환 수행, 그리고 결과를 시간-주파수의 스펙트로그램 생성 등의 과정으로 이루어질 수 있다. 먼저, 시간 구간 분할(Time Segmentation)은 원본 시계열 데이터를 작은 시간 구간으로 나눈다. 시간 구간의 크기는 STFT의 해상도를 결정하며, 작은 시간 구간의 크기는 빠르게 변하는 주파수를 감지할 수 있다. 이어서, 각 시간 구간에 대해 푸리에 변환을 수행하여 해당 시간 구간에서의 주파수 특성을 얻는다. 이때, 푸리에 변환은 각 구간의 주파수 성분을 추출하는데 사용된다. 그리고, 시간-주파수의 스펙트로그램을 생성하여 원본 신호의 주파수 특성이 시간에 따라 어떻게 변하는지를 시각적으로 표현한다. STFT에 의해 생성된 스펙트로그램(Spectrogram)은 시간에 따른 주파수의 변화를 시각적으로 나타낸 데이터이다. 스펙트로그램은 주로 2D 매트릭스로 표현되며, 가로축은 시간을, 세로축은 주파수를 나타낸다. 각 셀의 색상은 해당 시간과 주파수에서의 신호의 강도를 나타낸다. 일반적으로 스펙트로그램에서는 색상 맵을 사용하여 각 셀의 강도를 나타내는데, 높은 강도는 더 진한 색으로 표현되며, 이는 주로 푸리에 변환의 결과로 나온 주파수 성분의 강도를 나타낸다. 스펙트로그램의 예가 도 3에 도시되어 있다.Next, hand movements are measured at various distances, and spectrograms are generated for each distance. Spectrograms can be generated using the Short Term Fourier Transform (STFT). The STFT is used to transform a time-domain signal into the frequency domain, allowing one to understand how the signal's frequency characteristics change over time. The STFT can be performed through a series of processes, including time segmentation, performing a Fourier transform on each time interval, and generating a time-frequency spectrogram from the resulting data. First, time segmentation divides the original time-series data into small time intervals. The size of the time interval determines the resolution of the STFT, and small time intervals can detect rapidly changing frequencies. Next, a Fourier transform is performed on each time interval to obtain the frequency characteristics for that time interval. The Fourier transform is used to extract the frequency components of each interval. A time-frequency spectrogram is then generated to visually represent how the frequency characteristics of the original signal change over time. A spectrogram generated by the STFT is data that visually represents frequency changes over time. A spectrogram is typically represented as a 2D matrix, with the horizontal axis representing time and the vertical axis representing frequency. The color of each cell represents the signal intensity at that time and frequency. Typically, spectrograms use a color map to represent the intensity of each cell, with higher intensities represented by darker colors. This primarily represents the intensity of frequency components resulting from the Fourier transform. An example of a spectrogram is shown in Figure 3.
레이더와 손동작 사이의 각각의 거리에서 생성된 스펙트로그램을 이용하여 학습시킨다. 이때, 인접한 두 위치의 데이터를 하나로 합쳐서 학습시킬 수 있다. 본 발명의 실시 예는 30㎝∼180㎝ 거리를 30㎝ 간격으로 측정하므로 총 7개의 모델을 학습시킬 수 있다. 즉, 30㎝ 모델(model_30), 30㎝∼60㎝ 모델(model_3060), 60㎝∼90㎝ 모델(model_6090), 90㎝∼120㎝ 모델(model_90120), 120㎝∼150㎝ 모델(model_120150), 150㎝∼180㎝ 모델(model_150180), 180㎝ 모델(model_180) 등 7개의 모델을 학습시킬 수 있다. 여기서, model_30은 30㎝의 데이터만을 사용하여 CNN 모델을 학습시킨 것이고, model_3060은 30㎝와 60cm 사이의 데이터를 사용하여 CNN 모델을 학습시킨 것이다. model_6090은 60㎝와 90㎝ 사이의 데이터를 사용하여 CNN 모델을 학습시킨 것이고, model_90120은 90㎝와 120㎝ 사이의 데이터를 사용하여 CNN 모델을 학습시킨 것이다. model_120150은 120㎝와 150㎝ 사이의 데이터를 사용하여 CNN 모델을 학습시킨 것이고, model_150180은 150㎝와 180㎝ 사이의 데이터를 사용하여 CNN 모델을 학습시킨 것이며, model_180은 180㎝의 데이터를 사용하여 CNN 모델을 학습시킨 것이다. 즉, 인접한 두 위치의 데이터를 하나로 합쳐서 학습시킬 수 있다.It is trained using spectrograms generated at each distance between the radar and the hand gesture. At this time, data from two adjacent locations can be combined and trained. In the embodiment of the present invention, since the distance of 30 cm to 180 cm is measured at 30 cm intervals, a total of 7 models can be trained. That is, 7 models can be trained, including a 30 cm model (model_30), a 30 cm to 60 cm model (model_3060), a 60 cm to 90 cm model (model_6090), a 90 cm to 120 cm model (model_90120), a 120 cm to 150 cm model (model_120150), a 150 cm to 180 cm model (model_150180), and a 180 cm model (model_180). Here, model_30 is a CNN model trained using only 30 cm data, and model_3060 is a CNN model trained using data between 30 cm and 60 cm. model_6090 is a CNN model trained using data between 60cm and 90cm, model_90120 is a CNN model trained using data between 90cm and 120cm, model_120150 is a CNN model trained using data between 120cm and 150cm, model_150180 is a CNN model trained using data between 150cm and 180cm, and model_180 is a CNN model trained using data at 180cm. In other words, data from two adjacent locations can be combined and trained as one.
S120 : 본 발명은 주파수 편이 변조(Frequency Shift Keying; FSK) 레이더를 이용한다. 즉, 레이더로서 FSK 레이더를 이용하여 연속파를 송신한다. 본 발명에 따른 FSK 레이더는 두 가지 주파수의 연속파를 교대로 전송하며, 각 연속파는 도 4에 도시된 바와 같이 각각 fa와 fb의 캐리어 주파수(carrier frequency)를 갖는다. 이때, FSK 레이더는 디지털 데이터를 전송하기 위해 정보 비트를 서로 다른 주파수로 변조한다. 즉, FSK 레이더는 두 가지 주파수의 연속파를 교대로 전송하는 레이더이다. FSK 레이더는 연속파를 송신하기 위해 이진 데이터를 송신한다. 즉, 디지털 데이터를 0과 1의 이진 신호로 나타내며, 각 비트는 서로 다른 주파수로 변조된다. 이때, 주파수 변조는 이진 데이터의 각 비트에 대해 두 가지 다른 주파수가 할당되는데, 예를 들어 0은 낮은 주파수로, 1은 높은 주파수로 할당된다. FSK 레이더의 송신측은 이진 데이터 비트에 따라 주파수를 변경하여 전송한다. 즉, FSK 레이더는 송신기, 안테나, 수신기 등을 포함할 수 있는데, 송신기는 연속파의 송신 주파수 파형을 생성하며, 주파수를 이진 데이터의 각 비트에 대해 두 가지 다른 주파수를 할당하여 변조한다. 이렇게 주파수가 변조된 데이터는 안테나를 통해 목표물, 즉 사용자의 손을 향해 전송된다.S120: The present invention uses a Frequency Shift Keying (FSK) radar. That is, a continuous wave is transmitted using an FSK radar as a radar. The FSK radar according to the present invention alternately transmits continuous waves of two frequencies, and each continuous wave has a carrier frequency of f a and f b , as illustrated in FIG. 4. At this time, the FSK radar modulates information bits with different frequencies to transmit digital data. That is, the FSK radar is a radar that alternately transmits continuous waves of two frequencies. The FSK radar transmits binary data to transmit continuous waves. That is, the digital data is represented as a binary signal of 0 and 1, and each bit is modulated with a different frequency. At this time, the frequency modulation assigns two different frequencies to each bit of the binary data, for example, 0 is assigned a low frequency, and 1 is assigned a high frequency. The transmitting side of the FSK radar changes the frequency according to the binary data bit and transmits it. In other words, an FSK radar may include a transmitter, antenna, and receiver. The transmitter generates a continuous-wave transmission frequency waveform and modulates the frequency by assigning two different frequencies to each bit of binary data. The modulated data is then transmitted to the target, i.e., the user's hand, via the antenna.
S130 : 손동작을 수행하는 과정은 사용자의 손을 다양한 형태로 동작을 취해 실시할 수 있다. 즉, 손을 상하좌우로 움직여 손동작을 수행할 수 있다. 예를 들어, 손을 상에서 하로 움직일 수 있고, 이와는 반대로 하에서 상으로 움직일 수도 있다. 또한, 손을 우에서 좌로 움직일 수도 있고, 이와는 반대로 좌에서 우로 움직일 수도 있다. 이러한 손동작의 예가 도 5에 도시되어 있다. 즉, 도 5는 본 발명에 적용되는 다양한 손동작의 예시를 도시한 사진이다. 도 5(a)는 손을 상하로 움직이는 것을 도시한 사진(UP to DOWN)이고, 도 5(b)는 손을 우에서 좌로 움직이는 것을 도시한 사진(RIGHT to LEFT)이다. 또한, 도 5(c)는 손을 좌에서 우로 움직이는 것을 도시한 사진(LEFT to RIGHT)이고, 도 5(d)는 손을 하에서 상으로 움직이는 것을 도시한 사진(DOWN to UP)이다.S130: The process of performing a hand gesture can be performed by moving the user's hand in various forms. That is, the hand gesture can be performed by moving the hand up, down, left, and right. For example, the hand can be moved from up to down, or conversely, from down to up. In addition, the hand can be moved from right to left, or conversely, from left to right. Examples of such hand gestures are illustrated in FIG. 5. That is, FIG. 5 is a photograph illustrating examples of various hand gestures applied to the present invention. FIG. 5(a) is a photograph illustrating an up to down movement of a hand (UP to DOWN), and FIG. 5(b) is a photograph illustrating an movement of a hand from right to left (RIGHT to LEFT). In addition, FIG. 5(c) is a photograph illustrating an movement of a hand from left to right (LEFT to RIGHT), and FIG. 5(d) is a photograph illustrating an movement of a hand from down to up (DOWN to UP).
S140 : 레이더에서 데이터를 수신하는 과정은 레이더에서 송신한 연속파가 사용자의 손동작에 따라 반사되는 데이터를 수신한다. 즉, FSK 레이더의 안테나를 통해 수신부가 손동작에 따라 반사되는 데이터를 수신한다. 수신부는 안테나를 통해 수신된 신호의 주파수 변화를 감지하고 각각의 주파수를 디지털 데이터로 디코딩한다. 한편, FSK 레이더는 송신된 연속파와 수신된 반사파의 신호간 주파수 차이를 계산하여 주파수 변이 변조를 감지한다. 이러한 역할은 FSK 레이더의 믹서에서 수행하게 된다. 즉, 믹서는 송신부로부터 송신된 주파수의 파형과 수신부로부터 수신된 주파수의 파형을 입력하여 두 신호간의 주파수 차이를 계산하고, 그에 따라 주파수 변이 변조를 감지한다. 이렇게 믹서를 통해 얻은 주파수 정보는 신호 처리부로 전달되고, 신호 처리부는 신호 처리 과정을 수행하여 디지털 데이터로 변환한다. 이렇게 손동작 감지를 위한 FSK 레이더는 주파수 편이 변조를 사용하여 데이터를 전송하고, 주파수의 변화를 통해 물체의 거리 및 속도를 측정한다. 즉, FSK 레이더는 상이한 2개의 주파수를 번갈아 전송하고, 상이한 주파수에 의해 발생하는 위상 차이를 이용하여 거리를 계산하기 때문에 거리 해상도의 제한없이 정밀한 거리 측정이 가능한 장점이 있다.S140: The process of receiving data from radar involves receiving data reflected from a continuous wave transmitted from the radar according to the user's hand movements. In other words, the receiver receives data reflected according to hand movements through the antenna of the FSK radar. The receiver detects frequency changes in the signal received through the antenna and decodes each frequency into digital data. Meanwhile, the FSK radar detects frequency shift modulation by calculating the frequency difference between the transmitted continuous wave and the received reflected wave. This function is performed by the mixer of the FSK radar. That is, the mixer inputs the frequency waveform transmitted from the transmitter and the frequency waveform received from the receiver, calculates the frequency difference between the two signals, and detects frequency shift modulation accordingly. The frequency information obtained through the mixer is transmitted to the signal processing unit, which performs signal processing to convert it into digital data. In this way, the FSK radar for hand gesture detection uses frequency shift keying to transmit data and measures the distance and speed of an object through frequency changes. That is, FSK radar has the advantage of being able to measure distance precisely without limitations in distance resolution because it alternately transmits two different frequencies and calculates distance using the phase difference caused by the different frequencies.
S150 : 이렇게 FSK 레이더를 이용하면 사용자와 레이더 사이의 거리를 측정할 수 있다. 사용자와 레이더 사이의 거리(R)는 [수학식 1]과 같이 구해질 수 있다. 즉, 거리 산출부(200)는 [수학식 1]을 이용하여 사용자와 레이더 사이의 거리를 산출할 수 있다. FSK 레이더는 이렇게 레이더와 움직이는 타겟 사이의 거리를 구할 수 있고, 이 거리를 이용하면 기존의 CW 레이더를 이용할 때와는 달리 사용자의 위치를 제한하지 않고 거리 적응형 손동작 인식 시스템을 구현할 수 있다.S150: By using FSK radar in this way, the distance between the user and the radar can be measured. The distance (R) between the user and the radar can be calculated as in [Mathematical Formula 1]. That is, the distance calculation unit (200) can calculate the distance between the user and the radar using [Mathematical Formula 1]. FSK radar can calculate the distance between the radar and a moving target in this way, and by using this distance, a distance-adaptive hand gesture recognition system can be implemented without limiting the user's position, unlike when using a conventional CW radar.
여기서, c는 빛의 속도이고, Δφ는 수신된 두 신호의 위상차이다.Here, c is the speed of light and Δφ is the phase difference between the two received signals.
S160 : 추론부(500)는 레이더와 사용자의 손 사이의 계산된 거리에 따른 모델을 선택하여 추론을 진행하고 손동작을 인식한다. 추론은 실제 손동작에 대한 인식이 이뤄지는 과정으로, 앞서 학습했던 모델이 사용된다. 그리고, FSK 레이더를 사용한 만큼 거리에 대한 정보도 이용된다는 특징이 있다. 먼저, 레이더에서 손동작에 대한 데이터 수신한다. 30㎝∼180㎝ 까지를 커버하는 것을 예시로 했기 때문에 이 사이에서 동작을 진행하도록 한다. 그리고, STFT를 이용해서 레이더 데이터에 대한 스펙트로그램을 생성하고, 레이더 데이터를 이용하여 레이더로부터 손까지의 거리를 계산한 후 계산된 거리에 따른 모델을 선택한다. 즉, 추론부(500)는 거리 산출부(300)로부터 계산된 거리에 따른 모델을 학습부(400)로부터 선택한다. 이때, 계산된 거리에 따라 학습부(400)의 모델을 다르게 선택한다. 예를 들어, 레이더와 손 사이의 거리가 0㎝∼30㎝이면 model_30을 선택하고, 30㎝∼60㎝이면 model_3060을 선택하며, 60㎝∼90㎝이면 model_6090을 선택한다. 그리고, 레이더와 손 사이의 거리가 90㎝∼120㎝이면 model_90120, 120㎝∼150㎝이면 model_120150, 150㎝∼180㎝이면 model_150180, 180㎝이면 model_180을 각각 선택한다. 즉, 추론 과정은 레이더와 손 사이의 거리를 계산하고, 계산된 거리에 해당하는 학습 모델을 선택하여 추론을 진행하여 손동작을 인식한다. 이렇게 거리에 따라서 최적의 모델을 선택하기 때문에 목표로 한 모든 위치에서 인식률을 높일 수 있다. 또한, 인접한 두 위치의 데이터를 하나로 합쳐서 학습시키는 경우, 그 사이에 있는 위치에 대한 인식률 또한 높일 수 있다.S160: The inference unit (500) selects a model according to the calculated distance between the radar and the user's hand, performs inference, and recognizes hand movements. Inference is the process of recognizing actual hand movements, and a previously learned model is used. In addition, since FSK radar is used, it has the characteristic of utilizing distance information. First, data on hand movements are received from the radar. Since the example covers 30 cm to 180 cm, the movement is performed within this range. Then, a spectrogram for the radar data is generated using STFT, and the distance from the radar to the hand is calculated using the radar data, and then a model according to the calculated distance is selected. That is, the inference unit (500) selects a model according to the distance calculated by the distance calculation unit (300) from the learning unit (400). At this time, a different model of the learning unit (400) is selected depending on the calculated distance. For example, if the distance between the radar and the hand is 0 cm to 30 cm, select model_30, if it is 30 cm to 60 cm, select model_3060, and if it is 60 cm to 90 cm, select model_6090. Then, if the distance between the radar and the hand is 90 cm to 120 cm, select model_90120, if it is 120 cm to 150 cm, select model_120150, if it is 150 cm to 180 cm, select model_150180, and if it is 180 cm, select model_180. In other words, the inference process calculates the distance between the radar and the hand, selects the learning model corresponding to the calculated distance, and performs inference to recognize the hand gesture. Since the optimal model is selected according to the distance in this way, the recognition rate can be increased at all targeted locations. In addition, if data from two adjacent locations are combined and trained, the recognition rate for the locations in between can also be increased.
아래 표는 본 발명에 따른 거리 추정의 정확도를 보이는 결과이다.The table below shows the results showing the accuracy of distance estimation according to the present invention.
각 거리의 동작 별로 170개의 학습 데이터, 60개의 추론 데이터를 사용하였으며, 학습용 데이터는 30, 60, 90, 120, 150, 180 cm에서 측정하고, 테스트용 데이터는 10cm 단위의 거리에서 모두 측정하여 FSK 레이더에서 실제 측정한 경우와 비교하였다.For each distance, 170 training data and 60 inference data were used for each movement. The training data were measured at 30, 60, 90, 120, 150, and 180 cm, and the test data were all measured at distances of 10 cm and compared with the actual measurements from the FSK radar.
비교예는, 30, 60, 90, 120, 150, 180cm의 데이터를 하나로 합쳐서 하나의 모델로 학습하여 결과모델 model_all 을 생성하고, 이를 활용하여 손동작을 측정하였으며, 실시예 1은 30, 60, 90, 120, 150, 180cm의 데이터를 통해 각각의 거리에 해당하는 6가지의 결과 모델(model_30, model_60, model_90, model_120, model_150, model_180)을 도출하였고, 추론시, FSK radar의 거리추정 값을 토대로 거리상 가까운 모델을 선택하였다(예, 거리추정 결과가 40cm라면 가까운 모델인 model_30을 선택해서 추론). 실시예 2는, 30, 60, 90, 120, 150, 180cm의 데이터 중에서 근접하는 거리의 데이터를 합하여 학습하여 결과모델 model_30, model_3060, model_6090, model_120150, model_150180, model_180를 도출하였다. 추론시에는 FSK radar의 거리추정 결과를 토대로 해당하는 모델을 선택하되, 예를 들면, 40cm로 추정되면 30~60cm사이 이므로 model_3060선택, 100cm 이면 90~120cm사이 이므로 model_90120선택, 25cm 라면 ~30cm 이므로 model_30 선택하여 추론하였다. 실시예 1은 근거리에서의 성능이 좋았으며, 전체적으로는 실시예 2의 성능이 좋음을 실험 결과로부터 알 수 있다.In the comparative example, data of 30, 60, 90, 120, 150, and 180 cm were combined into one, trained as one model, and the resulting model model_all was created, and hand movements were measured using this. In Example 1, six resulting models (model_30, model_60, model_90, model_120, model_150, model_180) corresponding to each distance were derived through data of 30, 60, 90, 120, 150, and 180 cm, and at the time of inference, a model that is close in terms of distance was selected based on the distance estimation value of the FSK radar (e.g., if the distance estimation result is 40 cm, the close model model_30 is selected and inferred). In Example 2, data of close distances among data of 30, 60, 90, 120, 150, and 180 cm were combined and learned to derive the resulting models model_30, model_3060, model_6090, model_120150, model_150180, and model_180. At the time of inference, the corresponding model was selected based on the distance estimation result of the FSK radar. For example, if it is estimated to be 40 cm, model_3060 was selected because it is between 30 and 60 cm, if it is 100 cm, model_90120 was selected because it is between 90 and 120 cm, and if it is 25 cm, model_30 was selected because it is ~30 cm. The experimental results show that Example 1 had good performance at close range, and that Example 2 had good performance overall.
상술한 바와 같이 본 발명은 레이더와 목표와의 거리를 측정할 수 있는 FSK 레이더를 이용하여 손동작을 인식한다. 또한, 본 발명은 FSK 레이더와 목표 사이의 다양한 거리에 따른 스펙트로그램을 생성하고 이를 이용하여 거리에 따른 복수의 모델을 학습시킨다. 이렇게 학습된 모델은 CNN을 이용한 추론에 이용될 수 있는데, 추론 시 레이더와 손 사이의 거리를 측정하고, 측정 데이터를 이용하여 스펙트로그램을 생성한 후 측정 거리에 해당하는 학습 모델을 이용하여 손동작을 추론할 수 있다. 따라서, 본 발명은 거리에 따라서 최적의 모델을 선택하기 때문에 목표로 한 모든 위치에서 인식률을 높일 수 있다. 또한, 인접한 두 위치의 데이터를 하나로 합쳐서 학습시켰기 때문에 그 사이에 있는 위치에 대한 인식률 또한 높일 수 있다.As described above, the present invention recognizes hand gestures using an FSK radar capable of measuring the distance between the radar and the target. In addition, the present invention generates spectrograms according to various distances between the FSK radar and the target and trains multiple models according to the distances using these. The models trained in this way can be used for inference using a CNN. During inference, the distance between the radar and the hand is measured, a spectrogram is generated using the measured data, and then the hand gesture can be inferred using the trained model corresponding to the measured distance. Therefore, the present invention can increase the recognition rate at all targeted locations because it selects the optimal model according to the distance. In addition, because the data from two adjacent locations are combined and trained, the recognition rate for locations in between can also be increased.
상기한 바와 같은 본 발명의 기술적 사상은 상기 실시 예에 따라 구체적으로 기술되었으나, 상기 실시 예는 그 설명을 위한 것이며, 그 제한을 위한 것이 아님을 주지해야 한다. 또한, 본 발명의 기술분야에서 당업자는 본 발명의 기술 사상의 범위 내에서 다양한 실시 예가 가능함을 이해할 수 있을 것이다.While the technical concepts of the present invention have been specifically described through the above-described embodiments, it should be noted that the embodiments are intended for illustrative purposes only and are not intended to limit the scope of the invention. Furthermore, those skilled in the art will appreciate that various embodiments are possible within the scope of the technical concepts of the present invention.
100 : 레이더 200 : 스펙트로그램 생성부
300 : 거리 산출부 400 : 학습부
500 : 추론부100: Radar 200: Spectrogram generator
300: Distance calculation unit 400: Learning unit
500: Inference Department
Claims (9)
상기 레이더로부터 상기 사용자의 손을 향해 연속파를 송신하는 과정과,
상기 사용자의 손동작에 따라 반사된 연속파를 상기 레이더에서 수신하는 과정과,
상기 레이더의 수신 데이터에 대한 스펙트로그램을 생성하고, 상기 레이더로부터 상기 사용자의 손까지의 거리를 산출하는 과정과,
복수의 학습 모델 중에서 산출된 거리에 따른 학습 모델을 선택하여 추론하는 과정을 포함하는 레이더와 딥러닝 기반의 거리 적응형 손동작 인식 방법.A process of creating multiple learning models by learning data according to multiple distances between the radar and the user's hand,
A process of transmitting a continuous wave from the radar toward the user's hand,
A process of receiving a continuous wave reflected according to the user's hand movements from the radar,
A process of generating a spectrogram for the received data of the above radar and calculating the distance from the radar to the user's hand,
A radar and deep learning-based distance-adaptive hand gesture recognition method including a process of selecting and inferring a learning model according to the distance produced from among multiple learning models.
레이더와 사용자의 손 사이의 거리를 복수로 상이하게 하고, 레이더로부터 연속파를 송신한 후 각 거리에서 사용자의 손에 반사된 연속파를 수신하여 각 거리에 따른 손동작을 측정하는 과정과,
숏텀 푸리에 변환을 이용하여 복수의 거리 각각에서의 스펙트로그램을 생성하는 과정과,
레이더와 손동작 사이의 복수의 거리 각각에서 생성된 스펙트로그램을 이용하여 학습시켜 복수의 학습 모델을 생성하는 과정을 포함하는 레이더와 딥러닝 기반의 거리 적응형 손동작 인식 방법.In claim 1, the process of generating the plurality of learning models comprises:
A process of changing the distance between the radar and the user's hand to multiple different distances, transmitting a continuous wave from the radar, and then receiving the continuous wave reflected by the user's hand at each distance to measure hand movements according to each distance,
A process of generating spectrograms at each of multiple distances using short-term Fourier transform,
A radar and deep learning-based distance-adaptive hand gesture recognition method comprising a process of creating multiple learning models by training using spectrograms generated at each of multiple distances between radar and hand gestures.
[수학식 1]
여기서, fa 및 fb는 레이더의 캐리어 주파수이며, c는 빛의 속도이고, Δφ는 수신된 두 신호의 위상차이다.In claim 4, a radar and deep learning-based distance-adaptive hand gesture recognition method wherein the distance between the radar and the user's hand is calculated by [Mathematical Formula 1].
[Mathematical Formula 1]
Here, f a and f b are the carrier frequencies of the radar, c is the speed of light, and Δφ is the phase difference between the two received signals.
숏텀 푸리에 변환을 통해 스펙트로그램을 생성하는 스펙트로그램 생성부와,
상기 레이더와 사용자의 손까지의 거리를 산출하는 거리 산출부와,
상기 레이더와 상기 사용자의 손 사이의 복수의 상이한 거리에 따른 데이터를 학습하여 복수의 학습 모델을 생성하는 학습부와,
상기 학습부로부터 복수의 학습 모델 중에서 산출된 거리에 따른 학습 모델을 선택하여 추론하는 추론부를 포함하는 레이더와 딥러닝 기반의 거리 적응형 손동작 인식 장치.A radar that generates and transmits continuous waves and receives reflected signals according to the user's hand movements,
A spectrogram generation unit that generates a spectrogram through short-term Fourier transform,
A distance calculation unit that calculates the distance between the radar and the user's hand,
A learning unit that learns data according to multiple different distances between the radar and the user's hand to generate multiple learning models;
A radar and deep learning-based distance-adaptive hand gesture recognition device including an inference unit that selects and infers a learning model according to a distance produced from among multiple learning models from the above learning unit.
[수학식 1]
여기서, fa 및 fb는 레이더의 캐리어 주파수이며, c는 빛의 속도이고, Δφ는 수신된 두 신호의 위상차이다.In claim 7, a radar and a deep learning-based distance-adaptive hand gesture recognition device, wherein the distance between the radar and the user's hand is calculated by [Mathematical Formula 1].
[Mathematical Formula 1]
Here, f a and f b are the carrier frequencies of the radar, c is the speed of light, and Δφ is the phase difference between the two received signals.
In claim 6 or claim 8, the learning unit is a radar and deep learning-based distance-adaptive hand gesture recognition device that learns by combining data from two adjacent distances.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| KR1020240027738A KR20250131372A (en) | 2024-02-27 | 2024-02-27 | Distance adaptive hand gesture recognition method and apparatus based on radar and deep learning |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| KR1020240027738A KR20250131372A (en) | 2024-02-27 | 2024-02-27 | Distance adaptive hand gesture recognition method and apparatus based on radar and deep learning |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| KR20250131372A true KR20250131372A (en) | 2025-09-03 |
Family
ID=97069568
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| KR1020240027738A Pending KR20250131372A (en) | 2024-02-27 | 2024-02-27 | Distance adaptive hand gesture recognition method and apparatus based on radar and deep learning |
Country Status (1)
| Country | Link |
|---|---|
| KR (1) | KR20250131372A (en) |
Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR20170012422A (en) | 2014-08-07 | 2017-02-02 | 구글 인코포레이티드 | Radar-based gesture recognition |
-
2024
- 2024-02-27 KR KR1020240027738A patent/KR20250131372A/en active Pending
Patent Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR20170012422A (en) | 2014-08-07 | 2017-02-02 | 구글 인코포레이티드 | Radar-based gesture recognition |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| Khalaf et al. | Survey on recognition hand gesture by using data mining algorithms | |
| US11460538B2 (en) | Detecting a frame-of-reference change in a smart-device-based radar system | |
| EP4131064A1 (en) | Gesture recognition method and related apparatus | |
| CN111476058B (en) | Gesture recognition method based on millimeter wave radar | |
| CN110450784A (en) | A kind of driver status monitoring method and system based on fmcw radar | |
| EP3339880B1 (en) | Adaptive radar system | |
| CN109429235B (en) | Beam scanning method, network side equipment and mobile communication terminal | |
| Qiao et al. | Human activity classification based on moving orientation determining using multistatic micro-Doppler radar signals | |
| JP2019184370A (en) | Radar system | |
| CN105046225B (en) | A kind of vehicle distance detecting method based on tailstock detection | |
| KR101988182B1 (en) | Apparatus for hand motion recognition using continuous wave radar and method thereof | |
| CN114708663B (en) | A millimeter wave radar sensing gesture recognition method | |
| Bai et al. | WiDrive: Adaptive WiFi-based recognition of driver activity for real-time and safe takeover | |
| CN116664620B (en) | Picture dynamic capturing method and related device based on tracking system | |
| EP3791315A1 (en) | Radio frequency (rf) object detection using radar and machine learning | |
| KR20160066928A (en) | Apparatus and method for computer aided diagnosis, Apparatus for controlling ultrasonic transmission pattern of probe | |
| CN110507360B (en) | Shear wave imaging method and system | |
| CN119722371A (en) | An intelligent survey system and method for deep-sea mesopelagic fish resources | |
| KR20250131372A (en) | Distance adaptive hand gesture recognition method and apparatus based on radar and deep learning | |
| KR102140045B1 (en) | Apparatus of recognition hand gesture using mirror padding and method thereof | |
| CN109347580B (en) | Self-adaptive threshold signal detection method with known duty ratio | |
| CN109710078A (en) | Intelligent control method, system, receiving device and storage medium | |
| JP2021179323A (en) | Attribute identification device and identification method | |
| Valtl et al. | Frequency modulated continuous wave radar-based navigation algorithm using artificial neural network for autonomous driving | |
| Nava et al. | Self-Supervised Learning of Visual Robot Localization Using LED State Prediction as a Pretext Task |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| PA0109 | Patent application |
St.27 status event code: A-0-1-A10-A12-nap-PA0109 |
|
| PA0201 | Request for examination |
St.27 status event code: A-1-2-D10-D11-exm-PA0201 |
|
| PE0902 | Notice of grounds for rejection |
St.27 status event code: A-1-2-D10-D21-exm-PE0902 |
|
| PG1501 | Laying open of application |
St.27 status event code: A-1-1-Q10-Q12-nap-PG1501 |