[go: up one dir, main page]

KR20250109682A - A thermodynamic computational system for sampling high-dimensional probability distributions - Google Patents

A thermodynamic computational system for sampling high-dimensional probability distributions

Info

Publication number
KR20250109682A
KR20250109682A KR1020257015307A KR20257015307A KR20250109682A KR 20250109682 A KR20250109682 A KR 20250109682A KR 1020257015307 A KR1020257015307 A KR 1020257015307A KR 20257015307 A KR20257015307 A KR 20257015307A KR 20250109682 A KR20250109682 A KR 20250109682A
Authority
KR
South Korea
Prior art keywords
analog
distribution
voltage
unit cell
matrix
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
KR1020257015307A
Other languages
Korean (ko)
Inventor
패트릭 콜스
콜린 스즈체판스키
카에란 도나텔라
데니스 멜란슨
맥스 헌터 고든
파리스 스바히
안토니오 마르티네즈
맥스웰 아이퍼
모함마드 아부 카터
Original Assignee
노멀 컴퓨팅 코포레이션
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 노멀 컴퓨팅 코포레이션 filed Critical 노멀 컴퓨팅 코포레이션
Publication of KR20250109682A publication Critical patent/KR20250109682A/en
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/09Supervised learning
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/06Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons
    • G06N3/063Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons using electronic means
    • G06N3/065Analogue means
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01RMEASURING ELECTRIC VARIABLES; MEASURING MAGNETIC VARIABLES
    • G01R19/00Arrangements for measuring currents or voltages or for indicating presence or sign thereof
    • G01R19/25Arrangements for measuring currents or voltages or for indicating presence or sign thereof using digital measurement techniques
    • G01R19/2506Arrangements for conditioning or analysing measured signals, e.g. for indicating peak values ; Details concerning sampling, digitizing or waveform capturing
    • G01R19/2509Details concerning sampling, digitizing or waveform capturing
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/217Validation; Performance evaluation; Active pattern learning techniques
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/047Probabilistic or stochastic networks
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/0499Feedforward networks
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/06Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons
    • G06N3/063Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons using electronic means
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/01Probabilistic graphical models, e.g. probabilistic networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Software Systems (AREA)
  • Biophysics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Neurology (AREA)
  • Medical Informatics (AREA)
  • Algebra (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Complex Calculations (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

열역학 컴퓨팅 플랫폼이 디지털 프로세서에 의해 제어되는 결합된 아날로그 단위 셀 네트워크를 사용하여 다변량 가우시안 분포와 같은 다변량 분포를 샘플링한다. 아날로그 단위 셀들은 서로 용량성, 저항성 및/또는 유도성으로 결합된다. 각 아날로그 단위 셀은 조정가능 저항기, 커패시터, 인덕터, 전류원 및/또는 전압원을 포함한다. 디지털 프로세서는 이들 구성요소의 초기값들을 설정한다. 이들 값, 또는 입력 매개변수들은 다변량 분포를 나타낸다. 그때 결합된 아날로그 단위 셀 네트워크는 일련의 시간 단계에 걸쳐 열 평형에 도달할 때까지 진화한다. 해당 네트워크가 진화하는 동안 디지털 프로세서는 각 시간 단계에 네트워크의 노드들에서 전압들을 샘플링한다. 이들 전압은 다변량 분포의 샘플들을 나타낸다.A thermodynamic computing platform samples a multivariate distribution, such as a multivariate Gaussian distribution, using a network of coupled analog unit cells controlled by a digital processor. The analog unit cells are coupled to each other capacitively, resistively, and/or inductively. Each analog unit cell includes a tunable resistor, capacitor, inductor, current source, and/or voltage source. The digital processor sets initial values for these components. These values, or input parameters, represent the multivariate distribution. The coupled analog unit cell network is then evolved over a series of time steps until it reaches thermal equilibrium. While the network evolves, the digital processor samples voltages at nodes in the network at each time step. These voltages represent samples of the multivariate distribution.

Description

고차원 확률 분포의 샘플링을 위한 열역학 연산 시스템A thermodynamic computational system for sampling high-dimensional probability distributions

본 출원은 2023년 8월 9일자로 출원된 미국 출원 제63/518,545호; 2023년 3월 29일자로 출원된 미국 출원 제63/492,832호; 및 2022년 10월 14일자로 출원된 미국 출원 제63/379,561호를 35 U.S.C.119(e)하에 우선권을 주장한다. 이들 출원 각각은 다목적으로 그 전체가 참조에 의해 본원에 원용된다.This application claims the benefit of U.S. patent application Ser. No. 63/518,545, filed Aug. 9, 2023; U.S. patent application Ser. No. 63/492,832, filed Mar. 29, 2023; and U.S. patent application Ser. No. 63/379,561, filed Oct. 14, 2022, under 35 U.S.C. 119(e). Each of these applications is incorporated herein by reference in its entirety for all purposes.

기존의 인공지능(artificial intelligence, AI)과 머신 러닝(machine learning, ML)은 불확실성이 중요하지 않을 때 가장 효과적으로 동작한다. 하지만 실제로는 불확실성이 만연해 있는 경우가 많다. 잡음 있는(noisy) 데이터는 AI 예측 및 ML 예측에 불확실성을 더하여 이들 예측을 신뢰할 수 없게 만든다. 이는 AI가 언제 인간의 입력을 따라야 하는지 판단하는 능력을 떨어뜨린다. 이는 형사 사법, 의료, 에너지, 금융, 국방, 제조, 로봇공학 등과 같은 AI에 대한 고위험 응용들의 맥락에서 특히 두드러진다. 예를 들어, 흑색종 진단을 담당하는 보조 모델을 고려한다. 이상적으로 이러한 모델은 불확실한 경우 의료인에게 판단을 맡겨야 한다. 마찬가지로, 자율주행차의 AI는 보행자가 도로에 있는지 여부가 확실하지 않다면 인간 운전자에게 제어권을 넘겨야 한다. 하지만 불확실성으로 인해 AI의 예측하는 능력이 저하되면, AI는 인간의 판단에 효과적으로 따르지 못할 수 있다.Traditional artificial intelligence (AI) and machine learning (ML) work best when uncertainty is not a concern. However, uncertainty is often rife. Noisy data adds uncertainty to AI and ML predictions, making them unreliable. This reduces the AI’s ability to judge when to follow human input. This is especially true in the context of high-stakes applications for AI, such as criminal justice, healthcare, energy, finance, defense, manufacturing, and robotics. For example, consider an assistant model that diagnoses melanoma. Ideally, such a model should defer to a medical professional when uncertain. Similarly, an AI in a self-driving car should hand over control to a human driver when it is uncertain whether a pedestrian is in the roadway. However, if uncertainty impairs the AI’s ability to predict, it may not be able to effectively follow human judgment.

불확실성은 두 가지 주요 범주로 나눌 수 있다. 첫째, 보통은 잡음 있는 데이터나 특징 누락으로 인해 발생하는 모호성("우발적 모호성(aleatoric ambiguity)")이 있다. 우발적 모호성은 AI 또는 ML 시스템을 더 많은 데이터에 노출시키는 것과 무관하게 지속된다. 예를 들어, 자율주행차의 지각(perception) 시스템은 잡음 있는 센서와 영상화를 포함한다. 둘째, 유한한 훈련 데이터로 인한 불확실성("인지적 불확실성(epistemic uncertainty)")이 있다. 모델 입력은 훈련 데이터와 서로 다르게 보일 수 있거나, 또는 훈련 데이터 내해당 입력을 뒷받침하는 예들이 거의 없을 수 있다. 모델이 더 많은 데이터로 훈련될수록 인지적 불확실성은 감소한다.Uncertainty can be divided into two main categories. First, there is ambiguity, which is usually caused by noisy data or missing features (“aleatoric ambiguity”). Aleatoric ambiguity persists regardless of how much data an AI or ML system is exposed to. For example, a perception system for a self-driving car may contain noisy sensors and imaging. Second, there is uncertainty due to finite training data (“epistemic uncertainty”). Model inputs may look different from the training data, or there may be few examples in the training data that support the inputs. Epistemic uncertainty decreases as the model is trained with more data.

기존 AI는 자신의 결정에 신뢰 수준(예컨대, 이미지가 특정 인물 또는 사물을 보여줄 90% 신뢰도)을 할당함으로써 불확실성을 해결한다. 결정에 신뢰도를 할당함으로써, AI는 해당 결정과 연관된 불확실성을 정량화한다. 안타깝게도 기존 AI와 ML은 일반적으로 정확하게 정량화된 불확실성을 할당하는 의미있는 방식이 부족하다.Traditional AI addresses uncertainty by assigning a level of confidence to its decisions (e.g., 90% confidence that an image shows a particular person or object). By assigning a confidence level to a decision, AI quantifies the uncertainty associated with that decision. Unfortunately, traditional AI and ML generally lack meaningful ways to assign precisely quantified uncertainty.

도 1은 불확실성이 실제 상황에서 자신의 예측에 유의미한 신뢰 수준을 할당하는 주류 심층 신경망의 능력에 어떻게 영향을 미치는지를 예시한다. 이는 심층 신경망의 예측에 대한 불확실성(신뢰도)의 이상화된 산점도(plot) 및 실제 산점도를 보여주는데, 음영이 더 어두울수록 더 높은 신뢰도를 나타낸다. 심층 신경망은 도 1의 두 산점도에 보인 반원을 따라 분포된 훈련 데이터(도트들)에 대해 훈련되었다. 훈련된 심층 신경망에는 그 다음에 산점도들 둘 다의 y 1.5에서 x 0부터 x 1.5까지 모여 있는 "분포 외" 입력 데이터(도트들)가 제시되었다. 이상적으로, 심층 신경망은 왼쪽 산점도에 보인 바와 같이 입력 데이터에 대한 자신의 예측들이 매우 불확실하거나 신뢰도가 낮다(밝은 음영)는 것을 인식해야 한다. 그러나 실제로 심층 신경망은 입력 데이터가 훈련 데이터와 거리가 멀더라도 오른쪽 산점도에 보인 바와 같이 자신의 예측들에 높은 신뢰도(어두운 음영)를 할당한다. 안타깝게도 일반적인 AI 및 ML 모델은 익숙하지 않은 입력 데이터를 처리할 때 예측을 특히 과신하는 경향이 있다.Figure 1 illustrates how uncertainty affects the ability of a mainstream deep neural network to assign a meaningful level of confidence to its predictions in real-world situations. It shows an idealized and actual scatterplot of the uncertainty (confidence) of the deep neural network's predictions, with darker shading indicating higher confidence. The deep neural network was trained on training data (dots) distributed along the semicircles shown in the two scatterplots in Figure 1. The trained deep neural network was then trained on the y 1.5 to x 0 to x The “out-of-distribution” input data (dots) are presented, clustered up to 1.5. Ideally, the deep neural network should recognize that its predictions for the input data are very uncertain or have low confidence (light shading), as shown in the scatterplot on the left. However, in practice, the deep neural network assigns high confidence (dark shading) to its predictions, even when the input data is far from the training data, as shown in the scatterplot on the right. Unfortunately, common AI and ML models tend to be overconfident in their predictions, especially when dealing with unfamiliar input data.

다행히도 확률적 AI 및 ML은 예측의 불확실성을 정량화하고 설명할 수 있다. 확률적 AI 및 ML은 AI와 ML을 확률적 추리와 결합하고, 확률적 추리는 사전 신념(prior belief), 편향, 및 데이터의 함수로서 불확실성을 결정하는 수학적 과정이다. 어떠한 수준의 이해관계에 대해서도, 불확실성이 존재하는 한 확률적 추리가 최적이어야 한다. 확률적 AI와 확률적 추리는 가우시안 분포와 같은 연속 분포를 자연스럽게 수반하여 사용자의 지식 상태를 반영한다. 안타깝게도 표준 디지털 컴퓨터를 사용할 때, 이들 연속 분포를 이용하여 확률적 추리를 수행하면, 모델 복잡도의 증가에 따라 계산상의 어려움이 심각하게 악화된다.Fortunately, probabilistic AI and ML can quantify and account for uncertainty in predictions. Probabilistic AI and ML combine AI and ML with probabilistic reasoning, a mathematical process that determines uncertainty as a function of prior beliefs, biases, and data. For any level of stake, probabilistic reasoning should be optimal as long as uncertainty exists. Probabilistic AI and probabilistic reasoning naturally entail continuous distributions, such as the Gaussian distribution, to reflect the user’s state of knowledge. Unfortunately, when performing probabilistic reasoning using these continuous distributions on standard digital computers, the computational difficulty becomes severely worse as the model complexity increases.

자연은 열역학적 평형의 물리적 원리를 통해 확률적 추리를 수행한다. 확률적 AI 모델은 통상적으로 연속 확률 변수들의 측면에서 작동하는 확률적 추리를 통해 학습되고 추론된다. 열역학 컴퓨팅 플랫폼은 열역학적 평형을 이용하여 확률적 인공지능 및 머신 러닝을 위한 확률적 추리를 수행할 수 있다. 시스템의 열역학적 평형은 물리계(physical system)가 가능한 상태들에 대한 안정적인 확률 분포에 의해 설명될 수 있을 때까지 물리계를 진화시키는 동역학을 설명한다; 본 발명의 기술은 이러한 열역학적 평형을 계산에 사용하며, 동역학이 상태들에 대한 최종 확률 분포가 계산 중인 목표 확률 분포와 일치하도록 설계 구현(engineering)되었다. 또한, 본질적으로 연속적인 물리계를 이용하면 확률적 추리에서 사용되는 연속 분포들의 수학적 프레임워크와 자연스럽게 일치한다.Nature performs probabilistic reasoning through the physical principles of thermodynamic equilibrium. Probabilistic AI models are typically learned and inferred through probabilistic reasoning that operates in terms of continuous random variables. A thermodynamic computing platform can perform probabilistic reasoning for probabilistic AI and machine learning using thermodynamic equilibrium. The thermodynamic equilibrium of a system describes the dynamics that evolve a physical system until it can be described by a stable probability distribution over possible states; the technology of the present invention uses this thermodynamic equilibrium for computation, and the dynamics are designed and implemented such that the final probability distribution over the states matches the target probability distribution being computed. Furthermore, utilizing a physical system that is inherently continuous naturally aligns with the mathematical framework of continuous distributions used in probabilistic reasoning.

본 발명의 기술은 다변량 가우시안 확률 분포와 같은 다변량 분포를 샘플링하기 위한 열역학 시스템으로서 구현될 수 있다. 이 시스템은 디지털 컨트롤러에 동작 가능하게 결합되는 결합된 조화 오실레이터(harmonic oscillator) 네트워크를 포함할 수 있다. 결합된 조화 오실레이터 네트워크는 다변량 분포에 매핑되는 해밀토니안(Hamiltonian)에 의해 특성화된다. 결합된 조화 오실레이터 네트워크의 각 결합된 조화 오실레이터는 디지털 조정가능(tunable) 인덕터, 디지털 조정가능 커패시터, 디지털 조정가능 전압원, 및 디지털 조정가능 전류원을 포함한다. 디지털 컨트롤러는 디지털 조정가능 인덕터, 디지털 조정가능 커패시터, 디지털 조정가능 전압원, 및 디지털 조정가능 전류원을 초기화한다. 이는 결합된 조화 오실레이터 네트워크의 노드들에서의 전압들 및 전류들을 반복적으로 판독하고, 해당 전압들 및 전류들에 기반하여 디지털 조정가능 전압원들 및 디지털 조정가능 전류원들을 업데이트한다. 이들 전압 및 전류는 해밀토니안의 위치들 및 운동량들에 해당한다. 디지털 컨트롤러는 또한 전압들 및 전류들을 다변량 분포의 샘플들로 변환한다.The present invention can be implemented as a thermodynamic system for sampling a multivariate distribution, such as a multivariate Gaussian probability distribution. The system can include a network of coupled harmonic oscillators operably coupled to a digital controller. The network of coupled harmonic oscillators is characterized by a Hamiltonian that maps to the multivariate distribution. Each coupled harmonic oscillator of the network of coupled harmonic oscillators includes a digitally tunable inductor, a digitally tunable capacitor, a digitally tunable voltage source, and a digitally tunable current source. The digital controller initializes the digitally tunable inductor, the digitally tunable capacitor, the digitally tunable voltage source, and the digitally tunable current source. It repeatedly reads voltages and currents at nodes of the network of coupled harmonic oscillators and updates the digitally tunable voltage sources and the digitally tunable current sources based on the voltages and currents. These voltages and currents correspond to positions and momentums of the Hamiltonian. The digital controller also converts the voltages and currents into samples of a multivariate distribution.

결합된 조화 오실레이터 네트워크는 다변량 분포의 각 차원에 대해 하나의 조화 오실레이터를 포함할 수 있다. 조화 오실레이터들은 서로 용량성, 유도성 및/또는 저항성으로 결합될 수 있다.A coupled harmonic oscillator network may include one harmonic oscillator for each dimension of the multivariate distribution. The harmonic oscillators may be coupled to each other capacitively, inductively, and/or resistively.

본 발명의 기술의 다른 구현예는 목표 확률 분포를 샘플링하기 위한 열역학 시스템이다. 이 열역학 시스템은 아날로그 동역학 시스템과 디지털 컨트롤러 둘 다를 포함한다. 아날로그 동역학 시스템은 해밀턴 방정식들을 통해 일련의 시간 단계에 걸쳐 진화하여 목표 확률 분포의 샘플들을 제공하도록 구성된다. 디지털 컨트롤러는 아날로그 동역학 시스템에 동작 가능하게 결합되고, 시간 단계들 각각에서, 목표 확률 분포의 제안된 샘플을 수신하고 제안된 샘플을 수용하거나 거부하도록 구성된다.Another embodiment of the present invention is a thermodynamic system for sampling a target probability distribution. The thermodynamic system comprises both an analog dynamical system and a digital controller. The analog dynamical system is configured to evolve over a series of time steps via Hamiltonian equations to provide samples of the target probability distribution. The digital controller is operably coupled to the analog dynamical system and is configured to receive, at each of the time steps, a proposed sample of the target probability distribution and to accept or reject the proposed sample.

본 발명의 기술의 또 다른 구현예는 다변량 가우시안 확률 분포와 같은 다변량 분포를 샘플링하기 위한 열역학 시스템이다. 이 시스템은 디지털 컨트롤러에 동작 가능하게 결합되는 아날로그 전기 회로(예컨대, 결합된 조화 오실레이터들의) 네트워크를 포함할 수 있다. 아날로그 전기 회로들 각각은 적어도 하나의 조정가능 수동형 전기 부품(예컨대, 디지털 조정가능 인덕터, 디지털 조정가능 커패시터 및/또는 디지털 조정가능 저항기)을 포함한다. 동작 시, 디지털 컨트롤러는 다변량 분포에 따라 조정가능 수동형 전기 부품들을 조정하고 아날로그 전기 회로 네트워크 내의 지점들의 전압들을 샘플링한다.Another embodiment of the present technology is a thermodynamic system for sampling a multivariate distribution, such as a multivariate Gaussian probability distribution. The system can include a network of analog electrical circuits (e.g., coupled harmonic oscillators) operably coupled to a digital controller. Each of the analog electrical circuits includes at least one adjustable passive electrical component (e.g., a digitally adjustable inductor, a digitally adjustable capacitor, and/or a digitally adjustable resistor). In operation, the digital controller adjusts the adjustable passive electrical components according to the multivariate distribution and samples voltages at points within the network of analog electrical circuits.

이러한 열역학 시스템은 또한 아날로그 전기 회로 네트워크에 동작 가능하게 결합된 전압 제어 전압원(voltage-controlled voltage source)을 포함하여 다변량 분포를 수정할 수 있다. 전압 제어 전압원은 인공 신경망을 채용하여 전압 제어 전압원에의 입력 전압과 전압 제어 전압원의 출력 전압을 관련지을 수 있다. 이 경우, 입력 전압은 디지털 컨트롤러에 의해 샘플링된 전압들에 기반하고, 전압 제어 전압원은 아날로그 전기 회로 네트워크에 출력 전압을 인가하여 아날로그 전기 회로 네트워크 전체의 퍼텐셜 에너지 분포를 변경하도록 구성될 수 있다.Such thermodynamic systems can also include a voltage-controlled voltage source operably coupled to an analog electrical circuit network to modify the multivariate distribution. The voltage-controlled voltage source can employ an artificial neural network to relate an input voltage to the voltage-controlled voltage source and an output voltage of the voltage-controlled voltage source. In this case, the input voltage is based on voltages sampled by a digital controller, and the voltage-controlled voltage source can be configured to apply an output voltage to the analog electrical circuit network to modify the potential energy distribution of the entire analog electrical circuit network.

다변량 분포는 적어도 3차의 0이 아닌 큐뮬런트(cumulant)를 가질 수 있으며, 이 경우 시스템은 아날로그 전기 회로 네트워크 내의 적어도 3개의 아날로그 전기 회로에 동작 가능하게 결합되는 멀티포트 소자를 포함한다. 이 멀티포트 소자는 아날로그 전기 회로 네트워크의 퍼텐셜 에너지 분포에서 k-체 항을 생성할 수 있으며, 여기서 k는 3 이상의 정수이다. 예를 들어, 멀티포트 소자는 트랜지스터, 전압 제어 커패시터(voltage-controlled capacitor), 또는 둘 다를 포함할 수 있다.The multivariate distribution can have a non-zero cumulant of at least order 3, in which case the system comprises a multiport element operably coupled to at least three analog electrical circuits in the analog electrical circuit network. The multiport element is capable of generating k -field terms in the potential energy distribution of the analog electrical circuit network, where k is an integer greater than or equal to 3. For example, the multiport element can comprise a transistor, a voltage-controlled capacitor, or both.

열역학 시스템의 각 아날로그 전기 회로는 또한 열(thermal) 잡음원, 샷(shot) 잡음원 또는 디지털 의사 랜덤 잡음원과 같은 확률적 잡음원를 포함할 수 있다. 그리고 아날로그 전기 회로 네트워크의 아날로그 전기 회로들은 용량성 및/또는 저항성 결합을 통해 서로 결합될 수 있다.Each analog electrical circuit in the thermodynamic system may also include stochastic noise sources, such as thermal noise sources, shot noise sources, or digital pseudo-random noise sources. And the analog electrical circuits in the analog electrical circuit network may be coupled to each other through capacitive and/or resistive coupling.

열역학 시스템은 랑주뱅 몬테카를로 알고리즘 및/또는 메트로폴리스 조정 랑주뱅 알고리즘을 통해 다변량 분포로부터 샘플들을 생성할 수 있다.Thermodynamic systems can generate samples from multivariate distributions via the Langevin Monte Carlo algorithm and/or the Metropolis-adjusted Langevin algorithm.

다변량 분포의 공분산 행렬은 아날로그 전기 회로 네트워크의 파라미터들 중 적어도 일부에 인코딩될 수 있다.The covariance matrix of a multivariate distribution can be encoded in at least some of the parameters of an analog electrical circuit network.

다변량 분포(예컨대, 다변량 가우시안 분포 또는 2차보다 높은 0이 아닌 큐뮬런트를 갖는 분포)를 샘플링하기 위한 또 다른 본 발명 시스템은 디지털 컨트롤러에 동작 가능하게 결합되는 결합된 아날로그 단위 셀 네트워크를 포함한다. 결합된 아날로그 단위 셀 네트워크는 다변량 분포에 매핑되는 총 에너지 함수에 의해 특성화된다. 결합된 각 아날로그 단위 셀은 디지털 조정가능 커패시터와 디지털 조정가능 전압원, 디지털 조정가능 전류원, 또는 디지털 조정가능 전압원 및 디지털 조정가능 전류원 둘 다 중 어느 한 쪽을 포함한다. 동작 시, 디지털 컨트롤러는 디지털 조정가능 커패시터, 전압원 및/또는 전류원를 초기화한다. 디지털 컨트롤러는 결합된 아날로그 단위 셀 네트워크의 노드들에서의 전압들 및 전류들을 반복적으로 판독하고 디지털 조정가능 전압원들 및/또는 디지털 조정가능 전류원들을 업데이트한다. 전압들 및 전류들은 총 에너지 함수의 위치들 및 운동량들에 해당하며, 디지털 컨트롤러는 전압들 및 전류들을 다변량 분포의 샘플들로 변환한다.Another inventive system for sampling a multivariate distribution (e.g., a multivariate Gaussian distribution or a distribution having a non-zero cumulant higher than order 2) comprises a coupled analog unit cell network operably coupled to a digital controller. The coupled analog unit cell network is characterized by a total energy function that maps to the multivariate distribution. Each coupled analog unit cell comprises a digitally adjustable capacitor and either a digitally adjustable voltage source, a digitally adjustable current source, or both a digitally adjustable voltage source and a digitally adjustable current source. In operation, the digital controller initializes the digitally adjustable capacitor, the voltage source, and/or the current source. The digital controller repeatedly reads voltages and currents at nodes of the coupled analog unit cell network and updates the digitally adjustable voltage sources and/or the digitally adjustable current sources. The voltages and currents correspond to positions and momentums of the total energy function, and the digital controller converts the voltages and currents into samples of the multivariate distribution.

총 에너지 함수는 해밀토니안일 수 있으며, 이 경우 결합된 아날로그 단위 셀 네트워크는 해밀토니안 몬테카를로(Hamiltonian Monte Carlo) 프로토콜을 실행하는 데 사용되는 동역학을 갖는다. 대안적으로, 결합된 아날로그 단위 셀 네트워크는 랑주뱅 몬테카를로 프로토콜을 실행하는 데 사용되는 동역학을 가질 수 있다.The total energy function can be Hamiltonian, in which case the coupled analog unit cell network has dynamics that are used to execute the Hamiltonian Monte Carlo protocol. Alternatively, the coupled analog unit cell network can have dynamics that are used to execute the Langevin Monte Carlo protocol.

결합된 아날로그 단위 셀 네트워크는 다변량 분포의 각 차원에 대해 하나의 아날로그 단위 셀을 포함할 수 있다. 아날로그 단위 셀들 각각은 또한 디지털 조정가능 인덕터를 포함할 수 있다. 아날로그 단위 셀들은 용량성, 저항성 및/또는 유도성으로 서로 결합될 수 있다.A coupled analog unit cell network may include one analog unit cell for each dimension of the multivariate distribution. Each of the analog unit cells may also include a digitally tunable inductor. The analog unit cells may be capacitively, resistively, and/or inductively coupled to one another.

다변량 분포를 샘플링하기 위한 또 다른 본 발명 시스템은 기울기 계산기(예컨대, 아날로그 신경망(analog neural network) 또는 저항 회로 소자 네트워크), 기울기 계산기에 동작 가능하게 결합되는 운동량 적분기 장치, 및 운동량 적분기 장치에 동작 가능하게 결합되는 위치 적분기 장치를 포함한다.Another inventive system for sampling a multivariate distribution comprises a gradient calculator (e.g., an analog neural network or a network of resistive circuit elements), a momentum integrator device operably coupled to the gradient calculator, and a position integrator device operably coupled to the momentum integrator device.

목표 확률 분포를 샘플링하기 위한 또 다른 본 발명 열역학 시스템은 디지털 컨트롤러에 동작 가능하게 결합되는 아날로그 동역학 시스템을 포함한다. 아날로그 동역학 시스템은 랑주뱅 방정식 및/또는 해밀토니안 운동 방정식을 통해 진화하도록 구성된다. 그리고 디지털 컨트롤러는 랑주뱅 방정식 및/또는 해밀턴 운동 방정식의 각 시간 단계에서 아날로그 동역학 시스템으로부터 목표 확률 분포의 제안된 샘플을 수신하고 제안된 샘플을 수용하거나 거부하도록 구성된다.Another inventive thermodynamic system for sampling a target probability distribution comprises an analog dynamical system operably coupled to a digital controller. The analog dynamical system is configured to evolve through the Langevin equations and/or the Hamiltonian equations of motion. And the digital controller is configured to receive a proposed sample of the target probability distribution from the analog dynamical system at each time step of the Langevin equations and/or the Hamiltonian equations of motion and to accept or reject the proposed sample.

본 발명의 방법들은 행렬의 역행렬을 구하는 방법을 포함한다. 이 방법은 행렬의 원소들을 아날로그 단위 셀 네트워크의 조정가능 회로 소자들의 각각의 값들에 업로드하는 단계, 아날로그 단위 셀 네트워크가 열 평형에 도달하도록 허용하는 단계, 및 아날로그 단위 셀 네트워크의 동역학 변수들에 기반하여 공분산 행렬을 계산하는 단계를 포함한다. 이 공분산 행렬은 행렬의 역행렬이다. 공분산 행렬을 계산하는 단계는 아날로그 단위 셀 네트워크의 동역학 변수들의 열 평형 분포에서 샘플들을 추출하는 단계와 샘플들의 공분산 행렬을 계산하는 단계를 포함할 수 있다. 공분산 행렬을 계산하는 단계는 또한 복수의 아날로그 적분기를 이용하여 시간 경과에 따라 동역학 변수들을 적분하는 단계를 포함할 수 있다.The methods of the present invention include a method of finding an inverse matrix of a matrix. The method includes the steps of uploading elements of the matrix to respective values of tunable circuit elements of an analog unit cell network, allowing the analog unit cell network to reach thermal equilibrium, and computing a covariance matrix based on dynamic variables of the analog unit cell network. The covariance matrix is an inverse matrix of the matrix. The step of computing the covariance matrix may include the steps of extracting samples from a thermal equilibrium distribution of dynamic variables of the analog unit cell network and computing a covariance matrix of the samples. The step of computing the covariance matrix may also include the step of integrating the dynamic variables over time using a plurality of analog integrators.

다른 본 발명 방법은 행렬과 벡터에 의해 표현되는 선형 방정식 시스템을 푸는 방법을 포함한다. 이 방법은 행렬의 원소들을 아날로그 단위 셀 네트워크의 조정가능 회로 소자들의 각각의 값들에 업로드하는 단계, 벡터의 요소들을 아날로그 단위 셀들의 각각의 전류원들 또는 전압원들에 업로드하는 단계, 아날로그 단위 셀 네트워크가 열 평형에 도달하도록 허용하는 단계, 및 아날로그 단위 셀 네트워크의 동역학 변수들의 평균값들을 계산하는 단계를 포함한다. 평균값들은 선형 방정식 시스템의 해를 나타낸다. 평균값들을 계산하는 단계는 복수의 아날로그 적분기를 이용하여 시간 경과에 따라 동역학 변수들을 적분하는 단계를 포함할 수 있다.Another inventive method comprises a method of solving a system of linear equations represented by a matrix and a vector. The method comprises the steps of uploading elements of the matrix to respective values of adjustable circuit elements of the analog unit cell network, uploading elements of the vector to respective current sources or voltage sources of the analog unit cells, allowing the analog unit cell network to reach thermal equilibrium, and computing averages of dynamic variables of the analog unit cell network. The averages represent solutions to the system of linear equations. The step of computing the averages may comprise the step of integrating the dynamic variables over time using a plurality of analog integrators.

앞서 설명된 개념들과 아래에서 더 자세히 논의되는 추가 개념들의 모든 조합은(이러한 개념들이 상호 모순되지 않는 한) 본 개시에서 개시된 본 발명의 주제의 일부인 것으로 생각된다. 특히, 본 명세서의 마지막에 나타낸 청구된 본 발명의 주제의 모든 조합들은 본 개시에서 개시되는 본 발명의 주제의 일부인 것으로 생각된다. 참조에 의해 본 개시에 원용되는 임의의 개시물에서 나타날 수 있는 본 개시에서 명시적으로 채용되는 기술용어는 본 개시에서 개시되는 특정 개념들과 가장 일치하는 의미를 가져야 한다.All combinations of the concepts described above with additional concepts discussed in more detail below (so long as such concepts are not mutually inconsistent) are considered to be part of the inventive subject matter disclosed in this disclosure. In particular, all combinations of claimed inventive subject matter that appear at the end of this specification are considered to be part of the inventive subject matter disclosed in this disclosure. Any technical terminology explicitly employed in this disclosure that may appear in any disclosure incorporated by reference herein should have a meaning most consistent with the specific concepts disclosed in this disclosure.

통상의 기술자는 도면이 주로 예시 목적을 위한 것이고 본 개시에서 설명되는 본 발명의 주제의 범위를 제한하려는 의도가 아님을 이해할 것이다. 도면이 반드시 축척에 맞게 그려지는 것은 아니며; 일부 경우에는, 본 개시에서 개시되는 본 발명의 다양한 양태들은 다양한 특징에 대한 이해를 용이하게 하기 위해 도면에서 과장되거나 확대되어 보여질 수 있다. 도면들에서 유사한 참조 문자들은 일반적으로 유사한 특징(예컨대, 기능적으로 유사하고/하거나 구조적으로 유사한 구성요소)을 나타낸다.
도 1은 이상적인 경우와 실제 경우에서 심층 신경망의 불확실성 산점도를 도시한다.
도 2는 열역학 컴퓨팅 시스템의 개요를 도시한다. 디지털 컨트롤러는 아날로그 동역학 시스템이라고도 하는, 시간적으로 진화하는 아날로그 시스템으로부터 샘플들을 추출하여, 목표 확률 분포를 샘플링하는 해밀토니안 몬테카를로(HMC) 방법을 수행한다.
도 3은 1차원 정규(즉, 가우시안) 확률 분포에 매핑되는 기본 LC 오실레이터의 회로도이다.
도 4는 다변량 정규 확률 분포에 매핑되는 용량성 결합된 조화 오실레이터 네트워크에서 용량성 결합 오실레이터 쌍의 회로도이다.
도 5는 2D 가우시안에서 HMC를 실행하는 동안 나타나는 U턴(U-Turn)을 도시한다.
도 6은 UL 하드웨어 구현예의 시스템 수준 뷰를 도시한다. PC는 셋업 정보를 온보드 컨트롤러에 다운로드하고, 결과적으로 셀들로부터 샘플링된 데이터를 판독한다.
도 7은 간단한 2셀 시스템을 형성하는 두 개의 결합된 LC 공진기를 도시한다. 각 공진기의 공진 주파수는 독립적으로 조정될 수 있고, 용량성 결합은 제어될 수 있다. 셀들은 가우시안 잡음 전류원으로 여기된다.
도 8은 UL 하드웨어 셋업에서의 일반적인 전체-대-전체 결합을 도시한다.
도 9a는 공진 주파수가 디지털 컨트롤러 및 뒤따르는 LPF를 사용하여 구현된 전류 잡음원을 이용하여 디지털 방식으로 제어될 수 있는 조정가능 셀을 도시한다.
도 9b는 인덕터를 커패시터로부터 분리하는 추가 스위치를 추가함으로써 초기 조건을 구현한 조정가능 셀을 도시한다.
도 10은 각 셀의 커패시터 및 인덕터를 초기화하는 대신, 커패시터는 연결해제된 동안 초기화될 수 있음을 도시한다. 인덕터와 커패시터를 연결한 후의 주어진 시점에, 원하는 초기 조건이 달성된다. 이런 식으로 하나의 구성요소가 초기화된다.
도 11은 두 셀 사이의 결합 유닛을 도시한다. 이 셀들은 노드 AB에서 연결된다. 결합은 사용 가능화 또는 사용 불능화될 수 있고, 극성 또한 제어 신호를 사용하여 지시된다.
도 12는 해당 컨트롤러의 다음의 FPGA 구현예를 예시한다: (a) FPGA 내의 각 셀 및 결합 유닛을 셋업하는 것 외에도, 다운로드 및 업로드 동작이 발생하는 고수준 제어. (b) 셀 인터페이스는 ADC로부터 전압을 판독하고 그 뒤에 해당 데이터를 저장한다. 이는 또한 조정가능 공진기의 스위치들을 제어하고 잡음 진폭을 제어한다. (c) 결합 유닛 인터페이스는 적절한 스위치를 켜서 결합 및 그 극성을 제어한다. (d) FPGA에 다운로드된 데이터의 형식.
도 13a는 단일 비트 PN 생성기와 직렬 저항을 이용하여 전류원을 에뮬레이션함으로써 도 7의 전류 잡음원이 구현될 수 있음을 도시한다. RC 회로는 LPF로서 역할도 한다.
도 13b는 단일 비트 의사 잡음(PN) 생성기에 사용되는 선형 피드백 시프트 레지스터(linear feedback shift register, LFSR)의 일 예를 도시한다.
도 14는 전체 과정을 시각화한 것이다. 음영처리된 상자는 디지털 장치에서 발생하는 절차인 한편, 흰색 상자는 아날로그 장치에서 발생하는 절차이다.
도 15는 상호 인덕턴스를 통한 HMC 단위 셀들 간의 결합을 예시한다.
도 16은 HMC 단위 셀들 간의 직접 유도 결합을 예시한다.
도 17a는 잡음 있는 저항기와 커패시터로 구성되는 단일 단위 셀의 가능한 물리적 실현예의 회로도를 도시하며, HMC 단위 셀들 간의 직접 유도 결합을 예시한다.
도 17b는 결합 저항기를 사용하여 두 단위 셀을 결합하는 가능한 수단의 회로도를 도시한다.
도 18은 디지털 로직에 의해 제어되는 스위칭 커패시터 뱅크의 일 예를 도시하는데, 각 물리적 커패시터는 전체 커패시턴스에 대해 추가 비트만큼의 정밀도를 높인다.
도 19는 백투백(back-to-back) 구성에서 서로 반대 방향으로 있는 두 개의 바리캡(varicap)을 예시한다. 가운데의 제3 포트가 시스템의 커패시턴스를 조정하는 튜닝 전압으로서 역할을 한다.
도 20은 이극(bipolar) 결합을 구현하기 위한 디지털-아날로그 방식의 회로도이다.
도 21은 자이레이터에 기반한 능동형 인덕터(위)와 인덕터가 있는 등가 회로(아래)를 도시한다.
도 22는 1차원 정규(즉, 가우시안) 확률 분포의 과감쇠된(over damped) 랑주뱅 샘플링에 사용되는 기본 대칭 RC 단위 셀의 회로도를 도시한다.
도 23은 인덕터 없이 두 RC 단위 셀 간의 음의 결합을 달성하는 데 사용되는 기본 결합 셀의 회로도를 도시한다.
도 24는 인덕터 없이 두 RC 단위 셀 간의 양의 결합을 달성하는 데 사용되는 기본 결합 셀의 회로도를 도시한다.
도 25는 정사각형 격자, 육각형 격자, 킹의 그래프(King's graph)를 포함하여 로컬 연결을 달성하기 위한 다양한 전략을 예시하며, 각 박스는 단위 셀을 나타낸다.
도 26은 정사각형 클러스터와 육각형 클러스터를 포함하는 클러스터 그래프에 기반하여 로컬 연결을 달성하기 위한 추가 전략들을 예시하며, 각 박스는 단위 셀을 나타낸다.
도 27은 단위 셀들(5개의 박스들로 표현됨)을 연결하는 준로컬 접근법을 도시한다. 여기서 행 내의 단위 셀들은 완전히 연결된 반면, 행 간의 연결은 더 희박하다. D = 9의 경우, 최근접 이웃 수는 행에 따라 n = 3 또는 n = 4이다. D = 16의 경우, 행에 따라 n = 4 또는 n = 5이다. 일반적으로 이 연결 방식을 사용하면 n에 따라 스케일 조정된다.
도 28은 완전 연결 아키텍처의 회로 개략도를 도시한다.
도 29는 스위칭 커패시터 뱅크 커패시터들에서 정밀도 비트 수의 증가에 따른 수용/거부 단계의 성공률의 선도(오차 막대는 표준 편차 오차를 나타냄)이다. 8차원 완전 연결 커패시턴스 행렬을 이용하여 프로세스 및 하드웨어를 시뮬레이션한 결과이다.
도 30은 커패시터 결함 증가에 따른 수용/거부 단계의 성공률의 선도(음영 영역이 표준 편차 오차를 나타냄)이다. 200차원 완전 연결 커패시턴스 행렬을 이용하여 프로세스 및 하드웨어를 시뮬레이션한 결과이다. 커패시터들은 여러 수준의 허용오차를 갖지만, 가령 2.5% 허용오차를 가진 커패시터를 선택할 수 있으며, 이는 선도에 따르면 약 80%의 성공률을 가져온다.
도 31은 제한된 k-밴드형(bended) 연결성을 가진 하드웨어가 수용/거부 단계의 수용률에 미치는 영향을 예시하는 선도들(오차 막대는 표준 편차를 나타냄)을 도시한다. 차원이 증가하는 k-밴드형 커패시턴스 행렬을 사용하여 프로세스 및 하드웨어를 시뮬레이션한 결과이다. (A)는 목표 분포가 대각선으로부터의 거리에 따라 감소하는 원소를 갖는 희소 공분산 행렬을 갖는 경우이고, (B)는 목표 분포 공분산 행렬이 임의로 조밀한 경우이다.
도 32는 분산이 인 목표 분포 f t 가 분산들이 각각 ε 및 2ε인 두 분포 f 1 f 2 사이의 보간에 의해 근사화된 선도이다. f t , f 1, f 2는 가우시안이고, f a 는 가우시안 혼합이다.
도 33은 근사 확률 밀도 함수 f a 와 목표 f t 사이의 거리 L 1ε의 함수로서 도시하는 선도이다. 목표 분포는 평균이 0이고 분산이 20인 단변량 정규 분포이다. 오류 완화(녹색)를 이용하면 ε이 0으로 감에 따라 오차의 1차 도함수는 0으로 가지만, 오류 완화(파란색)를 이용하지 않으면 ε이 0으로 감에 따라 1차 도함수는 영이 되지 않는다.
도 34는 맥스웰 데몬(demon)을 예시하며, 맥스웰 데몬은 열역학의 개념으로, 지능형 관찰자가 시스템을 관찰하고 시스템에 적절한 힘을 가함으로써 시스템의 엔트로피를 줄일 수 있다는 개념이다. 여기에 보인 바와 같이, 기체 혼합물을 분리하는 것이 전형적인 예이다.
도 35는 맥스웰 데몬을 추가함으로써 퍼텐셜 에너지 지형(potential energy landscape) U(x)가 어떻게 변경될 수 있는지를 도시한다. 아래 패널은 이것이 샘플들을 추출하는 확률 분포 P(x)를 어떻게 변경하는지를 개략적으로 보여준다. 왼쪽 패널은 가우시안 확률 분포를 샘플링하는 것에 해당하는 조화 오실레이터 퍼텐셜을 보여준다. 오른쪽 패널은 맥스웰 데몬 시스템을 추가하면 더 복잡한 퍼텐셜이 생성되어 다중 모드 분포들과 같은 다른 분포들을 샘플링할 수 있음을 보여준다.
도 36은 맥스웰 데몬 장치가 어떻게 전압 제어 전압원으로서 보일 수 있는지를 예시한다.
도 37은 디지털 맥스웰 데몬 시스템(예컨대, CPU 또는 현장 프로그래밍가능 게이트 어레이(Field Programmable Gate Arrayt, FPGA)에서 처리됨)이 어떻게 아날로그 HMC 하드웨어와 상호작용하는지를 예시한다.
도 38은 아날로그 맥스웰 데몬을 구성하는 비상관적 접근법을 예시한다. 기본 단위 셀(primary unit cell)(왼쪽)은 보조 단위 셀(auxiliary unit cell)(오른쪽)에 결합된다. 구체적으로, 기본 단위 셀의 커패시터 양단의 전압은 보조 단위 셀에 전압원으로서 적용된다. 이 전압원은 비선형 소자(non-linear element, NLE)를 통해 전류를 구동하고, 전류는 저항기 양단의 전압을 통해 판독된다. 후자의 전압 차이는 인버터를 통과한 후, 기본 단위 셀에서 전압원으로서 역할을 하여, 맥스웰 데몬의 출력에 해당한다.
도 39는 전압 인버터가 없는 아날로그 맥스웰 데몬의 대체 구성을 도시한다. 즉, 보조 단위 셀의 저항기를 양 단자에서 접지되지 않도록 함으로써, 전압 차이를 추출하여 전선을 반전시킨 후 기본 단위 셀의 전압원으로 적용할 수 있다
도 40은 다이오드 기반 맥스웰 데몬의 특성을 예시한다. 여기서는 NLE가 순방향 바이어스를 받는 다이오드라고 가정한다. 첫 번째 패널은 다이오드의 전류-전압 특성을 보여주며, I(x)로 표시된다. 두 번째 패널은 맥스웰 데몬에 의해 출력된 힘 f(x)를 보여주며, 이 힘은 I(x) 곡선에 음수 부호를 적용한다고 가정한다. 세 번째 패널 및 네 번째 패널은 각각 퍼텐셜 에너지 U(x) 및 샘플링되는 확률 분포 P(x)를 나타낸다.
도 41은 터널 다이오드에 기반하여 맥스웰 데몬의 특성을 예시한다. 여기서는 NLE가 순방향 바이어스를 받는 터널 다이오드라고 가정한다. 첫 번째 패널은 터널 다이오드의 전류-전압 특성을 보여주며, I(x)로 표시된다. 두 번째 패널은 맥스웰 데몬에 의해 출력된 힘 f(x)를 보여주며, 이 힘은(본문에서 논의된 바와 같이) I(x) 곡선에 음수 부호를 적용한 다음 전압을 일정한 음수량만큼 이동시킨다고 가정한다. 세 번째 패널 및 네 번째 패널은 각각 퍼텐셜 에너지 U(x) 및 샘플링되는 확률 분포 P(x)이다.
도 42는 단위 셀들 간의 상관관계를 생성하기 위한 아날로그 맥스웰 데몬을 예시한다. 예를 들어 아핀(affine) 변환일 수 있는 아날로그 결합 연산이 각 단위 셀의 커패시터와 연관된 전압 벡터에 적용된다. 아날로그 결합 연산 후, 결과적인 벡터는 비선형 소자(NLE)를 포함하는 각 보조 단위 셀에 전압원으로서 성분별로 적용된다. 각 NLE를 통과하는 전류는 전압으로서 판독되고, 그 후 부호가 반전되고 최종적으로 해당 기본 단위 셀에 전압원으로서 적용된다.
도 43은 행렬-벡터 곱셈 Av를 구현하기 위한 아날로그 회로를 도시한다. 이는 도 42에 도시된 아날로그 결합 연산에 대한 가능한 구현예를 제공한다. 여기에는 행렬 A의 각 행과 연관된 d개의 저항이 있다. 이는, A가 조밀하다고 가정하여, 전체 행렬 A에 대해 총 d²개의 저항기들을 제공한다.
도 44는 트랜지스터들을 사용하여 함수 h(v)를 구현하는 아날로그 회로를 도시한다. 여기서는 다른 구성요소들의 대표적인 예로서 h i (v)를 구현하는 회로의 i번째 구성요소를 보여준다. 여기서, h i 와 연관된 d 개의 트랜지스터가 있어서, 전체 변환 h(v)에 대해 총 d² 개의 트랜지스터를 제공한다. v의 각 구성요소 v j 는 다른 구성요소 v k 와 연관된 트랜지스터의 게이트 전압으로서 역할을 하여, 고차 결합을 초래한다. (단순화를 위해 v의 3개의 구성요소만이 보이지만, d 개의 구성요소가 있다.)
도 45는 사용자가 샘플링하려는 확률 분포가 신경망에 의해 표현될 때 아날로그 HMC를 수행하는 장치를 예시한다.
도 46은 가우시안 분포에 대해 아날로그 HMC를 수행하는 장치를 도시하며, 사용자가 공분산 행렬 Σ 대신 정밀도 행렬 Q = Σ-1을 특정한다.
도 47은 전압 제어 커패시터의 세 포트를 통해 결합된 세 개의 단위 셀을 도시한다.
도 48은 전압 증배기(즉, 전압 믹서)와 전압 제어 커패시터를 통해 결합되는 네 개의 단위 셀을 도시한다. 전압 증배기는 디지털 장치 상에 또는 아날로그 장치로 구현될 수 있다.
도 49는 전압 제어 커패시터들 및 정사각형 격자를 통한 3체 결합으로 로컬 연결을 달성하는 방식을 예시한다.
도 50은 전압 제어 커패시터들(VCC) 및 육각형 격자를 통한 3체 결합으로 로컬 연결을 달성하는 방식을 예시한다.
도 51은 커패시터, 이상적인 저항기, 및 확률적 전압원을 갖는 LMC 하드웨어 단위 셀을 도시한다.
도 52는 (A) 저항성 브리지 또는 (B) 용량성 브리지 중 어느 하나와 결합된 LMC 하드웨어의 두 개의 단위 셀을 도시한다.
도 53은 가우시안 샘플링을 위한 두 개의 결합된 LMC 하드웨어 단위 셀을 도시한다. 가우시안의 공분산 행렬은 회로 소자들의 값들, 특히 저항기들의 저항들로 인코딩된다.
도 54는 LMC를 구현하기 위한 적분기들에 기반한 대체 아날로그 장치를 도시한다. 사용자는 이 장치와는 로그 확률의 기울기 컴파일과 샘플 수집을 통해 인터페이스한다.
도 55는 하드웨어의 구성 블록을 형성하는 두 개의 결합된 단위 셀에 대한 가능한 회로도를 예시한다. 각 단위 셀에서 전류 잡음은 LC 오실레이터 회로와 병렬로 주입된다.
도 56은 선형 연립 방정식을 푸는 열역학적 과정의 개략도이다.
Those skilled in the art will appreciate that the drawings are primarily for illustrative purposes and are not intended to limit the scope of the inventive subject matter described in this disclosure. The drawings are not necessarily to scale; in some instances, various aspects of the invention disclosed in this disclosure may be shown exaggerated or enlarged in the drawings to facilitate understanding of various features. Like reference characters in the drawings generally indicate like features (e.g., functionally similar and/or structurally similar components).
Figure 1 shows the uncertainty scatter plot of a deep neural network in ideal and real cases.
Figure 2 illustrates an overview of a thermodynamic computing system. A digital controller performs a Hamiltonian Monte Carlo (HMC) method that samples a target probability distribution by extracting samples from a time-evolving analog system, also known as an analog dynamical system.
Figure 3 is a schematic of a basic LC oscillator that maps to a one-dimensional normal (i.e., Gaussian) probability distribution.
Figure 4 is a circuit diagram of a pair of capacitively coupled oscillators in a capacitively coupled harmonic oscillator network mapped to a multivariate normal probability distribution.
Figure 5 illustrates the U-Turn that appears while running HMC on a 2D Gaussian.
Figure 6 illustrates a system level view of an example UL hardware implementation. The PC downloads setup information to the onboard controller, which in turn reads out sampled data from the cells.
Figure 7 illustrates two coupled LC resonators forming a simple two-cell system. The resonant frequency of each resonator can be tuned independently, and the capacitive coupling can be controlled. The cells are excited by a Gaussian noise current source.
Figure 8 illustrates a typical all-to-all coupling in a UL hardware setup.
Figure 9a illustrates a tunable cell whose resonant frequency can be digitally controlled using a current noise source implemented using a digital controller followed by a LPF.
Figure 9b illustrates an adjustable cell with initial conditions implemented by adding an additional switch that separates the inductor from the capacitor.
Figure 10 illustrates that instead of initializing the capacitor and inductor of each cell, the capacitor can be initialized while disconnected. At a given point in time after connecting the inductor and capacitor, the desired initial condition is achieved. In this way, one component is initialized.
Figure 11 illustrates a coupling unit between two cells. These cells are connected at nodes A and B. The coupling can be enabled or disabled, and the polarity is also indicated using a control signal.
Figure 12 illustrates the following FPGA implementation of the controller: (a) High-level control where download and upload operations occur, in addition to setting up each cell and coupling unit within the FPGA. (b) The cell interface reads the voltage from the ADC and subsequently stores the data. It also controls the switches of the tunable resonator and controls the noise amplitude. (c) The coupling unit interface controls the coupling and its polarity by turning on appropriate switches. (d) The format of the data downloaded to the FPGA.
Figure 13a shows that the current noise source of Figure 7 can be implemented by emulating a current source using a single-bit PN generator and a series resistor. The RC circuit also acts as an LPF.
Figure 13b illustrates an example of a linear feedback shift register (LFSR) used in a single-bit pseudonoise (PN) generator.
Figure 14 visualizes the entire process. The shaded boxes represent procedures that occur on digital devices, while the white boxes represent procedures that occur on analog devices.
Figure 15 illustrates the coupling between HMC unit cells through mutual inductance.
Figure 16 illustrates direct inductive coupling between HMC unit cells.
Figure 17a illustrates a schematic of a possible physical realization of a single unit cell consisting of noisy resistors and capacitors, illustrating direct inductive coupling between HMC unit cells.
Figure 17b illustrates a schematic of a possible means of coupling two unit cells using coupling resistors.
Figure 18 illustrates an example of a switched capacitor bank controlled by digital logic, where each physical capacitor adds an additional bit of precision to the overall capacitance.
Figure 19 illustrates two varicaps in a back-to-back configuration with the third port in the middle acting as a tuning voltage to adjust the capacitance of the system.
Figure 20 is a circuit diagram of a digital-analog method for implementing bipolar coupling.
Figure 21 shows an active inductor based on a gyrator (top) and an equivalent circuit with an inductor (bottom).
Figure 22 illustrates a schematic of a basic symmetric RC unit cell used for over damped Langevin sampling of a one-dimensional normal (i.e., Gaussian) probability distribution.
Figure 23 shows the schematic of a basic coupling cell used to achieve negative coupling between two RC unit cells without an inductor.
Figure 24 shows a schematic of a basic coupling cell used to achieve positive coupling between two RC unit cells without an inductor.
Figure 25 illustrates different strategies for achieving local connectivity, including a square lattice, a hexagonal lattice, and a King's graph, where each box represents a unit cell.
Figure 26 illustrates additional strategies for achieving local connectivity based on a cluster graph containing square clusters and hexagonal clusters, where each box represents a unit cell.
Figure 27 illustrates a semi-local approach to connecting unit cells (represented by five boxes). Here, unit cells within a row are fully connected, while connections between rows are more sparse. For D = 9, the number of nearest neighbors is n = 3 or n = 4 along the row. For D = 16, it is n = 4 or n = 5 along the row. In general, using this connection scheme, n It is scaled accordingly.
Figure 28 illustrates a circuit schematic of a fully connected architecture.
Figure 29 is a graph of the success rate of the accept/reject step as a function of the number of precision bits in the switched capacitor bank capacitors (error bars represent the standard deviation error). The results are obtained by simulating the process and hardware using an 8-dimensional fully connected capacitance matrix.
Figure 30 is a graph of the success rate of the acceptance/rejection stage as the capacitor defects increase (the shaded area represents the standard deviation error). It is the result of the process and hardware simulation using a 200-dimensional fully connected capacitance matrix. Capacitors have various levels of tolerance, but one can choose a capacitor with, for example, a 2.5% tolerance, which according to the graph will result in a success rate of about 80%.
Figure 31 shows plots (error bars represent standard deviation) illustrating the impact of hardware with limited k -banded connectivity on the acceptance/rejection phase acceptance rate. The results are simulated using process and hardware with increasing dimensionality of k -banded capacitance matrices. (A) is the case where the target distribution has a sparse covariance matrix with elements decreasing with distance from the diagonal; (B) is the case where the target distribution covariance matrix is arbitrarily dense.
Fig. 32 shows the dispersion The target distribution f t is two distributions f 1 with variances ε and 2ε, respectively. and f 2 It is a curve approximated by interpolation between f t , f 1 , and f 2 are Gaussian, and f a is a Gaussian mixture.
Figure 33 is a plot of the distance L 1 between the approximate probability density function f a and the target f t as a function of ε . The target distribution is a univariate normal distribution with mean 0 and variance 20. With error relaxation (green), the first derivative of the error tends to 0 as ε tends to 0, but without error relaxation (blue), the first derivative does not tend to zero as ε tends to 0.
Figure 34 illustrates a Maxwell's Demon, a concept in thermodynamics whereby an intelligent observer can observe a system and reduce the entropy of the system by applying appropriate forces to the system. A typical example is the separation of a gas mixture, as shown here.
Figure 35 illustrates how the potential energy landscape U(x) can be changed by adding a Maxwell demon. The lower panels show schematically how this changes the probability distribution P(x) from which samples are drawn. The left panel shows the harmonic oscillator potential corresponding to sampling a Gaussian probability distribution. The right panel shows that adding a Maxwell demon system produces more complex potentials, allowing for sampling other distributions, such as multimodal distributions.
Figure 36 illustrates how a Maxwell demon device can be viewed as a voltage-controlled voltage source.
Figure 37 illustrates how a digital Maxwell Daemon system (e.g., processed on a CPU or Field Programmable Gate Arrayt (FPGA)) interacts with analog HMC hardware.
Figure 38 illustrates an uncorrelated approach to constructing an analog Maxwell's demon. A primary unit cell (left) is coupled to an auxiliary unit cell (right). Specifically, the voltage across the capacitor of the primary unit cell is applied as a voltage source to the auxiliary unit cell. This voltage source drives a current through a non-linear element (NLE), and the current is read as a voltage across a resistor. The latter voltage difference, after passing through an inverter, acts as a voltage source in the primary unit cell, corresponding to the output of the Maxwell's demon.
Figure 39 illustrates an alternative configuration of an analog Maxwell Demon without a voltage inverter. That is, by making the resistors of the auxiliary unit cell ungrounded at both terminals, the voltage difference can be extracted and used as a voltage source for the primary unit cell after inverting the wires.
Figure 40 illustrates the characteristics of a diode-based Maxwell's demon. Here, the NLE is assumed to be a forward-biased diode. The first panel shows the current-voltage characteristic of the diode, denoted I(x) . The second panel shows the force f(x) output by the Maxwell's demon, which is assumed to have a negative sign on the I(x) curve. The third and fourth panels show the potential energy U(x) and the sampled probability distribution P(x) , respectively.
Figure 41 illustrates the characteristics of Maxwell's demon based on a tunnel diode. Here, we assume that the NLE is a forward-biased tunnel diode. The first panel shows the current-voltage characteristic of the tunnel diode, denoted I(x) . The second panel shows the force f(x) output by Maxwell's demon, which is assumed to negatively affect the I(x) curve (as discussed in the text) and then shift the voltage by a constant negative amount. The third and fourth panels are the potential energy U(x) and the sampled probability distribution P(x) , respectively.
Fig. 42 illustrates an analog Maxwell daemon for generating correlations between unit cells. An analog coupling operation, which may be an affine transform for example, is applied to the voltage vector associated with the capacitors of each unit cell. After the analog coupling operation, the resulting vector is applied component-wise as a voltage source to each auxiliary unit cell containing a nonlinear element (NLE). The current passing through each NLE is read as a voltage, which is then inverted and finally applied as a voltage source to the corresponding primary unit cell.
Fig. 43 illustrates an analog circuit for implementing matrix-vector multiplication A v. This provides a possible implementation for the analog combine operation illustrated in Fig. 42. There are d resistors associated with each row of matrix A. This gives a total of resistors for the entire matrix A , assuming that A is dense.
Figure 44 illustrates an analog circuit that implements a function h ( v ) using transistors. Here, the ith component of the circuit that implements h i ( v ) is shown as a representative example of other components. Here, there are d transistors associated with h i , so that the overall conversion This gives a total of transistors for h ( v ). Each component v j of v acts as a gate voltage for the transistor associated with the other components v k , resulting in higher-order coupling. (For simplicity, only three components of v are shown, but there are d components.)
Figure 45 illustrates a device for performing analog HMC when the probability distribution that the user wishes to sample is represented by a neural network.
Figure 46 illustrates a device for performing analog HMC on a Gaussian distribution, where the user specifies a precision matrix Q = Σ -1 instead of a covariance matrix Σ.
Figure 47 illustrates three unit cells coupled through three ports of a voltage controlled capacitor.
Figure 48 illustrates four unit cells coupled through a voltage multiplier (i.e., voltage mixer) and a voltage control capacitor. The voltage multiplier can be implemented on a digital device or as an analog device.
Figure 49 illustrates a method for achieving local coupling through voltage-controlled capacitors and three-body coupling via a square grid.
Figure 50 illustrates a method for achieving local connectivity using voltage controlled capacitors (VCC) and three-body coupling via a hexagonal grid.
Figure 51 illustrates an LMC hardware unit cell with a capacitor, an ideal resistor, and a stochastic voltage source.
Figure 52 illustrates two unit cells of LMC hardware coupled with either (A) a resistive bridge or (B) a capacitive bridge.
Figure 53 illustrates two coupled LMC hardware unit cells for Gaussian sampling. The covariance matrix of the Gaussian is encoded into the values of the circuit elements, in particular the resistances of the resistors.
Figure 54 illustrates an alternative analog device based on integrators for implementing LMC. The user interfaces with this device through compiling the slope of the log probability and collecting samples.
Figure 55 illustrates a possible circuit diagram for two coupled unit cells forming the building blocks of the hardware. In each unit cell, current noise is injected in parallel with the LC oscillator circuit.
Figure 56 is a schematic diagram of the thermodynamic process of solving a system of linear equations.

1 시스템1 System 개요 outline

도 2는 열역학 컴퓨팅 플랫폼, 열역학 시스템, 또는 열역학 플랫폼이라고도 하는 열역학 컴퓨팅 시스템(200)을 도시하며, 이 시스템은 최첨단 마르코프 연쇄 몬테카를로(Markov chain Monte Carlo, MCMC) 방법인 해밀토니안 몬테카를로(HMC) 방법을 사용하여 다변량 가우시안 분포를 샘플링할 수 있다. HMC 샘플링 방법은 깁스(Gibbs) 분포로부터 샘플링하는 마르코프 연쇄 몬테카를로(MCMC) 방법이다. HMC 샘플링 방법은 f의 깁스 분포로부터 샘플링하는 문제를 해밀토니안 동역학 법칙에 따라 입자의 궤적을 시뮬레이션하는 것으로 축소하며, 여기서 f는 퍼텐셜 에너지 함수의 역할을 한다. 열역학 컴퓨팅 시스템에 의해 생성된 샘플들은 확률적 AI에서 사용되어, 예를 들어, 확률적 신경망의 다양한 층에 있는 뉴런들 간의 연결에 가중치를 부여할 수 있다.FIG. 2 illustrates a thermodynamic computing system (200), also known as a thermodynamic computing platform, a thermodynamic system, or a thermodynamic platform, which can sample a multivariate Gaussian distribution using the Hamiltonian Monte Carlo (HMC) method, which is a state-of-the-art Markov chain Monte Carlo (MCMC) method. The HMC sampling method is a Markov chain Monte Carlo (MCMC) method that samples from a Gibbs distribution. The HMC sampling method reduces the problem of sampling from a Gibbs distribution of f to simulating a particle trajectory according to the Hamiltonian dynamical laws, where f acts as a potential energy function. The samples generated by the thermodynamic computing system can be used in probabilistic AI, for example, to weight connections between neurons in various layers of a probabilistic neural network.

도 2의 열역학 컴퓨팅 시스템(200)은 아날로그 시스템(220)과 인터페이스하는 디지털 시스템(210)을 포함하는 하이브리드 디지털-아날로그 시스템으로, 아날로그 동역학 시스템 또는 시간적으로 진화하는 아날로그 시스템이라고도 한다. 디지털 시스템(210)은 적절하게 프로그래밍된 디지털 하드웨어(예컨대, 프로세서, 주문형 반도체(application-specific integrated circuit), 현장 프로그래밍가능 게이트 어레이 등)로 구현될 수 있으며, 열역학 시스템에 의해 추론되는 애플리케이션 수준의 통계적 모델인 확률 모델(212)과, 아날로그 시스템과 인터페이스하는 컨트롤러(214)를 둘 다를 실행한다. 컨트롤러는 펌웨어로 구현될 수 있다. 동작 시, 컨트롤러(214)는 아날로그 동역학 시스템(220)의 제어 파라미터들(211)을 초기화하고, 아날로그 시스템(220)으로부터 목표 다변량 분포의 샘플들(221)을 수용하거나 거부한다. 또한, 디지털 시스템(210)은 사용자와 직접 또는 다른 디지털 컴퓨팅 장치(예컨대, 개인용 컴퓨터(PC))를 통해 인터페이스한다.The thermodynamic computing system (200) of FIG. 2 is a hybrid digital-analog system comprising a digital system (210) interfacing with an analog system (220), also referred to as an analog dynamical system or a time-evolving analog system. The digital system (210) may be implemented in suitably programmed digital hardware (e.g., a processor, an application-specific integrated circuit, a field-programmable gate array, etc.) and executes both a probabilistic model (212), which is an application-level statistical model inferred by the thermodynamical system, and a controller (214) interfacing with the analog system. The controller may be implemented in firmware. In operation, the controller (214) initializes control parameters (211) of the analog dynamical system (220) and accepts or rejects samples (221) of a target multivariate distribution from the analog system (220). Additionally, the digital system (210) interfaces with the user directly or through another digital computing device (e.g., a personal computer (PC)).

아날로그 시스템(220)은 다변량 가우시안 분포, 베르누이(Bernoulli) 분포, 이항(binomial) 분포, 푸아송(Poisson) 분포 또는 기타 지수 분포와 같은 목표 다변량 분포의 샘플들을 제공하기 위해 일련의 시간 단계에 걸쳐 해밀턴 방정식을 통해 진화하는 동적 물리계(222)를 포함한다. 보다 일반적으로, 아날로그 시스템(220)은 (아날로그) 전자공학에서 실현될 수 있는 에너지 함수의 측면에서 정의될 수 있는 임의의 분포를 샘플링할 수 있다. 목표 다변량 분포는 확률, 열(heat), 모집단 또는 기타 적합한 양을 나타내는 고차원 분포(예컨대, 10, 100, 1000, 10000 또는 그 이상의 차원을 갖는 분포)일 수 있다.The analog system (220) comprises a dynamical physical system (222) that evolves through Hamilton's equations over a series of time steps to provide samples of a target multivariate distribution, such as a multivariate Gaussian distribution, a Bernoulli distribution, a binomial distribution, a Poisson distribution, or other exponential distribution. More generally, the analog system (220) can sample any distribution that can be defined in terms of an energy function that can be realized in (analog) electronics. The target multivariate distribution can be a high-dimensional distribution (e.g., a distribution having dimensions of 10, 100, 1000, 10000, or more) representing a probability, heat, a population, or other suitable quantity.

일련의 시간 단계의 각 시간 단계에서 아날로그 시스템(220)은 목표 확률 분포의 샘플(221)을 컨트롤러(214)에 제안하고, 컨트롤러는 제안된 샘플을 수용하거나, 가외치(outlier)인 경우 거부한다. 아날로그 시스템(220)의 자연스러운 시간적 진화는 해밀토니안 동역학에 매핑되며, 이는 아날로그 시스템이 자연스럽게 HMC 샘플링 방법의 통합 단계를 구현한다는 것을 의미한다. 다시 말해, 아날로그 시스템의 자연스러운 물리적 동역학이 디지털 하드웨어에서 전통적으로 수행되던 수치 적분을 대체한다. 그 결과, 공동 디지털-아날로그 열역학 시스템은 시간적 진화를 통해 이들 계산을 해결한다.At each time step of a series of time steps, the analog system (220) proposes a sample (221) of the target probability distribution to the controller (214), and the controller either accepts the proposed sample or rejects it if it is an outlier. The natural temporal evolution of the analog system (220) maps to the Hamiltonian dynamics, which means that the analog system naturally implements the integration step of the HMC sampling method. In other words, the natural physical dynamics of the analog system replaces the numerical integration traditionally performed in digital hardware. As a result, the joint digital-analog thermodynamic system solves these computations via the temporal evolution.

디지털 시스템(210)의 컨트롤러(214)는 아날로그 시스템의 입력 파라미터들(211)을 설정하는데, 이 파라미터들은 다변량 분포, 예를 들어 정규(가우시안) 분포 또는 아날로그 동역학 시스템(220)이 샘플링하는 다른 분포를 나타낸다. 입력 파라미터들(211)은 아래에 설명된 바와 같이 아날로그 시스템(220)을 구성하는 조정가능 인덕터, 커패시터, 전압원, 및 전류원의 인덕턴스, 커패시턴스, 전압원, 및 전류원를 각각 포함할 수 있다. 컨트롤러(214)는 직렬 버스 또는 기타 적합한 인터페이스를 통해 이들 입력 파라미터들(211)을 설정한 다음, 아날로그 시스템(220)이 시간 간격, 적분 기간 또는 샘플링 기간이라고도 하는 미리 결정된 기간 동안 진화하는 것을 허용한다. 일단 해당 시간이 경과하면, 컨트롤러(214)는 직렬 버스를 통해, 아날로그 시스템의 최종 상태를 나타내는 전압들, 전류들, 및/또는 기타 아날로그 값들을 포함할 수 있는 아날로그 시스템의 출력 파라미터들을 판독한다. 이들 출력 파라미터는 다변량 가우시안 확률 분포의 샘플들(221)을 나타낸다. 컨트롤러(214)는 아날로그 시스템(220)의 아날로그 불완전성(analog imperfections)을 수정하기 위해 잘못된 또는 가외의(outlying) 파라미터 판독값들을 거부한다.A controller (214) of the digital system (210) sets input parameters (211) of the analog system, which parameters represent a multivariate distribution, for example a normal (Gaussian) distribution or another distribution from which the analog dynamical system (220) samples. The input parameters (211) may include inductance, capacitance, voltage source, and current source of adjustable inductors, capacitors, voltage sources, and current sources, respectively, that make up the analog system (220), as described below. The controller (214) sets these input parameters (211) via a serial bus or other suitable interface, and then allows the analog system (220) to evolve for a predetermined period of time, also known as a time interval, integration period, or sampling period. Once that period of time has elapsed, the controller (214) reads out output parameters of the analog system via the serial bus, which may include voltages, currents, and/or other analog values representing the final state of the analog system. These output parameters represent samples (221) of a multivariate Gaussian probability distribution. The controller (214) rejects incorrect or outlying parameter readings to correct for analog imperfections of the analog system (220).

열역학 시스템(200)의 아날로그 구성요소(220)는 물리적(해밀토니안) 동역학을 시뮬레이션하여 다변량 가우시안 분포 또는 기타 목표 확률 분포를 샘플링한다. 물리계(222)의 해밀토니안(H)은 운동 에너지 및 퍼텐셜 에너지 둘 다를 포함하는 물리계의 총 에너지를 지정한다. 샘플링 맥락에서 해밀토니안은 D 차원의 q개 샘플 공간 변수를 갖는 목표 확률 분포를 나타낸다. HMC 방법은 전통적으로 샘플 공간 변수들 및 일반화된 운동량들(p)에 대한 해밀토니안의 미분들을 구한 다음, 시간 t에 대한 궤적들을 지속기간()의 일련의 시간 단계에 걸쳐 적분하는 과정을 수반한다. 이러한 하이브리드 디지털-아날로그 접근법에서 물리계의 동역학이 미분 수행 및 궤적 적분 둘 다를 대체한다.The analog component (220) of the thermodynamic system (200) simulates physical (Hamiltonian) dynamics to sample a multivariate Gaussian distribution or other target probability distribution. The Hamiltonian (H) of the physical system (222) specifies the total energy of the physical system, which includes both kinetic and potential energy. In the context of sampling, the Hamiltonian represents a target probability distribution with q sample space variables in D dimension. The HMC method traditionally derives the derivatives of the Hamiltonian with respect to the sample space variables and generalized momentums ( p ), and then derives trajectories for time t over a duration ( ) involves integrating over a series of time steps. In this hybrid digital-analog approach, the dynamics of the physical system replaces both the differentiation and the trajectory integration.

하나의 이러한 물리계(222)는 아날로그 전자 시스템, 특히 결합된 조화 오실레이터 네트워크이다. 아래에서 더 자세히 설명되는 바와 같이, 결합된 조화 오실레이터 네트워크의 운동 에너지는 정규화 상수까지 다변량 가우시안 확률 분포의 에너지 함수(해밀토니안)에 매핑된다. 오실레이터들의 전압들 및 전류들은 다변량 가우시안 확률 분포의 해밀토니안의 위치 좌표들을 나타내며, 그래서 그것들은 해당 분포의 샘플들을 제공하기 위해 샘플링될 수 있다.One such physical system (222) is an analog electronic system, particularly a network of coupled harmonic oscillators. As described in more detail below, the kinetic energy of the network of coupled harmonic oscillators is mapped to an energy function (Hamiltonian) of a multivariate Gaussian probability distribution up to a normalization constant. The voltages and currents of the oscillators represent position coordinates of the Hamiltonian of the multivariate Gaussian probability distribution, and so they can be sampled to provide samples of that distribution.

2 1차원2 1st dimension 정규 확률 분포 샘플링Normal probability distribution sampling

기본 LC 오실레이터와 같은 단일 집중 회로 소자는 다음과 같이 1차원(1D) 정규(즉, 가우시안) 확률 분포에 매핑될 수 있다. 그 결과, LC 오실레이터는 HMC 계산을 수행하는 열역학 컴퓨팅 플랫폼에서 1D 정규 확률 분포를 샘플링하기 위한 아날로그 동역학 시스템으로서 사용될 수 있다.A single lumped circuit element, such as a basic LC oscillator, can be mapped to a one-dimensional (1D) normal (i.e., Gaussian) probability distribution as follows. As a result, the LC oscillator can be used as an analog dynamical system for sampling a 1D normal probability distribution in a thermodynamic computing platform that performs HMC calculations.

2.1 1D 정규 확률 분포에 대한 2.1 For the 1D normal probability distribution 해밀토니안Hamiltonian 몬테카를로(HMC)Monte Carlo (HMC)

평균이 μ이고 분산이 σ 2인 정규 분포를 고려하면, 확률 분포는 다음과 같이 쓸 수 있다Considering a normal distribution with mean μ and variance σ 2 , the probability distribution can be written as

이 시스템에 해당하는 에너지 함수는 다음과 같다The energy function corresponding to this system is:

x에 해당하는 정준 운동량(canonical momentum)을 p라고 하고, x와는 독립적인 운동 에너지 함수를 선택한다. 표준 선택은 다음과 같으며Let p be the canonical momentum corresponding to x , and choose a kinetic energy function independent of x . Standard choices are as follows:

여기서 m은 위치 x를 갖는 가상 입자의 질량을 나타낸다. 그러면 시스템의 총 에너지 또는 해밀토니안은 다음과 같다Here, m represents the mass of the virtual particle with position x . Then, the total energy or Hamiltonian of the system is

해밀토니안을 지정한 후, HMC는 목표 분포로부터 샘플링하기 위해 다음 두 가지 주요 성분들에 의존한다:After specifying the Hamiltonian, HMC relies on two principal components to sample from the target distribution:

해밀토니안 동역학 Hamiltonian dynamics

x p에 대해 해밀토니안(H)과 초기 조건들(x 0p 0)이 주어지면, HMC는 다음과 같이 해밀토니안 방정식들을 일정 시간에 대해 적분한다, Given the Hamiltonian ( H ) and initial conditions ( x0 and p0 ) for x and p , HMC integrates the Hamiltonian equations over time as follows:

적분 종료 시 x p의 새로운 값들은 MCMC 체인에서의 다음의 제안이다.At the end of the integration, the new values of x and p are the next proposals in the MCMC chain.

정준 분포 Normal distribution

동역학 문제와는 별도로, 해밀토니안( H )과 온도( T )가 주어지면, x p에 대해 다음과 같은 해당 정준 확률 분포가 있으며,Independent of the dynamical problem, given the Hamiltonian ( H ) and the temperature ( T ), there is a corresponding canonical probability distribution for x and p ,

여기서 k B 는 볼츠만 상수이다.Here, k B is the Boltzmann constant.

HMC의 구조는 x p가 독립 확률 변수들이라는 성질에 의해 영향을 받는다. 이 성질은 다음과 같이 U(x) 및 K(p)가 지지구간에서 겹치지 않는다는 사실에서 비롯된다:The structure of HMC is influenced by the property that x and p are independent random variables. This property follows from the fact that U ( x ) and K ( p ) do not overlap in the support interval, as follows:

두 성분을 연결하는 것은 적분의 초기 조건을 선택하는 것이다. 초기값들(x 0p 0)은 해밀토니안 동역학이 이동하는, 확률 밀도가 일정한 표면을 설정한다. 정규화까지, 궤적을 따르는 확률 밀도는 다음과 같다Connecting the two components is the choice of initial conditions for the integration. The initial values ( x 0 and p 0 ) set up a surface with a constant probability density over which the Hamiltonian dynamics moves. Up to normalization, the probability density along the trajectory is

주변분포들(marginals)의 독립성은 p를 리샘플링하여 결합 확률 밀도(joint probability density)에 대한 새로운 상수 값을 선택할 수 있게 하며; 그러면 해밀토니안 동역학은 이 운동량 리샘플링을 위치 리샘플링으로 교환한다. Neal , "MCMC using Hamiltonian dynamics,"를 다음 중에서 인용한다: Handbook of Markov Chain Monte Carlo, 2.11 (2011), "[s]ince [x] isn't changed, and p is drawn from its correct conditional distribution given [x] (the same as its marginal distribution, due to independence), this step obviously leaves the canonical joint distribution invariant."The independence of the marginals allows us to choose a new constant value for the joint probability density by resampling p ; then, Hamiltonian dynamics exchanges this momentum resampling for a position resampling. To quote Neal et al ., "MCMC using Hamiltonian dynamics," in: Handbook of Markov Chain Monte Carlo , 2.11 (2011), "[s]ince [ x ] isn't changed, and p is drawn from its correct conditional distribution given [ x ] (the same as its marginal distribution, due to independence), this step obviously leaves the canonical joint distribution invariant."

2.2 2.2 해밀토니안과Hamiltonian and 전기 회로electrical circuit

다음 하위 섹션들은 집중 소자 회로로부터 해밀토니안을 도출하는 세 가지 단계를 설명한다.The following subsections describe the three steps for deriving the Hamiltonian from a lumped element circuit.

2.2.1 좌표 선택2.2.1 Selecting Coordinates

도 3에서와 같은 LC 오실레이터로 시작한다고 가정한다. LC 오실레이터는 인덕턴스(L)를 갖는 인덕터와 커패시턴스(C)를 갖는 커패시터를 가진다. 이 회로에 대한 라그랑지안을 적어 두고자 하는데, 이는 해당 해밀토니안을 도출하는 것을 가능하게 할 것이다. Assume that we start with an LC oscillator, as in Fig. 3. The LC oscillator has an inductor with inductance ( L ) and a capacitor with capacitance ( C ). We would like to write down the Lagrangian for this circuit, which will enable us to derive the corresponding Hamiltonian.

이 방법은 회로의 모든 분지 및 노드에 대한 좌표를 선택하는 것으로 시작한다. 여기서 분지 좌표들(I L I C )을 인덕터 및 커패시터의 전류들인 것으로 선택하였다. 한 노드를 기준(접지)으로 표시하였고 다른 노드를 좌표 V, 즉 해당 노드에서 접지까지의 전압 차이로 표시하였다.The method begins by selecting coordinates for all branches and nodes in the circuit. The branch coordinates ( I L and I C ) are chosen to be the currents in the inductor and capacitor, respectively. One node is designated as the reference (ground) and the other nodes are designated as the coordinate V , i.e., the voltage difference from that node to ground.

2.2.2 2.2.2 라그랑지안Lagrangian 유도Induction

다음으로, 이들 선택된 좌표들을 이용하여 회로의 총 에너지를 쓸 수 있다. 회로의 경우, 총 에너지는 분지들의 에너지들의 합이다. 키르히호프 법칙으로부터 I L = - I C 이 성립한다. 커패시터의 정의에 따르면, I C = C(dV /dt)이다. 따라서 커패시터 및 인덕터의 에너지를 전압 V 및 그 시간 미분의 항들로 쓸 수 있다.Next, we can write the total energy of the circuit using these selected coordinates. For a circuit, the total energy is the sum of the energies of the branches. From Kirchhoff's laws, I L = - I C is established. According to the definition of a capacitor, I C = C ( dV /dt ). Therefore, the energy of the capacitor and inductor can be written in terms of the voltage V and its time derivative.

전압을 위치 좌표로서 취급하므로, 커패시터 에너지는 퍼텐셜 에너지 (U)이고 인덕터 에너지는 운동 에너지 (K)이다.Since voltage is treated as a position coordinate, the capacitor energy is potential energy ( U ) and the inductor energy is kinetic energy ( K ).

이제 우리의 시스템에 대한 라그랑지안을 다음과 같이 쓸 수 있다:Now we can write the Lagrangian for our system as:

이 라그랑지안이 주어지면, 위치 좌표 V에 대한 운동량 켤레 p는 다음과 같고Given this Lagrangian, the momentum conjugate p with respect to position coordinate V is as follows:

따라서 라그랑지안을 위치 및 운동량의 측면에서 다음과 같이 다시 쓸 수 있다.Therefore, the Lagrangian can be rewritten in terms of position and momentum as follows:

2.2.3 2.2.3 해밀토니안을Hamiltonian 얻기 위한 To get 르장드르Legendre 변환Conversion

해밀토니안 몬테카를로를 실행하려고 시도하고 있으므로, 물리계의 해밀토니안은 확률 분포에 해당하는 해밀토니안과 일치해야 한다. 이를 위해 이제 LC 오실레이터의 해밀토니안을 유도할 수 있다.Since we are trying to do a Hamiltonian Monte Carlo, the Hamiltonian of the physical system must match the Hamiltonian corresponding to the probability distribution. To do this, we can now derive the Hamiltonian of the LC oscillator.

1D 시스템의 해밀토니안 함수는 다음과 같이 정의되며The Hamiltonian function of a 1D system is defined as follows:

이로부터 다음이 도출된다From this it is derived that

운동량 켤레 p는 커패시터를 통과하는 전류의 측면에서 p = LCI C 와 같이 쓸 수 있다.The momentum conjugate p can be written in terms of the current through the capacitor as p = LCI C.

2.3 2.3 가우시안Gaussian 행렬을 LC LC matrix 오실레이터에On the oscillator 연결 connection

앞서 도출된 두 해밀토니안을 상기한다. 하나는 가상 질량 m을 갖는 가우시안에 해당하는 다음과 같은 추상 해밀토니안이고,Recall the two Hamiltonians derived earlier. One is the following abstract Hamiltonian corresponding to a Gaussian with virtual mass m ,

다른 하나는 전기 시스템의 해밀토니안이다.The other is the Hamiltonian of the electrical system.

이들 두 해밀토니안이 주어지면, 가우시안 해밀토니안의 분산 및 질량을 이용하여 물리적 해밀토니안의 LC의 값들을 구하고자 한다.Given these two Hamiltonians, we want to find the values of L and C of the physical Hamiltonian using the variance and mass of the Gaussian Hamiltonian.

먼저, 커패시턴스 C가 역분산과 동일함을 알 수 있다. 평균은 일정한 전압 오프셋을 이용하여 하드웨어적으로 구현될 수 있거나, 또는 평균을 그 외의 평균이 0인 샘플들에 단순히 더함으로써 소프트웨어적으로 구현할 수 있다. 질량은 LC 2와 같다. 따라서 평균과 분산을 선택한 후, 인덕턴스 L는 질량을 선택할 수 있게 하는 자유 파라미터이다.First, we note that the capacitance C is equal to the inverse variance. The mean can be implemented in hardware using a constant voltage offset, or in software by simply adding the mean to the other zero-mean samples. The mass is equal to LC 2 . Thus, after choosing the mean and variance, the inductance L is a free parameter that allows us to choose the mass.

이는 확률 분포를 등가 전기 회로에 매핑하는 방법의 한 예이다.This is an example of how to map a probability distribution to an equivalent electrical circuit.

3 용량 3 capacity 결합된Combined 조화 Harmony 오실레이터와With the oscillator 다변량 정규 확률 분포Multivariate normal probability distribution

3.1 분포 정의3.1 Distribution Definition

N차원 다변량 정규 분포는 N차원 평균 벡터 와 N×N공분산 행렬 를 이용하여 정의된다.An N-dimensional multivariate normal distribution is an N-dimensional mean vector It is defined using the N×N covariance matrix .

지금은 = 0이라고 가정한다. 이를 통해 공분산 행렬 를 갖는 다변량 정규 분포는 다음과 같이 쓸 수 있다.now = 0. Through this, the multivariate normal distribution with covariance matrix can be written as follows.

로그를 취하면 이 분포에 해당하는 다음의 "에너지 함수"를 얻으며:Taking the log gives the following "energy function" corresponding to this distribution:

여기서 Z = 는 상수이다. 1차원 가우시안과 마찬가지로 이 에너지 함수에 맞는 전기 회로를 구현할 수 있다.Here Z = is a constant. As with the one-dimensional Gaussian, an electric circuit can be implemented that fits this energy function.

3.2 용량 3.2 Capacity 결합된Combined 오실레이터Oscillator

3.2.3.2. 1 회로1 circuit 라그랑지안Lagrangian

각각이 모든 다른 오실레이터들에 용량 결합되는 N개의 조화 오실레이터의 세트를 고려한다. 임의의 쌍 i, j의 조화 오실레이터들은 도 4에 도시된 하위회로에 의해 표현될 수 있다.Consider a set of N harmonic oscillators, each capacitively coupled to all other oscillators. Any pair of harmonic oscillators i , j can be represented by the subcircuits illustrated in Fig. 4.

이 회로의 총 유도 에너지는 다음과 같다The total inductive energy of this circuit is:

유도 행렬을 다음과 같이 정의하면If we define the induced matrix as follows:

총 유도 에너지는 다음과 같이 쓸 수 있다The total induced energy can be written as

총 용량 에너지는 다음과 같다The total capacity energy is:

이후의 미적분을 단순화하기 위해 맥스웰 커패시턴스 행렬 C를 다음과 같이 정의한다.To simplify the subsequent calculus, the Maxwell capacitance matrix C is defined as follows.

그러면 용량 에너지를 다음과 같이 다시 쓸 수 있다.Then, we can rewrite the capacity energy as follows:

인덕터를 통과한 전류를 위치 좌표로 취급한다고 가정한다. 라그랑지안을 기술하기 위해 전압을 이들 위치 좌표의 시간 미분들을 이용하여 다시 쓴다. 각 전압에 대해 의 관계가 있다. 따라서 용량성 에너지는 다음과 같이 쓸 수 있다.We assume that the current through the inductor is treated as a position coordinate. To describe the Lagrangian, we rewrite the voltages using the time derivatives of these position coordinates. For each voltage, There is a relationship of . Therefore, the capacitive energy can be written as follows.

이제 시스템의 라그랑지안은 다음과 같이 쓸 수 있다.Now the Lagrangian of the system can be written as follows:

3.2.3.2. 2 회로2 circuits 해밀토니안Hamiltonian

해밀토니안은 N개의 위치 q i , N개의 운동량 p i , 및 라그랑지안 을 이용하여 다음과 같이 정의되며The Hamiltonian is a set of N positions q i , N momenta p i , and a Lagrangian It is defined as follows using

여기서 운동량들은 다음과 같이 정의된다.Here, the momentums are defined as follows:

이 경우 운동량은 다음과 같으며In this case, the momentum is:

여기서 줄별로 다음을 사용했다: 켤레 운동량의 정의; 미분들에 대한 곱 규칙; 크로네커(Kronecker) 델타의 축소 및 레이블 변경된 인덱스들; 및 C가 대칭 행렬이라는 사실. 이를 행렬 방정식으로 다음과 같이 요약할 수 있으며: Here we use the following line by line: the definition of conjugate momentum; the product rule for derivatives; the reduced and relabeled indices of the Kronecker delta; and the fact that C is a symmetric matrix. This can be summarized in the matrix equation as follows:

이는 다음을 의미한다This means that

그러면 라그랑지안은 다음과 같이 다시 쓸 수 있다.Then the Lagrangian can be rewritten as follows:

이는 해당 시스템의 해밀토니안이 다음과 같다는 것을 의미한다.This means that the Hamiltonian of the system is:

회로 파라미터들 측면에서, 인덕터 양단의 전압은 다음과 같으며In terms of circuit parameters, the voltage across the inductor is:

그래서 운동량은So the momentum is

이고 운동량을 이용한 전압은 다음과 같다.And the voltage using momentum is as follows.

그러면 해밀토니안은 다음과 같이 계산할 수 있다.Then the Hamiltonian can be computed as follows:

3.3 좌표 변경3.3 Change coordinates

HMC 및 그 확장을 위한 기존 코드베이스는 목표 분포가 퍼텐셜 에너지에 의해 인코딩된다고 가정한다. 그러므로 분포를 퍼텐셜 에너지에 유사하게 인코딩할 수 있다면 설계 구현 작업량을 크게 줄일 수 있다. 이는 아날로그 전기 시스템을 설명하는 데 사용되는 좌표들을 변경하는 것을 수반한다. 새로운 좌표계 에서 새로운 해밀토니안 K의 결과적인 정적 경로들(stationary paths)이 원래 해밀토니안의 정적 경로들과 같도록 원래 좌표들 및 해밀토니안 H에 어떤 변경을 가할 수 있을까?Existing code bases for HMC and its extensions assume that the target distribution is encoded by potential energy. Therefore, if the distribution can be encoded similarly to potential energy, the design implementation effort can be greatly reduced. This involves changing the coordinates used to describe the analog electrical system. A new coordinate system The original coordinates are such that the resulting stationary paths of the new Hamiltonian K are the same as the stationary paths of the original Hamiltonian. And what changes can be made to the Hamiltonian H ?

3. 3. 1 일반 이론3. 3. 1 General Theory

시작을 위해, 원래 해밀토니안 시스템이 다음을 만족하는지를 고려하며: To begin, consider whether the original Hamiltonian system satisfies:

여기서 피적분함수(integrand)는 해밀토니안을 이용하여 표현된 라그랑지안이다. 시스템에 대한 임의의 변환을 고려하여서, 이전 해밀토니안과 새로운 해밀토니안이 다음에 의해 관계를 갖게 하며: Here, the integrand is the Lagrangian expressed using the Hamiltonian. Considering an arbitrary transformation of the system, the old and new Hamiltonians are related by:

이는 스칼라 와 연속하는 이차 도함수들을 가지는 위상 공간 좌표들 F의 함수에 대한 것이다. 이제 새로운 해밀토니안 KH와 동일한 정적 경로를 가짐을 명시적으로 보인다. This is Scala is a function of phase space coordinates F with continuous second derivatives. We now show explicitly that the new Hamiltonian K has the same stationary path as H.

도 해밀토니안이므로, 다음이 성립하며 Since it is also Hamiltonian, the following holds.

여기서 줄별로 다음을 적용한다: K에 대한 해밀토니안 동역학의 정의와 H를 이용한 대입; 적분 및 미분의 선형성; 선적분의 기본 정리; 적분 경로에서의 변화에 따른 끝점 값 차이의 독립성. 이 방정식의 양변의 정적 경로는 동일하다: 이는 정적 경로의 위치가 곱셈 상수 에 의존하지 않기 때문이다. Here we apply the following line by line: the definition of Hamiltonian dynamics for K and substitution using H ; linearity of integration and differentiation; fundamental theorem of line integrals; independence of differences in endpoint values as a function of changes in the integration path. The static paths of both sides of this equation are identical: this means that the location of the static path is a multiplicative constant. Because it does not depend on .

3.3.2 새로운 좌표 증명3.3.2 New Coordinate Proof

이전 섹션의 결과를 바탕으로 변환이 정준적인지를 확인하는 절차를 가졌다. 좌표 를 변수로 하여 새로운 해밀토니안 K가 주어지면, 이는 스칼라 와 방정식 (5)를 만족하도록 하는 함수 G를 증명함으로써 다른 해밀토니안 와 동일한 동역학을 유도함을 확인할 수 있다. Based on the results of the previous section, we had a procedure to check whether the transformation was canonical. Coordinates Given a new Hamiltonian K with a variable , it is a scalar By proving a function G that satisfies equation (5), we can obtain another Hamiltonian It can be confirmed that the same dynamics are induced.

해당 시스템의 경우, 다음과 같은 원래의 해밀토니안을 고려한다For the given system, we consider the original Hamiltonian as follows

새로운 좌표를 다음과 같이 지정하면, If you specify new coordinates as follows,

이는 다음과 같은 변환된 해밀토니안을 얻게 되는데This gives the following transformed Hamiltonian:

L이 대칭적이라고 가정하기 때문이다. Because we assume L is symmetric.

로 둔다. 그러면 다음이 얻어지며 and Let it be. Then, we get the following

이 정의를 이용하여 방정식 (5)가 충족되는지를 다음과 같이 확인하며: Using this definition, we check whether equation (5) is satisfied as follows:

여기서 줄별로 다음을 적용하였다: K의 정의; 좌표 변환의 정의 및 F의 정의; 반대 항의 소거; 및 H의 정의 및 의 정의. 그러므로 이 변환은 유효하다. Here we apply the following line by line: definition of K ; definition of coordinate transformation and definition of F ; elimination of opposite terms; and definition of H and Definition of . Therefore, this transformation is valid.

3.3.3 최종 물리적 관계 및 추상적 관계3.3.3 Final physical and abstract relationships

아래와 같이 정의를 요약한다. 다음과 같은 추상 해밀토니안이 있으며The definition is summarized as follows. There is an abstract Hamiltonian such that

여기서 좌표는 회로량들과는 다음과 같이 관련된다Here, the coordinates are related to the circuit quantities as follows:

and

3.3.4 커패시터 전류를 기준으로 인덕터 전류를 구한다.3.3.4 Find the inductor current based on the capacitor current.

도 4의 회로를 다시 고려한다. 노드 i의 전류는 다음과 같다.Consider again the circuit of Fig. 4. The current at node i is:

커패시터를 통과하는 전류는 이며, 그래서 다음이 되며The current passing through the capacitor is and so it becomes the following

부호 행렬을 다음과 같이 정의한다.The sign matrix is defined as follows.

따라서 다음과 같이 적음으로써 합들을 결합할 수 있다.Therefore, we can combine the sums by writing as follows:

행렬 형태로 변환하면 다음이 얻어진다.Converting to matrix form gives:

3.4 다변량 정규 분포와의 연결3.4 Connection with multivariate normal distribution

회로의 값들을 C = Σ 이 되도록 설정하면, 변환된 좌표계에서 전기 시스템의 퍼텐셜 에너지는 목표 다변량 정규 분포의 에너지와 같다. If the values of the circuit are set to C = Σ, the potential energy of the electric system in the transformed coordinate system is equal to the energy of the target multivariate normal distribution.

맥스웰 커패시턴스 행렬은 다음과 같이 정의된다: Maxwell's capacitance matrix is defined as:

이는 이산 커패시터들을 변수로 하여 동등하게 다음과 같은 관계가 성립함을 의미한다This means that the following relationship holds equally when discrete capacitors are variables:

관계식을 역으로 적용하면, 공분산 행렬 Σ가 주어질 때, 먼저 결합 커패시터들을 다음과 같이 설정함으로써 개별 커패시턴스들을 설정한다Applying the relation in reverse, when the covariance matrix Σ is given, the individual capacitances are set by first setting the coupling capacitors as follows.

그러면 접지에 대한 커패시턴스들은 다음과 같이 설정될 수 있다Then the capacitances for grounding can be set as follows:

3. 5 정규 3. 5 regular 모드mode

도 5에 보인 2D 가우시안에서 실행되는 HMC 프로세스의 예를 고려한다. 이 도면은 적분 시간을 신중하게 선택하는 것의 중요성을 보여준다: 적분을 너무 오래 하면 이미 방문했던 위치로 되돌아가게 되며, 이는 계산이 낭비됨을 의미한다. Consider an example of an HMC process running on a 2D Gaussian, shown in Fig. 5. This figure illustrates the importance of choosing the integration time carefully: integrating for too long will result in returning to a location that has already been visited, which means wasted computation.

전형적으로 이는 HMC를 No U-Turn Sampler(NUTS)로 업그레이드하여 해결하며, 이는 이러한 U턴들을 피하도록 적분 시간을 적응적으로 설정한다. 그러나 가우시안 분포가 매우 단순하기 때문에 합리적인 적분 시간을 직접 계산하는 것을 상상할 수 있다. Typically, this is addressed by upgrading the HMC to a No U-Turn Sampler (NUTS), which adaptively sets the integration time to avoid these U-turns. However, since the Gaussian distribution is so simple, it is conceivable to compute a reasonable integration time directly.

이를 위해 질량 행렬 M과 스프링 상수 행렬 K를 갖는 결합된 오실레이터 시스템이 있다고 가정한다. 물리적 질량 스프링 시스템의 측면에서 다음이 얻어진다.For this purpose, we assume a coupled oscillator system with mass matrix M and spring constant matrix K. In terms of the physical mass-spring system, we obtain:

and

그러면 오실레이터 위치 벡터 를 변수로 하여 운동 방정식은 다음과 같이 쓸 수 있으며Then the oscillator position vector The equation of motion can be written as follows with as a variable.

운동 방정식을 풀면 미지의 고유 벡터 를 변수로 하여 정규 각주파수 ω에 대한 일반화된 고유값 방정식이 도출된다: Solving the equations of motion yields the unknown eigenvector The generalized eigenvalue equations for the normal angular frequency ω are derived with as a variable:

이를 다음과 같이 다시 정리할 수 있다.This can be reorganized as follows:

A = K -1 M를 정의하면, 표준 고유값 방정식은 다음과 같이 된다. A = K -1 M and If we define , the standard eigenvalue equation becomes:

각 고유값 에 대해 를 설정하여 정규 주파수들은 구해진다. Each eigenvalue About By setting the regular frequencies, the normal frequencies are obtained.

이들 정규 주파수가 주어지면, 가장 느리게 움직이는 (최저 주파수) 방향에서 U턴을 시작하기 전에 얼마나 오랫동안 적분해야 하는지를 알 수 있다. f min을 최소 정규 모드 주파수로 둔다. 그러면 한 주기 후에 시작했던 곳으로 돌아가면, Given these normal frequencies, we can know how long we need to integrate before we start a U-turn in the direction of slowest motion (lowest frequency). Let f min be the minimum normal mode frequency. Then, after one cycle, we are back where we started.

는 적분 시간의 상한이다. 그래서 더 작은 값을 적분 시간으로 선택하며, is the upper limit of the integration time. So, a smaller value is chosen as the integration time.

예를 들어, for example,

또는 가장 긴 기간의 4분의 1이다. or one-quarter of the longest period.

3.6 주파수 스케일링3.6 Frequency Scaling

오실레이터의 주파수를 제어하기 위해, 커패시턴스 및 인덕턴스 둘 다를 축소 조정할 수 있는데, 오실레이터의 주파수가 에 따라 정해지기 때문이다. 원하는 가우시안의 축소 조정된 버전으로부터 샘플들을 추출하기 위해 콜레스키(Cholesky) 분해 과정의 증명을 수정할 수 있으며, 이는 오실레이터 주파수를 조정할 수 있는 스케일 파라미터 η를 제공한다. To control the frequency of the oscillator, both the capacitance and inductance can be adjusted to reduce the frequency of the oscillator. Because it is determined by . The proof of the Cholesky decomposition process can be modified to extract samples from a scaled version of the desired Gaussian, which gives a scale parameter η that can adjust the oscillator frequency.

3.6.1 일반 이론3.6.1 General Theory

평균 및 공분산 행렬 를 이용하여 에서 목표 가우시안 확률 밀도 g를 정의한다, average and using the covariance matrix In , we define the target Gaussian probability density g ,

전단사 연속 미분가능 변환 φ를 다음과 같이 정의한다.The bijective continuous differentiable transformation φ is defined as follows.

새로운 함수 f를 다음과 같이 정의한다고 가정한다.Suppose we define a new function f as follows:

X가 밀도 f를 갖는 어떤 확률 변수라면, φ(X)는 밀도 g를 갖는다. 그래서 밀도 f로부터 샘플들을 추출하는 것이 편리한지 살펴본다. If X is some random variable with density f , then φ ( X ) has density g . So let's see if it is convenient to sample from the density f .

다음이 성립하며The following holds true:

, ,

즉, η 곱하기 단위 행렬이 성립한다. 따라서 다음이 성립한다.That is, η times the identity matrix is established. Therefore, the following is established.

합성 함수의 경우 다음이 성립한다.For composite functions, the following holds:

. 그러면 . then

를 곱하면 다음이 되며 and If we multiply by , we get:

이는 공분산 행렬 의 중심화된 가우시안의 확률 밀도이다. This is the covariance matrix is the probability density of the centered Gaussian.

3.6.3.6. 2 회로2 circuits 파라미터 관점Parameter perspective

따라서 스케일링 절차가 성립된다. 물리적 오실레이터의 주파수 증가는 인덕턴스 또는 커패시턴스 중 하나 또는 둘 다를 감소시킴으로써 발생한다는 것을 고려한다. 용량성 결합된 오실레이터들에 대해 Σ 물리적 = C를 설정했으므로, 고정 인덕턴스 L에 경우 Σ물리적 Σ 를 설정하면 더 높은 주파수를 갖게 된다. Thus, the scaling procedure is established. Consider that the frequency increase of a physical oscillator occurs by decreasing one or both of its inductance or capacitance. Since we have set Σ physical = C for capacitively coupled oscillators, for a fixed inductance L, Σ physical < Σ Setting it will result in a higher frequency.

다시 말해, 만약 η > 1이고 다음이 성립되면 주파수는 더 높아진다In other words, if η > 1 and the following holds, the frequency becomes higher

위의 유도에 의하면 시스템으로부터 추출된 샘플들은 (0, 물리적)에 따라 분포될 것이고; 각 샘플 에 매핑하면 에 따라 분포된 샘플들이 얻어진다. According to the above derivation, the samples extracted from the system are will be distributed according to (0, physical ); each sample cast If you map it to Samples distributed according to are obtained.

3.6.3 주파수 스케일링 정량화3.6.3 Quantifying Frequency Scaling

주파수는 얼마나 변했나? 결합된 오실레이터 시스템의 고유값 방정식은 다음과 같다는 것을 상기한다How much has the frequency changed? Recall that the eigenvalue equations of the coupled oscillator system are

시스템 공분산 행렬의 측면에서, 이는 다음이 된다In terms of the system covariance matrix, this becomes

목표 공분산 Σ와 스케일링 계수 η를 대입하면 다음이 된다Substituting the target covariance Σ and the scaling factor η , we get

ω가 원래 목표 분포의 정규 모드 주파수를 나타낸다면, If ω represents the normal mode frequency of the original target distribution,

그러면then

따라서 φ의 정의에 사용된 계수 η는 정규 모드 주파수를 곱한 양과 정확히 같다. Therefore, the coefficient η used in the definition of φ is exactly equal to the product of the normal mode frequencies.

4 물리적 4 Physical 구현예Implementation example

도 6은 전체 계산 프로세스의 샘플링 부분을 주로 수행하는 하드웨어 구현예를 도시한다. 이 하드웨어 구현예는 디지털 시스템을 포함하며, 디지털 시스템은 여기서 FPGA 컨트롤러(610)로서 구현되며, 아날로그 시스템에 동작 가능하게 결합되며, 아날로그 시스템은 여기서 LC 공진기(620)로서 도시되며, 아날로그-디지털 변환기(ADC), 디지털-아날로그 변환기(DAC), 잡음원, 및 스위치(630)에 결합된다. 샘플들은 잡음원(630)으로 여기될 때 LC 공진기들(620)(단위 셀들 또는 셀들이라고도 함, 섹션 4.1에서 자세히 설명)에 걸리는 전압 레벨들이다. 사용자는 FPGA 컨트롤러(610)에 동작 가능하게 결합된 개인용 컴퓨터(PC)(602)를 통해 하드웨어 구현예와 상호작용할 수 있다. FIG. 6 illustrates a hardware implementation that primarily performs the sampling portion of the overall computational process. The hardware implementation includes a digital system, implemented herein as an FPGA controller (610), operably coupled to an analog system, illustrated herein as an LC resonator (620), coupled to an analog-to-digital converter (ADC), a digital-to-analog converter (DAC), a noise source, and a switch (630). The samples are voltage levels across the LC resonators (620) (also referred to as unit cells or cells, as described in detail in Section 4.1) when excited by the noise source (630). A user may interact with the hardware implementation via a personal computer (PC) (602) operably coupled to the FPGA controller (610).

PC(602)는 FPGA 컨트롤러(610)로부터 다음과 같은 서로 다른 세 가지 유형의 정보를 다운로드한다: (1) 셀 공진 주파수, (2) 결합 섹션들 및 그것들 각각의 극성들, 및 (3) 잡음 수준. FPGA 컨트롤러(610)(섹션 4.3에 자세히 설명됨)는 다운로드된 데이터에 따라 회로들을 셋업한다. ADC는 전압들을 샘플링하고 그 데이터를 FPGA의 온칩 메모리에 저장한다. 일단 FPGA 컨트롤러(610)가 미리 결정된 양의 데이터를 수집하였다면, 해당 데이터를 PC(602)에 다시 전송한다. The PC (602) downloads three different types of information from the FPGA controller (610): (1) cell resonance frequency, (2) coupling sections and their respective polarities, and (3) noise level. The FPGA controller (610) (described in detail in Section 4.3) sets up the circuits according to the downloaded data. The ADC samples the voltages and stores the data in the on-chip memory of the FPGA. Once the FPGA controller (610) has collected a predetermined amount of data, it transmits the data back to the PC (602).

도 6에 도시된 FPGA 컨트롤러(610)와 PC(602) 사이의 인터페이스는 USB를 통하는 가상 COM 포트이다. 다른 인터페이스 프로토콜들(예컨대, PCIe 또는 CXL) 또한 가능하다. The interface between the FPGA controller (610) and the PC (602) illustrated in Fig. 6 is a virtual COM port via USB. Other interface protocols (e.g., PCIe or CXL) are also possible.

4.1 4.1 결합된Combined 공진기들Resonators

도 7은 두 개의 용량성 결합된 병렬 LC 회로 형태의 결합된 공진기들을 도시한다. 결합 및 셀 커패시턴스는 컨트롤러에 의해 결정된다. 커패시터들은 아날로그 또는 디지털 방식으로 조정될 수 있는 한편, 인덕턴스들은 일정하게 유지될 수 있다. Figure 7 illustrates coupled resonators in the form of two capacitively coupled parallel LC circuits. The coupling and cell capacitances are determined by the controller. The capacitors can be adjusted analog or digitally, while the inductances can be kept constant.

더 많은 수의 공진기를 결합하면 시스템 성능이 개선된다. 결합의 형태적 특성(nature)(예컨대, 전체-대-전체, 선형 등)은 원하는 가공과 하드웨어 제한에 따라 결정된다. 도 8은 N개 셀 간의 개념적인 전체-대-전체 결합을 도시한다. Coupling a larger number of resonators improves system performance. The nature of the coupling (e.g., all-to-all, linear, etc.) depends on desired processing and hardware constraints. Figure 8 illustrates a conceptual all-to-all coupling between N cells.

정확한 구현예의 셀들 및 결합 섹션들은 기술에 따라 달라진다. 섹션 4.1.1 및 4.1.2는 인쇄 회로 기판(printed circuit board, PCB)들과 호환되는 기술들로 셀들을 구현하는 방법의 예들을 보여준다. The exact implementation examples of cells and their coupling sections will vary depending on the technology. Sections 4.1.1 and 4.1.2 show examples of how to implement cells with technologies compatible with printed circuit boards (PCBs).

4.1.1 조정가능 공진기4.1.1 Tunable Resonator

도 9a(a)는 스위치 조정가능 공진기의 구조를 도시한다. 커패시터들은 션트(shunt) 스위치(예컨대, 트랜지스터)를 사용하여 자신들의 값을 변경할 수 있다. 최소 커패시턴스 값(C1)은 스위치를 필요로 하지 않다. 커패시터들의 상부 플레이트는, 샘플링되고 다른 셀들에 결합되는 전압을 나타낸다. Fig. 9a(a) illustrates the structure of a switch-tunable resonator. The capacitors can change their values using shunt switches (e.g., transistors). The minimum capacitance value ( C 1) does not require a switch. The top plates of the capacitors represent the voltages that are sampled and coupled to other cells.

잡음원은 아날로그 회로에 대한 의존도를 줄이거나 최소화하기 위해 디지털 컨트롤러를 이용하여 구현될 수 있다. 결과적으로 저역통과 필터(Lowpass Filter, LPF)는 출력 신호의 불필요하거나/하고 원치 않는 고주파 성분들을 필터링한다. 이는 섹션 4.4에서 자세히 설명되어 있다. The noise source can be implemented using a digital controller to reduce or minimize the dependence on analog circuits. As a result, a lowpass filter (LPF) filters out unwanted and/or undesirable high frequency components of the output signal. This is described in detail in Section 4.4.

4.1.2 제어 결합4.1.2 Control binding

셀들 간의 결합 유닛들은 도 11에서 도시된 바와 같이 구현될 수 있다. 직렬 스위치(결합 인에이블 신호에 의해 제어됨)는 결합을 켜거나 끌 수 있다. 결합의 극성은 신호 결합 극성에 의해 제어된다. 음극 및 양극은 도면에 도시된 바와 같은 변압기 셋업을 사용하여 달성된다. The coupling units between the cells can be implemented as illustrated in Fig. 11. A series switch (controlled by a coupling enable signal) can turn the coupling on or off. The polarity of the coupling is controlled by the signal coupling polarity . Negative and positive polarity are achieved using a transformer setup as illustrated in the drawing.

4.2 아날로그-디지털 변환기(4.2 Analog-to-digital converter ( ADCADC ) )

각 셀로부터의 전압 판독은 ADC를 사용하여 행해진다. 이 구성은 각 셀에 대해 단일 ADC 채널을 사용한다. 대안적으로, 여러 셀은 동시에 샘플링되는 경우 단일 ADC를 공유할 수 있다. ADC의 입력 임피던스는 셀들의 공진 주파수에 대해 고려되어야 한다. Voltage readings from each cell are made using an ADC. This configuration uses a single ADC channel for each cell. Alternatively, multiple cells can share a single ADC if they are sampled simultaneously. The input impedance of the ADC must be considered relative to the resonant frequency of the cells.

4.3 컨트롤러(FPGA) 4.3 Controller (FPGA)

PCB 내의 컨트롤러는 다음과 같은 기능들을 처리한다: The controller within the PCB handles the following functions:

PC와의 다운로드 및 업로드 인터페이스 Download and upload interface with PC

ADC와의 인터페이스(데이터 판독 및 저장, 초기화 등) Interfacing with ADC (reading and storing data, initialization, etc.)

공진기들을 조정하기 위해 셀 스위치들을 제어 Control cell switches to tune the resonators

결합 스위치들을 적절한 극성으로 켜거나 끄기 위한 제어 Control to turn the coupling switches on or off with the appropriate polarity

의사랜덤 잡음 생성(섹션 4.4) Generating pseudorandom noise (Section 4.4)

도 12는 PC로부터의 셋업 데이터의 프로토콜과 함께 FPGA 기능의 블록도를 도시한다. Figure 12 shows a block diagram of the FPGA functions along with the protocol of setup data from a PC.

4.4 잡음 주입4.4 Noise injection

각 단위 셀은 독립적인 잡음원을 가진다. 셀들이 병렬 LC 회로로서 셋업되므로, 도 7의 잡음원들은 전류원들이다. 이를 구현하는 한 가지 방법은 도 13a에 도시된 바와 같이 단일 비트 의사랜덤 잡음(PN)을 생성하고 RC 회로를 사용하여 출력을 필터링하는 것이다. 저항기가 있으면 PRN 전압원이 전류원으로서 나타나게도 한다(테브냉(Thevenin) 대 노턴 변환). Each unit cell has an independent noise source. Since the cells are set up as a parallel LC circuit, the noise sources in Fig. 7 are current sources. One way to implement this is to generate a single bit pseudorandom noise (PN) and filter the output using an RC circuit, as shown in Fig. 13a. The presence of a resistor also causes the PRN voltage source to appear as a current source (Thevenin to Norton transformation).

잡음의 진폭은 단일 비트 잡음원에 대한 펄스 밀도 변조(Pulse Density Modulation, PDM)를 사용하여 제어할 수 있다.The noise amplitude can be controlled using pulse density modulation (PDM) for a single-bit noise source.

4.4.1 4.4.1 PNPN 다항식Polynomial

단일 비트 의사랜덤 시퀀스는 원시 다항식을 나타내는 선형 피드백 시프트 레지스터(LFSR) 구성으로 구현된다. 각 셀은 서로 다른 초기 조건에서 시작하여서 셀들이 비상관 의사 잡음 시퀀스들을 생성하게 한다. 시프트 레지스터의 길이는 각 단위 셀의 잡음이 다른 시퀀스들로부터 충분히 떨어져 있을 만큼 충분히 커야 한다. 전형적인 시프트 LFSR은 도 13b에 도시되어 있다.A single-bit pseudorandom sequence is implemented as a linear feedback shift register (LFSR) configuration representing a primitive polynomial. Each cell starts with a different initial condition, causing the cells to generate uncorrelated pseudonoise sequences. The length of the shift register must be large enough so that the noise of each unit cell is sufficiently separated from other sequences. A typical shift LFSR is illustrated in Fig. 13b.

5 작동 방식5 How it works

5.0.5.0. 1 시스템1 System 초기화 reset

이 단계에서 장치는 도 14에 도시된 프로세스에 따라 특정 다변량 정규 분포로부터 샘플들을 추출을 수행하도록 준비되어, 시스템 초기화(1410)부터 시작한다:At this stage, the device is prepared to extract samples from a specific multivariate normal distribution according to the process illustrated in Fig. 14, starting from system initialization (1410):

1. 확률 모델 정의(1411)(디지털 장치): 목표 공분산 행렬 Σ와 목표 평균 벡터 d 차원 정규 분포 를 정의한다. 1. Definition of the probability model (1411) (digital device): Target covariance matrix Σ and target mean vector is a d- dimensional normal distribution Defines .

2. 하이퍼파라미터 선택(1412)(디지털 장치): 란초시(Lanczos) 프로세스를 사용하여 Σ, 의 가장 높은 및 가장 낮은 정규 모드 주파수(normal mode frequency)들을 계산한다. 오실레이터 블록 구현예의 조정가능 부품들 및 측정 회로들의 특성들을 고려해 볼 때 가능한 가장 높은 주파수인 주파수 임계값가 거의 같도록 하는, 즉 임계값이도록 하는 스케일링 계수 η를 선택한다.2. Hyperparameter selection (1412) (digital device): Σ using the Lanczos process, and Calculate the highest and lowest normal mode frequencies of the oscillator block. The frequency is the highest possible frequency, taking into account the characteristics of the adjustable components and the measurement circuits of the oscillator block implementation. Threshold and to make them almost the same, that is Choose a scaling factor η such that it becomes a threshold .

η? 이는 목표 공분산 행렬에 관계없이 장치의 속력을 선택할 수 있게 한다. η가 없으면 주파수들은 정규 모드 방정식 (15)에 의해 고정된다. Why η ? This allows the speed of the device to be chosen independently of the target covariance matrix. Without η , the frequencies are fixed by the normal mode equation (15).

임계값은 장치 속력(η에 의해 설정됨) 및 장치 정확도(측정 회로에 의해 설정됨)가 어느 정도 상충 관계를 보인다는 사실에 의해 설정되며; 정확한 값은 전체 오실레이터 시스템의 시뮬레이션에 의해 유도된다. The threshold is set by the fact that there is some trade-off between device speed (set by η ) and device accuracy (set by the measurement circuitry); the exact value is derived by simulation of the entire oscillator system.

목표 물리적 공분산 행렬을 Σ물리적=η - 2Σ로서 설정한다(자세한 내용은 섹션 3.5 참조). 수정된 HMC 샘플링 프로세스에 사용될 적분 시간 을 설정한다(이 선택에 대한 자세한 내용에 대해, 섹션 3.6 참조). Set the target physical covariance matrix as Σ physical = η - 2 Σ (see Section 3.5 for details). Integration time to be used for the modified HMC sampling process. (For more information on this selection, see Section 3.6).

3. 오실레이터 부품 값들 설정(1413)(아날로그 장치): 각 조정가능 인덕터 F의 세팅 L i 를 선택한다(가령, 모두 와 같이 선택한다). 이들 값은 대각 행렬 L을 형성한다. 커패시턴스 행렬을 계산하며, 이는C= 물리적과 같다. 각 결합 커패시터를 C ij = - C ij 값으로 설정한다. 각 i번째 조정가능 오실레이터 커패시터 E로 설정한다. 3. Oscillator Set component values (1413) (Analog devices) : Select the setting L i of each adjustable inductor F (e.g., all ) These values form a diagonal matrix L. Compute the capacitance matrix, which is equal to C = physical . Each coupled capacitor Set C ij = - C ij value. Each i -th adjustable oscillator capacitor E Set to .

4. 마르코프 연쇄 초기화(1414)(디지털 장치): 디지털 장치에서 마르코프 연쇄 S를 초기화한다. 초기 상태는 목표 정규 분포의 차원인 길이가 d인 모든 0들로 된 벡터이다. 이 연쇄는 전압 값들을 나타낸다. 4. Markov Chain Initialization (1414) (Digital Device) : Initialize the Markov chain S on a digital device. The initial state is a vector of all zeros whose length is d , which is the dimension of the target normal distribution. This chain represents voltage values.

5.0.2 샘플 추출5.0.2 Sample Extraction

샘플링 단계 1420에서, 디지털 장치(디지털 컨트롤러)와 물리적 장치(결합된 아날로그 단위 셀 네트워크)는 전압에 대한 마르코프 연쇄를 진행하기 위해 협력한다. 다음 절차의 반복 부분은 다음과 같이 해밀토니안 몬테카를로(HMC) 프로세스를 적용한 것이다: 위치 대신 운동량을 연쇄 상태(chain state)로서 사용하고, 디지털 장치가 수치 적분을 통해 적분을 수행하는 것이 아니라 물리적 장치가 자연스러운 동역학을 통해 적분을 수행한다. 루프의 수용/거부 단계는 아날로그 오류 수정의 신규 형태인데, 해당 단계가 목표 분포로부터의 물리적 장치의 편차를 수정하기 때문이다. 다음 단계들을 N번 반복한다: In sampling step 1420, the digital device (the digital controller) and the physical device (the coupled network of analog unit cells) cooperate to perform a Markov chain for the voltages. The iterative part of the procedure is an application of the Hamiltonian Monte Carlo (HMC) process as follows: instead of positions, momentum is used as the chain state, and the integration is performed by the physical device through its natural dynamics rather than by the digital device through numerical integration. The accept/reject step of the loop is a novel form of analog error correction because it corrects for deviations of the physical device from the target distribution. The following steps are repeated N times:

1. V 선택(1421)(디지털 장치): 마르코프 연쇄 S에서의 가장 최근 상태는 다음 전압 값 (각 오실레이터 간 결합 스파이크 J를 설정할 초기 전압)이다. 1. V selection (1421) (digital device) : The most recent state in the Markov chain S is the next voltage value. (initial voltage to set the coupling spike J between each oscillator).

2. I 선택(1422)(디지털 장치): d개의 비상관 단위 정규 분포 로부터 샘플들을 추출하며, 그 결과로 길이 d의 벡터 가 생성된다. 전류들 의 초기값은 로서 계산된다. 2. I Selection (1422) (digital device) : d uncorrelated unit normal distribution Extract samples from , resulting in a vector of length d are generated. Currents The initial value of It is calculated as .

3. 초기 V, I 설정(1423)(아날로그 장치): 스위치 B를 열고 스위치 AC를 닫는다. 전압원들 D로 설정하고, 전류원들 G로 설정한다.3. Initial V, I setting (1423) (Analog device): Open switch B and close switches A and C. Voltage sources D , and the current sources G are set to Set to .

4. 시스템 진화 활성화(1424)(아날로그 장치): 스위치를 켜서 각 오실레이터 블록에서 B가 닫히고 A, C가 열리도록 하며; 전압원 및 전류원를 끈다. 이는 오실레이터들이 자유롭게 진화를 시작하는 것을 허용한다. 4. Activate System Evolution (1424) (Analog Device) : Turn on the switch so that B is closed and A , C are open in each oscillator block; turn off the voltage and current sources. This allows the oscillators to start evolving freely.

5. 최종 V, I 측정(1425)(아날로그 장치) 시간 T 후, 최종 궤적 값을 측정한다 ― 각 전압계 X를 사용하여 결합 스파이크들 J의 최종 전압들 최종을 측정하며; 각 전류계 Y를 사용하여 오실레이터 인덕터들 F를 통과하는 최종 전류들 최종을 측정한다. 5. Final V, I measurement (1425) (Analog device) After time T , measure the final trajectory values - the final voltages of the coupled spikes J using each voltmeter X. Measure the final currents through the oscillator inductors F using each ammeter Y. Measure the final .

6. 측정된 값 계산(1426)(디지털 장치): 에너지의 초기 값 초기= 와, 에너지의 최종 값최종= 을 계산한다. 수용률 을 계산한다. [0, 1] 구간의 균일 분포에서 값 u를 샘플링한다. u < α이면, -1. 0* 최종을 마르코프 연쇄 S에 추가한다; 그렇지 않으면, 를 추가한다. 6. Calculation of measured value (1426) (digital device) : Initial value of energy Initial = Wow, the final value of energy Final= Calculate the acceptance rate Computes . Sample a value u from a uniform distribution on the interval [0, 1]. If u < α , then -1. 0* Add the final to the Markov chain S ; otherwise, Add .

5.0.3 종료 5.0.3 End 시퀀스Sequence

종료 시퀀스 단계(1430)에서, 물리량들로부터 목표 분포 샘플들로 다시 변환한다. In the termination sequence step (1430), the physical quantities are converted back into target distribution samples.

1. 종료(1431)(디지털 장치): 일단 N개의 샘플이 추출되면, 마르코프 연쇄에 값을 추가하는 것을 중지한다. 1. Termination (1431) (digital device) : Once N samples are extracted, stop adding values to the Markov chain.

2. 운동량 계산(1432)(디지털 장치): 변수들을 전기량들(전압들)로부터 알고리즘량들(운동량들)로 변경한다. 마르코프 연쇄 S의 각 에 대해 변환 를 적용하여 이를 행한다. 2. Momentum calculation (1432) (digital device) : Change variables from electrical quantities (voltages) to algorithmic quantities (momentum). Each of the Markov chain S About conversion This is done by applying .

3. 마르코프 연쇄 정규화(1433)(디지털 장치): 각 운동량 에 변환 를 적용하며; 그 결과를 반환한다.3. Markov chain regularization (1433) (digital device) : Angular momentum Convert to and returns the result.

6 유도 결합6 Inductive coupling

6.1 다변량 분포 샘플링을 위한 유도성 6.1 Inductive for multivariate distribution sampling 결합된Combined 조화 Harmony 오실레이터들Oscillators

6.1.6.1. 1 회로1 circuit 라그랑지안Lagrangian

각각이 상호 인덕턴스들 L ij 를 통해 다른 모든 오실레이터들에 유도성 결합된 N개의 조화 오실레이터의 세트를 고려한다. 임의의 쌍 i, j의 오실레이터들은 다음과 같은 하위회로에 의해 표현될 수 있다: Consider a set of N harmonic oscillators, each inductively coupled to all other oscillators through mutual inductances L ij . Any pair of oscillators i , j can be represented by the following subcircuit:

이 회로의 총 유도 에너지는 다음과 같다.The total induced energy in this circuit is:

총 용량성 에너지는 다음과 같다The total capacitive energy is:

이후의 미적분을 단순화하기 위해 인덕턴스 행렬 L을 다음과 같이 정의한다.To simplify the subsequent calculus, the inductance matrix L is defined as follows.

그러면 유도 에너지를 다음과 같이 다시 쓸 수 있다.Then, we can rewrite the induced energy as follows:

회로의 노드들 간의 전압들을 위치 좌표들로서 취급하는 것으로 가정한다. 라그랑지안을 기술하기 위해, 이들 위치 좌표의 시간 미분들을 이용하여 전류들을 다시 쓴다. 각 전류에 대해, 라는 관계가 있다.We assume that the voltages between the nodes of the circuit are treated as position coordinates. To describe the Lagrangian, we rewrite the currents using the time derivatives of these position coordinates. For each current, There is a relationship called .

따라서 유도 에너지는 다음과 같이 쓸 수 있다.Therefore, the induced energy can be written as follows:

이제 시스템의 라그랑지안은 다음과 같이 쓸 수 있다Now the Lagrangian of the system can be written as

6.1.6.1. 2 회로2 circuits 해밀토니안Hamiltonian

해밀토니안은 N개의 위치 q i , N개의 운동량 p i , 및 라그랑지안 를 사용하여 다음과 같이 정의된다The Hamiltonian is a set of N positions q i , N momenta p i , and a Lagrangian is defined as follows using

여기서 운동량들은 다음과 같이 정의된다.Here, the momentums are defined as follows:

이 경우 운동량은 다음과 같으며In this case, the momentum is:

여기서 줄별로 다음을 사용했다: 켤레 운동량의 정의; 미분들에 대한 곱 규칙; 크로네커 델타의 축소 및 레이블 변경된 인덱스들; 및 L이 대칭 행렬이라는 사실. 이를 행렬 방정식으로 다음과 같이 요약할 수 있으며: Here we use the following line by line: the definition of conjugate momentum; the product rule for derivatives; the reduced and relabeled indices of the Kronecker delta; and the fact that L is a symmetric matrix. This can be summarized in the matrix equation as follows:

이는 다음을 의미한다This means that

그러면 라그랑지안은 다음과 같이 다시 쓸 수 있다.Then the Lagrangian can be rewritten as follows:

이는 해당 시스템의 해밀토니안이 다음과 같다는 것을 의미한다.This means that the Hamiltonian of the system is:

6.1.3 직접 유도 결합6.1.3 Direct inductive coupling

각각이 다른 모든 조화 오실레이터들에 직접 유도 결합되는 N개의 조화 오실레이터의 세트를 고려한다. 임의의 쌍 i, j 오실레이터들은 도 16에 도시된 하위회로에 의해 표현될 수 있다. Consider a set of N harmonic oscillators, each of which is directly inductively coupled to all other harmonic oscillators. Any pair of oscillators i, j can be represented by the subcircuits shown in Fig. 16.

이 회로의 총 유도 에너지는 다음과 같다.The total induced energy in this circuit is:

여기서 결합 분지의 전류는 다음과 같다.The current in the coupling branch here is:

이는 유도 에너지가 이웃 셀들을 결합하지 않음을 의미한다. This means that the induced energy does not couple neighboring cells.

6.2 유도성 결합 및 6.2 Inductive coupling and 용량성Capacitance 결합의 조합combination of combinations

더 일반적으로, 다변량 정규 확률 분포는 결합된 조화 오실레이터 네트워크에 매핑되며, 이는 해당 결합이 유도성이든, 용량성이든, 아니면 유도성 및 용량성이든 상관없다. 다시 말하지만, 네트워크는 다변량 정규 확률 분포의 각 차원에 대해 하나의 조화 오실레이터를 포함하고, 매핑은 회로의 라그랑지안 및 해밀토니안에 기반한다. More generally, a multivariate normal probability distribution is mapped onto a network of coupled harmonic oscillators, whether the coupling is inductive, capacitive, or both. Again, the network contains one harmonic oscillator for each dimension of the multivariate normal probability distribution, and the mapping is based on the Lagrangian and Hamiltonian of the circuit.

유도성 결합 및/또는 용량성 결합의 이러한 일반적인 경우에 대해, 라그랑지안 및 해밀토니안의 유도는 위에 제시된 유도와 개념적으로 유사하다. 마찬가지로, 결과적인 해밀토니안은 위에 제시된 유도를 따르는 다변량 정규 확률 분포에 매핑될 수 있다. 그런고로 단순화를 위해 유도 과정을 생략하고 유도성 결합과 용량성 결합을 조합하는 것이 가능하다는 점을 언급한다. For this general case of inductive coupling and/or capacitive coupling, the derivation of the Lagrangian and Hamiltonian is conceptually similar to the derivation presented above. Similarly, the resulting Hamiltonian can be mapped to a multivariate normal probability distribution following the derivation presented above. Therefore, for simplicity, we omit the derivation and note that it is possible to combine inductive and capacitive coupling.

7 저항성 결합7 Resistance Combination

단위 셀들을 결합하는 대안적인 방법은 저항기들을 사용하는 것이다. 이 경우, 0이 아닌 온도에서 잡음 있는 저항기를 수반하는 단위 셀을 고려할 수 있다. 도 17(a)는 확률적 전압 잡음원 δv(t)와 저항 R의 이상적인(잡음 없는) 저항기가 직렬로 구성된 잡음 있는 저항기에 대한 전형적인 등가 잡음 모델을 도시한다. 저항기의 단자 커패시턴스 C도 등가 저항기 모델에 추가된다. 노드 1의 전압(여기서는 간단히 v(t)로 라벨 표시됨)은 상태 변수이며, 그 동역학은 다음을 따른다: An alternative way to couple the unit cells is to use resistors. In this case, one can consider a unit cell with a noisy resistor at non-zero temperature. Figure 17(a) shows a typical equivalent noise model for a noisy resistor consisting of a stochastic voltage noise source δv ( t ) in series with an ideal (noiseless) resistor of resistance R. The terminal capacitance C of the resistor is also added to the equivalent resistor model. The voltage at node 1 (labeled here simply as v ( t )) is a state variable, and its dynamics are as follows:

이 확률적 미분 방정식(stochastic differential equation, SDE)은 v(t)에 비례하는 드리프트 항과 δv(t)에 비례하는 확산 또는 확률적 항을 포함한다. This stochastic differential equation (SDE) contains a drift term proportional to v ( t ) and a diffusion or stochastic term proportional to δv ( t ).

많은 단위 셀들로 구성된 시스템을 구축할 때 상관관계와 기하학적 제약조건을 표현하기 위해 단위 셀들을 결합해야 한다. 예를 들어, 도 17(b)에 그려진 바와 같이 두 개의 단위 셀이 저항기를 통해 결합될 수 있다. 그러면 노드 1과 2의 전압에 의해 표현되는 결합된 단위 셀들은 다음과 같은 드리프트 항들을 을 통해 결합되며When constructing a system consisting of many unit cells, the unit cells must be combined to express the correlation and geometric constraints. For example, as shown in Fig. 17(b), two unit cells can be combined through a resistor. Then, the combined unit cells represented by the voltages at nodes 1 and 2 are combined through the following drift terms:

여기서 Here and

여기서 자체 저항(self-resistance) 행렬 R, 커패시턴스 행렬 C, 및 컨덕턴스 행렬 J을 도입하였다. 그러면 도 17에 도시된 기본 구성 블록들을 사용하여 다수의 결합된 단위 셀의 시스템을 구축할 수 있다. Here, the self-resistance matrix R , the capacitance matrix C , and the conductance matrix J are introduced. Then, a system of a plurality of coupled unit cells can be constructed using the basic building blocks illustrated in Fig. 17.

8. 구성요소의 조정가능 구성8. Adjustable configuration of components

임의의 가우시안 분포를 표현할 수 있기 위해 각 분포에 맞게 하드웨어 구성요소는 변경 또는 조정되어야 한다. 구성 요소의 선택은 정밀도와 범위의 균형을 염두에 두고 이루어져야 한다. In order to be able to represent any Gaussian distribution, hardware components must be changed or adjusted to suit each distribution. The selection of components must be made with a balance between precision and range in mind.

8.1 커패시터의 조정가능 구성8.1 Adjustable configuration of capacitors

HMC 하드웨어에서 조정가능 커패시터가 구현되는 두 가지 방법은 다음과 같다: (1) 스위칭 커패시터 뱅크를 사용하는 방법, (2) 가변 커패시터(버랙터(varactor)) 다이오드를 사용하는 방법. There are two ways in which tunable capacitors are implemented in HMC hardware: (1) using a switched capacitor bank, and (2) using variable capacitor (varactor) diodes.

8.1.1 스위칭 커패시터 뱅크8.1.1 Switching capacitor bank

도 18은 스위칭 커패시터 뱅크를 예시한다. 스위칭 커패시터 뱅크는 다수의 서로 다른 커패시턴스 값을 획득하는 임의의 조합으로 병렬로 연결될 수 있는 여러 개의 커패시터로 구성된다. 디지털 신호는 스위치를 작동시켜 커패시터들을 연결하거나 연결해제하는 데 사용된다. 따라서 이 장치는 사실상 도 18에 도시된 바와 같이 디지털 전압 신호에 의해 커패시턴스 값이 조정되는 조정가능 커패시터처럼 동작한다. Fig. 18 illustrates a switched capacitor bank. The switched capacitor bank consists of a number of capacitors that can be connected in parallel in any combination to obtain a number of different capacitance values. A digital signal is used to actuate the switches to connect or disconnect the capacitors. Thus, the device essentially operates as an adjustable capacitor whose capacitance value is adjusted by a digital voltage signal, as illustrated in Fig. 18.

이 장치는 임의의 커패시턴스 값의 임의의 수의 커패시터를 포함할 수 있으므로, 이론적으로는 큰 물리적 면적, 손실 및 기생 커패시터들을 희생하더라도 임의의 범위 및 정밀도를 가질 수 있다. 또한, 이 장치는 일반 커패시터들로 구성되므로, 일반적으로 선형성이 우수하고 광범위한 전압 진폭들에서 잘 동작한다. Since the device can contain any number of capacitors of any capacitance value, it can theoretically have any range and precision at the expense of large physical area, losses, and parasitic capacitors. Furthermore, since the device is constructed from ordinary capacitors, it generally has good linearity and operates well over a wide range of voltage amplitudes.

8.1.2 8.1.2 버랙터Varactor 다이오드Diode

바리캡 다이오드는 전압 의존적인 커패시턴스 값을 가지는 반도체 소자이다. 이 유형의 다이오드는 전압 바이어스에 특히 민감한 공핍층을 가진다. 따라서 커패시턴스 값은 다이오드 양단의 전압 바이어스의 값을 가변함으로써 변경될 수 있다. 이들 다이오드는 원하는 조정성(tunability) 범위에 맞춰 특별히 설계된다. 바리캡은 일반적으로 스위칭 커패시터 뱅크보다 조정성 범위가 좁지만 연속하는 조정성을 가진다. Varicap diodes are semiconductor devices with voltage-dependent capacitance values. This type of diode has a depletion layer that is particularly sensitive to voltage bias. Therefore, the capacitance value can be changed by varying the voltage bias across the diode. These diodes are specially designed to meet the desired tunability range. Varicaps generally have a narrower tunability range than switching capacitor banks, but they have continuous tunability.

이들 반도체 소자의 또 다른 고려사항은 비선형성이다. 이는 이 소자는 매우 작은 변동 전압들에 대해 선형 커패시터처럼 동작한다는 것을 의미한다. 더 큰 크기의 AC 전계에서, 비선형 왜곡이 심각해진다. 마지막으로, 이들 소자는 다이오드들이기 때문에 분극되어 있다. 즉, 그것들은 DC 전압 바이어스의 한 방향에서만 커패시터로서 작동한다. Another consideration of these semiconductor devices is their nonlinearity. This means that they behave like linear capacitors for very small voltage fluctuations. For larger AC fields, the nonlinear distortion becomes severe. Finally, since these devices are diodes, they are polarized. That is, they behave as capacitors only in one direction of the DC voltage bias.

도 19는 바리캡들에 기반하여 조정가능 커패시터를 구성하는 가능한 접근법을 도시한다. 여기서 두 개의 바리캡은 반대 방향들로 지향되며, 외부 소스가 두 바리캡 사이에 전압을 인가한다. 이 접근법은 디지털 소자로부터의 전압 신호와 같은 외부 전압을 이용하여 전체 커패시턴스를 제어할 수 있게 한다. Figure 19 illustrates a possible approach to constructing a tunable capacitor based on varicaps. Here, the two varicaps are oriented in opposite directions, and an external source applies a voltage between the two varicaps. This approach allows controlling the overall capacitance using an external voltage, such as a voltage signal from a digital device.

8.2 8.2 이극Bipolar 결합 커패시터의 구성Configuration of coupling capacitors

임의의 목표 공분산은 음수인 일부 요소들을 가지는데, 이는 변수들 간의 음의 상관관계를 나타낸다. 이극(양극 및 음극) 용량성 결합은 하드웨어 커패시턴스 행렬에서 이들 요소들의 표현을 가능하게 한다. Any objective covariance has some elements that are negative, indicating negative correlations between variables. Bipolar (positive and negative) capacitive coupling allows the representation of these elements in the hardware capacitance matrix.

8.2.1 변압기 방법8.2.1 Transformer Method

도 11에 관하여 위에서 논의된 바와 같이, 요소들 간의 음의 결합은 변압기에 연결된 조정가능 커패시터를 사용하여 구현될 수 있다. 조정가능 커패시터는 결합의 크기를 설정하는 반면 변압기는 부호를 변경한다. 변압기는 한 쪽에서 다른 쪽까지의 전압 부호를 무효화하는 효과를 가지도록 감겨져 있으며, 따라서 효과적인 음의 용량성 결합을 구현한다. 또한 변압기와 이웃 셀로 가는 전선 사이를 전환할 수 있는 스위치가 음의 결합을 켜거나 끄기 위하여 커패시터와 변압기 사이에 배치된다. As discussed above with respect to Fig. 11, negative coupling between elements can be implemented using an adjustable capacitor connected to a transformer. The adjustable capacitor sets the magnitude of the coupling while the transformer changes the sign. The transformer is wound so as to have the effect of nullifying the sign of the voltage from one side to the other, thus implementing effective negative capacitive coupling. Additionally, a switch is placed between the capacitor and the transformer to switch between the transformer and the wires going to the neighboring cell to turn the negative coupling on or off.

8.2.2 8.2.2 하이브리드Hybrid 디지털-아날로그 방법Digital-Analog Method

이극 결합을 달성하는 대체 방법은 도 20에 그려진 하이브리드 디지털-아날로그이다. 이 방법에서 하드웨어는 결합해제된 단위 셀들을 가지며, 각 단위 셀은 전압을 측정하는 방법이 갖추어져 있고 임의의 전압원에 용량성 결합된다. 이 전압원는 다른 단위 셀들의 전압 V = (v 1, v 2, ..., v N -1, v N )에 따라 달라지는 셀 i에 전압 f i (V)를 공급하도록 제어될 수 있다. 이 인가된 전압은 디지털 방식으로 무효화될 수 있으며, 따라서 효과적으로 음의 결합을 구현할 수 있다. An alternative way to achieve heteropolar coupling is the hybrid digital-analog method, illustrated in Figure 20. In this method, the hardware has decoupled unit cells, each of which is equipped with a means to measure voltage and is capacitively coupled to an arbitrary voltage source. This voltage source is the voltage of the other unit cells, V = ( v 1 , v 2, ... , v N -1 , v N ) can be controlled to supply voltage f i ( V ) to cell i . This supplied voltage can be digitally nullified, thus effectively implementing negative coupling.

8.3 인덕터의 조정가능 구성8.3 Adjustable configuration of inductors

실제 인덕터들에는 칩 상에서 많은 공간을 차지한다는 단점이 있다. 따라서 인덕터처럼 동작하는 대체 회로 소자를 가지면 칩 상에서 사용되는 영역을 줄이는 데 도움이 될 수 있다. Real inductors have the disadvantage of taking up a lot of space on the chip. Therefore, having a replacement circuit element that acts like an inductor can help reduce the area used on the chip.

능동형 인덕터들이 채용될 수 있다. 예를 들어, 도 21은 자이레이터에 기반한 능동형 인덕터의 회로도를 도시한다. 여기서 두 개의 Gm 셀과 커패시터는 주어진 주파수 범위 내에서 인덕터들의 동작을 모방하는 전달 함수를 제공한다. 커패시터의 커패시턴스를 수정함으로써 전체 인덕턴스는 조정될 수 있다. Active inductors can be employed. For example, Fig. 21 shows a schematic of an active inductor based on a gyrator, where two Gm cells and a capacitor provide a transfer function that mimics the behavior of inductors within a given frequency range. By modifying the capacitance of the capacitor, the overall inductance can be adjusted.

이 능동형 인덕터 접근법에는 몇 가지 제한 사항이 있다. 이는 제한된 주파수 범위, 낮은 품질 계수, 증가된 전력 소비 및 비선형성을 포함한다. 그럼에도 불구하고 이 회로는 인덕터의 온칩 면적을 줄이는 데 유용할 수 있다. This active inductor approach has several limitations. These include limited frequency range, low quality factor, increased power consumption, and nonlinearity. Nevertheless, this circuit can be useful for reducing the on-chip area of the inductor.

9 인덕터 제거 전략9 Inductor Removal Strategy

9.1 서론9.1 Introduction

위에서 언급된 바와 같이, 가우시안 샘플링(및 기타)을 위한 아날로그 계산 기본요소(primitive)는 애플리케이션에 대한 관심 있는 변수들을 회로 단위 셀들의 자유도로 인코딩하는 것을 수반한다. 관심 있는 변수들 간의 상관관계들은 단위 셀들의 용량성 결합을 통해 인코딩될 수 있다. 그러나 위의 섹션 8.2에서 논의된 바와 같이, 단순 용량성 결합은 음 및 양 둘 다의 상관관계, 또는 이극 상관관계를 인코딩하는 것에 적합하지 않다. As mentioned above, the analog computational primitives for Gaussian sampling (and others) involve encoding the variables of interest for the application into the degrees of freedom of the circuit unit cells. Correlations between the variables of interest can be encoded via capacitive coupling of the unit cells. However, as discussed in Section 8.2 above, simple capacitive coupling is not suitable for encoding both negative and positive correlations, or bipolar correlations.

이 문제를 해결하는 한 가지 방법은 순수 용량성 결합과 반대 부호로 결합하기 원할 때 전압의 극성을 반전시키는 방식으로 배선된 커패시터에 직렬로 변압기를 사용하는 것이다. 그러나 이 해법은 결합 소자당 두 개의 인덕터를 사용해야 한다는 단점이 있다. 또한, 단위 셀들의 전체-대-전체 연결 그래프에서, 결합 소자들의 수는 단위 셀 수 d를 제곱한 d 2에 비례하여 증가한다. 이는 인덕터들이 실리콘 칩들에 배치될 때 넓은 물리적 면적을 차지하며 따라서 칩당 단위 셀 수를 제한하기 때문에 심각한 문제이다. One way to solve this problem is to use a transformer in series with the capacitors, wired in such a way that the polarity of the voltage is reversed when the coupling is desired to be opposite to the pure capacitive coupling. However, this solution has the disadvantage that it requires two inductors per coupling element. Also, in the total-to-total connection graph of the unit cells, the number of coupling elements increases proportionally to the square of the number of unit cells , d 2 . This is a serious problem because inductors occupy a large physical area when placed on silicon chips , thus limiting the number of unit cells per chip.

이 문제를 해결하기 위해 RCR 회로 기반의 단위 셀 구조를 사용하며, 여기서 자유도는 커패시터 양단의 전압 차이이다. 그러면 이극 결합은 한 쌍의 결합 커패시터들의 "병렬" 및 "교차" 연결 방식을 통해 행해질 수 있다. 이 장치는 랑주뱅 몬테카를로 프로토콜을 따르는 샘플링 프로세서로 사용할 수 있다(아래 섹션 19 참조). To solve this problem, we use a unit cell structure based on RCR circuits, where the degree of freedom is the voltage difference across the capacitors. Then, the heteropolar coupling can be done through the "parallel" and "cross" connection of a pair of coupling capacitors. This device can be used as a sampling processor following the Langevin Monte Carlo protocol (see Section 19 below).

9.2 단위 셀9.2 Unit Cell

단위 셀 회로에 대한 제안은 도 22에 도시되어 있다.A proposal for a unit cell circuit is illustrated in Fig. 22.

키르히호프 전류 법칙을 사용하여 이 회로를 분석하면 각 분지의 전류들을 기술하는 다음 방정식들이 도출된다: Analyzing this circuit using Kirchhoff's current law yields the following equations describing the currents in each branch:

이들 방정식의 합을 구하면If we sum these equations,

이고 그 차이는 다음과 같다And the difference is as follows

방정식 (24)는 다음 방식으로 노드 전압들을 사용하여 전개될 수 있고Equation (24) can be expanded using node voltages in the following manner:

방정식 (25)는 마찬가지로 다음과 같이 전개될 수 있다.Equation (25) can likewise be developed as follows.

이 방정식들을 단순화하기 위해, 다음과 같은 새로운 변수 세트와To simplify these equations, we introduce the following new set of variables:

시간 도함수들을 정의한다. 이제 방정식 (26)은 다음이 되며Define the time derivatives. Now equation (26) becomes

방정식 (27)은 다음이 된다.Equation (27) becomes:

단위 셀 내 저항들 간의 비대칭성을 특성화하기 위해, 비대칭 파라미터 α i 를 다음과 같이 정의하고To characterize the asymmetry between the resistors within a unit cell, the asymmetry parameter α i is defined as follows:

단위 셀 저항들의 합을 R i = R ia +R ib 로서 정의한다. 이 비대칭 파라미터는 -1 < α i < 1 범위에서 정의되고, 실제로 가능한 한 0에 가깝게 유지될 수 있다. The sum of the unit cell resistances is defined as R i = R ia + R ib . This asymmetry parameter is -1 < α i It is defined in the range < 1, and in practice can be kept as close to 0 as possible.

그러면 방정식 (30)은 다음이 되며: Then equation (30) becomes:

방정식 (31)은 다음이 된다.Equation (31) becomes:

마지막으로, 방정식 (34)를 방정식 (33)에 대입하면 다음이 된다.Finally, substituting equation (34) into equation (33) gives:

이 단위 셀의 동역학은 1의 자유도인 에 의해 시뮬레이션될 수 있고, 이들 동역학은 저항들 α i 의 비대칭성에 영향을 받지 않는다. The dynamics of this unit cell has one degree of freedom. can be simulated by , and these dynamics are not affected by the asymmetry of the resistors α i .

9.3 결합 셀9.3 Combined Cells

섹션 9.2에서 설명된 유형의 단위 셀들 간의 이극 용량성 결합은 아래에 설명된다. 이 회로는 두 개의 스위치를 포함하며, 이들 스위치는 하나가 양의 결함을 위한 것이고 하나가 음의 결합을 위한 것인 두 가지 구성만 가능하도록 동작한다. The capacitive coupling between unit cells of the type described in Section 9.2 is described below. The circuit contains two switches, which operate in only two possible configurations: one for positive coupling and one for negative coupling.

9.3.1 음의 결합9.3.1 Negative Combination

첫 번째 경우로, 유효 결합이 음이고 용량성 결합이 단위 셀들의 유사한 노드들 사이, 예컨대, 노드 ia 내지 노드 ja, 노드 ib 내지 노드 jb에 있는 때를 고려한다. 회로도는 도 23에 도시되어 있다. 키르히호프 전류 법칙을 사용하여 이 회로를 분석하면 각 분지에서의 전류들을 기술하는 방정식들이 도출되는데, 이들 방정식은 셀 i에 대해: In the first case, we consider the case where the effective coupling is negative and the capacitive coupling is between similar nodes of the unit cells, for example, from node ia to node ja , and from node ib to node jb . The circuit diagram is shown in Fig. 23. Analyzing this circuit using Kirchhoff's current law yields equations describing the currents in each branch, which are given by for cell i :

그리고 셀 j에 대해And about cell j

단위 셀의 분석을 따라, 전류 방정식들의 합과 차를 구하는데, 이들 합과 차는 셀 i에 대해Following the analysis of the unit cell, the sum and difference of the current equations are obtained, and these sums and differences are for cell i .

그리고 셀 j에 대해And about cell j

이들 방정식을 전압들에 대해 전개할 수 있다. 셀 i에 대해, 다음이 얻어지며These equations can be expanded for voltages. For cell i , we obtain

j에 대해 다음이 얻어진다.For cell j we obtain:

위의 전개에서 각 셀에 대해 방정식 (28)에서 정의된 좌표를 사용하였다. 또한 방정식 (32)로부터의 저항 비대칭 파라미터와 다음과 같이 정의된 새로운 커패시턴스 비대칭 파라미터In the above development, the coordinates defined in equation (28) were used for each cell. Also, the resistance asymmetry parameter from equation (32) and the new capacitance asymmetry parameter defined as follows

그리고 결합 커패시턴스들의 합인 를 사용하였다.And the sum of the coupling capacitances is was used.

9.3.2 대칭 사례9.3.2 Symmetric Case

α i = α j = 0이고 β = 0인 대칭 사례에서, 다음과 같은 방정식 세트를 얻고 셀 i에 대해In the symmetric case where α i = α j = 0 and β = 0, we obtain the following set of equations for cell i :

그리고 셀 j에 대해And about cell j

9.3.3 양의 결합9.3.3 Positive Combination

두 번째 경우로, 유효 결합이 양의 결합이고 용량성 결합이 단위 셀들의 서로 다른 노드들 사이, 예컨대, 노드 ia 내지 노드 jb, 노드 ib 내지 노드 ja에 있는 경우를 고려한다. 이 경우의 회로도는 도 24에 도시되어 있다. 섹션 9.3.1의 분석을 따르면 셀 i에서 전류 방정식들의 합과 차에 대해 다음 방정식들을 얻고In the second case, we consider the case where the effective coupling is positive and the capacitive coupling is between different nodes of the unit cells, for example, from node ia to node jb , from node ib to node ja . The circuit diagram for this case is shown in Fig. 24. Following the analysis in Section 9.3.1, we obtain the following equations for the sum and difference of current equations in cell i :

j에 대해 다음이 얻어진다.For cell j we obtain:

이 방정식들은 방정식 (44)-(47)과 매우 유사한데, 관심 있는 자유도들인 사이의 결합 항의 부호는 변경되었다.These equations are very similar to equations (44)-(47), with the degrees of freedom of interest being and The sign of the conjunction between the two has changed.

9.3.4 대칭 사례9.3.4 Symmetric Case

α i = α j = 0이고 β = 0인 대칭 사례에서, 셀에 대해 다음 방정식 세트를 얻는다.In the symmetric case where α i = α j = 0 and β = 0, we obtain the following set of equations for the cell:

9.4 논의9.4 Discussion

위의 유도 결과는 이 방식이 실제로 결합 셀에서 스위치 위치를 변경함으로써 두 자유도 사이에 이극 용량성 결합을 제공함을 보여준다. 또한, 회로 구성요소들 간에 이상적인 대칭성이 있는 경우, 원치 않는 자유도 의 결합해제를 완료한다.The above derivation results show that this method actually changes the switch positions in the combined cell, resulting in two degrees of freedom. and It is shown that the capacitive coupling between the two circuit elements is provided. Also, if there is ideal symmetry between the circuit elements, the unwanted degrees of freedom and Complete the disassociation.

10 하드웨어 연결 전략10 Hardware Connection Strategies

10.1 로컬 10.1 Local 연결 대Connection table 글로벌 연결Global Connection

위에서 논의된 바와 같이, 본 발명의 장치가 가우시안 확률 분포로부터 샘플들을 추출하는 데 사용될 수 있다. 편리하게도 가우시안 분포는 처음 두 모멘트, 즉 평균과 공분산에 의해 완전히 특성화된다. 섹션 3.6에서 설명된 바와 같이, 사후처리에서 각 오실레이터 변수에 대한 상수 오프셋으로서 평균을 통합할 수 있다. 그러나 공분산 행렬은 시스템의 동역학에 통합되어야 하며, 이는 물리적 장치의 커패시턴스 행렬에 의해 표현된다. d개의 변수의 목표 가우시안 확률 분포가 주어지면, d x d 커패시턴스 행렬이 목표 가우시안 확률 분포의 공분산 행렬을 완전히 표현하는 데 사용될 수 있으며, 이 공분산 행렬은 임의의 두 변수 간의 상관관계 정도를 나타낸다. 이 행렬은 대각(diagonal)의 d개 자체 커패시턴스와 비대각(off-diagonal)의 모든 두 오실레이터 간 결합 커패시턴스들(two-oscillator coupling capacitances)로 구성된다. As discussed above, the device of the present invention can be used to extract samples from a Gaussian probability distribution. Conveniently, the Gaussian distribution is completely characterized by its first two moments, i.e., the mean and the covariance. As explained in Section 3.6, one can incorporate the mean as a constant offset for each oscillator variable in postprocessing. However, the covariance matrix must be incorporated into the dynamics of the system, which is represented by the capacitance matrix of the physical device. Given a target Gaussian probability distribution of d variables, a d x d capacitance matrix can be used to completely represent the covariance matrix of the target Gaussian probability distribution, which represents the degree of correlation between any two variables. This matrix consists of the d self-capacitances on the diagonal and the two-oscillator coupling capacitances on the off-diagonal.

결합된 오실레이터들의 시스템들을 구축하는 것은 구현 가능한 연결 정도(degree of connectivity)에 대한 결정을 수반한다. 연결 정도는 시스템 내 오실레이터가 다른 오실레이터와 얼마나 많이 연결되어 있는지를 의미한다. 이전 섹션들에서 결합된 오실레이터 시스템은 전체-대-전체 연결되는 것으로 가정되었다. 이는 주어진 결합 방식에 대해 달성할 수 있는 가장 높은 연결 정도이다: 모든 오실레이터들은 다른 모든 오실레이터들에 연결된다. Building systems of coupled oscillators involves deciding on the degree of connectivity that can be achieved. The degree of connectivity is how much an oscillator in the system is connected to other oscillators. In the previous sections, coupled oscillator systems were assumed to be all-to-all connected. This is the highest degree of connectivity that can be achieved for a given coupling scheme: all oscillators are connected to all other oscillators.

이 결합 방식에서 하드웨어는 오실레이터들 간에 d 2개 정도의 연결을 갖는다(문제의 차원). 이는 더 큰 시스템들에서 공간 병목현상이 될 수 있다. 이 문제는 연결 정도를 줄여 설정된 수의 오실레이터 간에 로컬 결합들만이 존재하도록 함으로써 해결될 수 있다. 연결 정도는 주어진 오실레이터의 최대 연결 수에 의해 정의될 수 있다. 예를 들어, 단순 연결 방식이 오실레이터들이 가장 가까운 두 개의 이웃에만 결합되는 차수 2의 연결 아키텍처이다. In this coupling scheme, the hardware has about d 2 connections between oscillators (the dimension of the problem). This can be a space bottleneck in larger systems. This problem can be solved by reducing the degree of coupling so that only local couplings exist between a set number of oscillators. The degree of coupling can be defined by the maximum number of connections for a given oscillator. For example, a simple coupling scheme is a connection architecture of degree 2, where oscillators are coupled only to their two nearest neighbors.

그러나 전체-대-전체(풀) 미만의 연결성으로, 목표 공분산 행렬과 물리적으로 구현된 커패시턴스 행렬 간의 불일치 문제가 발생한다. 일 예로서, d = 5개 단위를 갖는 시스템을 살펴본다. 이 예를 위한 목표 공분산 행렬은 다음과 같다: However, for less than full-to-full connectivity, there is a mismatch problem between the target covariance matrix and the physically implemented capacitance matrix. As an example, consider a system with d = 5 units. The target covariance matrix for this example is:

전체-대-전체 연결성을 가진 장치를 사용하면 다음과 같은 커패시턴스 행렬을 얻으며Using a device with all-to-all connectivity, we obtain the following capacitance matrix:

이는 목표 공분산 행렬을 완전히 기술한다. 그러나 연결성 k = 2인 장치가 사용될 때, 다음과 같은 커패시턴스 행렬이 얻어지며This fully describes the target covariance matrix. However, when devices with connectivity k = 2 are used, the following capacitance matrix is obtained:

이는 목표 공분산 행렬을 완전히 기술하지 못한다. 연결성에 대한 추가 논의를 위한 유용한 양, 즉, 대각선 거리를 정의한다. 대각선 거리는 행렬 원소와 행렬의 주 대각선 사이의 거리를 측정하며 다음과 같이 정의되며This does not fully describe the target covariance matrix. We define a useful quantity for further discussion of connectivity, namely the diagonal distance. The diagonal distance measures the distance between a matrix element and the main diagonal of the matrix and is defined as follows:

여기서 ij는 각각 행렬 원소의 열 인덱스 및 행 인덱스이다. 위의 최근접 이웃 결합만 있는 예에서, k = 1이다. 이 개념을 임의의 차원과 연결성으로 확장하는 것은 간단하다. Here, i and j are the column and row indices of the matrix elements, respectively. In the example above with only nearest neighbor joins, k = 1. It is straightforward to extend this concept to arbitrary dimensions and connectivity.

하드웨어가 제한된 연결성을 가진다면, 공분산 불일치가 전체 프로세스의 동작에 미치는 영향은 정량화되어야 한다. If the hardware has limited connectivity, the impact of covariance mismatch on the behavior of the overall process must be quantified.

10.2 로컬 연결성을 갖는 하드웨어10.2 Hardware with local connectivity

10.2.1 개요10.2.1 Overview

특정 애플리케이션이 대상이 되면, 해당 공분산 행렬의 특성들은 하드웨어로 직접 모방될 수 있다. 예를 들어, 연결차수가 k인 하드웨어는 밴드형 공분산 행렬을 갖는 특정 클래스들의 애플리케이션들에 맞게 설계될 수 있다. 또한 프로세스의 수용/거부 단계는 목표 공분산 연결성과 하드웨어 연결성 간의 어느 정도의 불일치를 극복할 수 있다. 예를 들어, 목표 공분산 행렬이 완전히 밴드형이 아니지만 행렬 원소가 대각선으로부터의 거리에 따라 기하급수적으로 감소하는 경우 밴드형 k-로컬 하드웨어에서 실행되는 프로세스는 여전히 고품질 샘플들을 추출할 수 있어야 한다. When a specific application is targeted, the properties of the covariance matrix can be directly emulated in hardware. For example, hardware with degree k connectivity can be designed for certain classes of applications that have banded covariance matrices. Also, the accept/reject step of the process can overcome some mismatch between the target covariance connectivity and the hardware connectivity. For example, if the target covariance matrix is not perfectly banded, but the matrix elements decrease exponentially with distance from the diagonal, a process running on banded k -local hardware should still be able to extract high-quality samples.

도 25 및 도 26은 적절한 클래스들의 분포들에 구현될 수 있는 여러 가지 가능한 로컬 연결 하드웨어 아키텍처를 도시한다. 이들 전략을 하드웨어로 구현하면 온-칩 공간과 복잡도 측면에서 큰 절감이 가능해지며, 따라서 더 큰 규모 시스템의 가능성을 열면서도 특정 족의 공분산 행렬로부터 효율적으로 샘플들을 추출한다. Figures 25 and 26 illustrate several possible local connection hardware architectures that could be implemented for distributions of appropriate classes. Implementing these strategies in hardware would provide significant savings in on-chip space and complexity, thus opening up the possibility of larger-scale systems while efficiently extracting samples from a particular family of covariance matrices.

10.2.2 균일 격자10.2.2 Uniform grid

도 25는 균일 격자의 다음의 세 가지 다른 예를 도시한다: 정사각형 격자, 육각형 격자, 킹 그래프. 각 단위 셀의 경우 가장 가까운 이웃들의 수(즉, 직접 연결 수)는 이들 격자에 대해 각각 n = 4, n = 6, 및 n = 8이다. Figure 25 illustrates three different examples of uniform lattices: a square lattice, a hexagonal lattice, and a king graph. For each unit cell, the number of nearest neighbors (i.e., the number of direct connections) is n = 4, n = 6, and n = 8 for these lattices, respectively.

10.2.3 클러스터 그래프10.2.3 Cluster Graph

도 26은 클러스터 그래프의 개념에 기반하여 로컬 연결을 달성하기 위한 대체 방법을 도시한다. 여기서 단위 셀들은 n c 크기의 클러스터들로 그룹화된다. 예를 들어, 정사각형 클러스터의 경우 n c = 4이고 육각형 클러스터의 경우 n c = 6이다. 클러스터 내에는 완전 연결성(full-connectivity)이 존재하며, 이는 각 단위 셀이 클러스터 내의 모든 다른 단위 셀과 연결된다는 것을 의미한다. 서로 다른 클러스터 간에는 도 26에 도시된 바와 같은 희소 연결성만이 존재한다. 정사각형 및 육각형 클러스터들의 경우, 최근접 이웃들의 수는 각각 n = 5 및 n = 7이다. 팔각형이나 기타 모양과 같은 다른 유형의 클러스터들도 고려될 수 있다. Fig. 26 illustrates an alternative method for achieving local connectivity based on the concept of a cluster graph, where unit cells are grouped into clusters of size n c . For example, for a square cluster, n c = 4, and for a hexagonal cluster, n c = 6. There is full connectivity within a cluster, meaning that each unit cell is connected to every other unit cell in the cluster. There is only sparse connectivity between different clusters, as illustrated in Fig. 26 . For square and hexagonal clusters, the number of nearest neighbors is n = 5 and n = 7, respectively. Other types of clusters, such as octagons or other shapes, can also be considered.

클러스터 그래프 연결성은 예컨대 이미지 처리에 적용될 수 있다. 이는 이미지 처리를 위한 공분산 행렬이 종종 블록 순환 구조를 갖기 때문이다. 이 블록 순환 구조의 블록들은 클러스터 그래프 연결성의 클러스터들에 대응할 수 있다. 공분산 행렬의 완전 연결 블록들과 하드웨어 연결성의 완전 연결 클러스터를 대응시킴으로써, 하드웨어 연결성과 공분산 행렬의 구조를(예컨대, 이미지 처리를 위해) 일치시킬 수 있다. Cluster graph connectivity can be applied to, for example, image processing. This is because the covariance matrix for image processing often has a block cyclic structure. The blocks of this block cyclic structure can correspond to clusters of the cluster graph connectivity. By corresponding the fully connected blocks of the covariance matrix to the fully connected clusters of the hardware connectivity, the structure of the hardware connectivity and the covariance matrix can be made to match (e.g., for image processing).

10.3 10.3 준로컬Semi-local 또는 글로벌 연결성을 갖는 하드웨어or hardware with global connectivity

위에서 설명된 로컬 연결성은 최근접 이웃들의 수 n이 차원 D에 의존하지 않는다는 특성을 갖는다. 이제 nD와 함께 증가하는 연결 구조를 고려한다. The local connectivity described above has the property that the number of nearest neighbors n does not depend on the dimension D. Now consider a connectivity structure in which n increases with D.

10.3.1 10.3.1 준로컬Semi-local 연결성Connectivity

한 극단적에서, 하드웨어의 글로벌 연결성은 실제로 달성하기가 어렵다. 다른 극단적에서, 로컬 연결성은 디지털 방식에 비해 아날로그 하드웨어로 달성할 수 있는 속도 향상을 제한할 수 있다. 완전히 글로벌이거나 완전히 로컬이지 않은 중간적 연결성은 매력적인 대안이 될 수 있다. At one extreme, global hardware connectivity is difficult to achieve in practice. At the other extreme, local connectivity can limit the speedup that can be achieved with analog hardware compared to digital. Intermediate connectivity, neither fully global nor fully local, can be an attractive alternative.

이 중간적 연결성을 준로컬이라고 할 수 있으며, 이는 최근접 이웃들의 수 nD의 단조 함수에 따라 증가하지만 연결성이 완전히 글로벌이지는 않는다. This intermediate connectivity can be called semi-local, meaning that the number of nearest neighbors n increases monotonically as a function of D , but the connectivity is not completely global.

도 27은 정사각형 격자로 구성된 단위 셀들 간의 준로컬 연결성을 도시한다. 각 단위 셀은 같은 행의 다른 단위 셀들과 완전히 연결되며, 단위 셀 행들 사이에는 희소 연결들이 있다. 이 방식에서 총 연결 수는 와 같이 점근적으로 증가하며, 이는 D에서 선형도 2차도 아니다. 최근접 이웃들의 수 n에 따라 점근적으로 증가한다. Figure 27 illustrates the quasi-local connectivity between unit cells in a square grid. Each unit cell is fully connected to other unit cells in the same row, and there are sparse connections between rows of unit cells. In this scheme, the total number of connections is increases asymptotically, which is neither linear nor quadratic in D. The number of nearest neighbors, n , is It increases asymptotically.

이 전략은 본질적으로 각 클러스터가 행이고 클러스터 크기가 와 함께 증가하는 클러스터 그래프 연결성(위에서 논의됨)에 해당한다. 더 일반적으로, 클러스터 크기가 D의 어떤 함수에 따라 증가하는(예컨대, 에 비례하여 증거하거나 또는 심지어 D에서 선형적으로 증가하는) 직사각형 또는 정사각형 클러스터들과 같은 클러스터들에 대한 다른 기하구조들을 고려할 수 있다. This strategy essentially means that each cluster is a row and the cluster size is corresponds to the increasing cluster graph connectivity (discussed above). More generally, the cluster size increases as some function of D (e.g., One can also consider other geometries for the clusters, such as rectangular or square clusters (where D increases proportionally or even linearly in D ).

10.3.2 완전 연결성10.3.2 Full Connectivity

마지막으로, 완전 연결성이라고도 하는 글로벌 연결성의 극단적인 경우를 고려한다. 여기서 총 연결 수는 D 2에 따라 점근적으로 증가하고, 최근접 이웃들의 수 nD에 따라 증가한다. Finally, we consider the extreme case of global connectivity, also called full connectivity, where the total number of connections grows asymptotically with D 2 , and the number of nearest neighbors n grows with D .

완전 연결성을 갖는 하드웨어는 임의의 조밀한 공분산 행렬들을 갖는 애플리케이션을 위해 설계될 수 있다. 도 28은 섹션 4의 설명을 따르는 8개의 완전 연결 오실레이터의 하나의 가능한 레이아웃을 도시한다. Hardware with full connectivity can be designed for applications with arbitrarily dense covariance matrices. Figure 28 illustrates one possible layout of eight fully connected oscillators following the description in Section 4.

완전 연결 설계는 가장 뛰어난 표현성(expressibility)을 가지고 디지털 하드웨어에 비해 가장 큰 속도 향상을 허용할 수 있다. 그러나 물리적 공간과 칩 상의 복잡도 측면에서 비용이 높다. Fully connected designs can provide the greatest expressibility and allow the greatest speedup over digital hardware, but at a high cost in terms of physical space and complexity on the chip.

섹션 8.2.2에 설명된 이극 결합을 달성하는 방법은 차수 D차 연결만을 갖는 완전 연결 하드웨어를 효과적으로 구축하는 데 사용될 수 있다. The method of achieving heteropolar coupling described in Section 8.2.2 can be used to effectively build fully connected hardware with only order D connections.

11 하드웨어 장치 결함 처리11 Handling hardware device faults

11.1 열역학적 오류 수정11.1 Correcting thermodynamic errors

열역학적 하드웨어를 사용하여 HMC를 위한 샘플들을 생성하는 것의 장점들 중 하나는 이 접근법의 고유한 오류 복원력이다. 이는 제안된 샘플과 이전 샘플의 에너지 차이에 기반하여 샘플이 수용되거나 거부되는 메트로폴리스-헤이스팅스(Metropolis-Hastings, MH) 단계의 존재 때문이다. 샘플을 제안하는 아날로그 하드웨어와 연계하여 이 단계를 포함하는 것은 열역학적 오류 수정으로서 생각될 수 있다. 수용/거부 단계는 아래에서 논의될 바와 같이 커패시터 부정밀도나 연결 제약과 같은 하드웨어 제약으로 인해 제안된 잘못된 샘플들을 필터링하는 역할을 한다. 그러므로 이러한 자연 발생적인 형태의 오류 수정은 HMC에 대한 열역학적 접근법이 불완전성의 존재에 대해 복원력을 갖도록 할 가능성이 높다. One of the advantages of using thermodynamic hardware to generate samples for HMC is the inherent error resilience of this approach. This is due to the presence of a Metropolis-Hastings (MH) step in which a sample is accepted or rejected based on the energy difference between the proposed sample and the previous sample. Incorporating this step in conjunction with the analog hardware that proposes the sample can be thought of as thermodynamic error correction. The accept/reject step serves to filter out erroneous samples that are proposed due to hardware constraints such as capacitor imprecision or connection constraints, as discussed below. This natural form of error correction is therefore likely to make the thermodynamic approach to HMC resilient to the presence of imperfections.

MH 단계는 본 방법론에서 전형적으로 디지털 하드웨어에서 수행된다. 이는 아날로그 동역학 동안 누적된 어떤 오류들이라도 수정되는 것을 허용한다. 따라서 (MH 단계 동안) 아날로그-디지털 인터페이스의 조합은 오류 수정으로 이어진다. The MH phase is typically performed in digital hardware in this methodology. This allows any errors accumulated during the analog dynamics to be corrected. Therefore, the combination of the analog-digital interface (during the MH phase) leads to error correction.

어떤 의미에서 MH 단계는 아날로그 동역학을 올바른 방향으로 유지하는 역할을 한다. 이것으로, 아날로그 동역학은 장치 불완전성(부정밀도 및 잡음 등)으로 인해 원하는 궤적에서 벗어날 수 있지만, MH 단계는 위치-운동량 좌표들을 원하는 궤적을 향해 되돌리는 역할을 한다. In a sense, the MH step serves to keep the analog dynamics on the right track. In this way, while the analog dynamics may deviate from the desired trajectory due to device imperfections (such as imprecision and noise), the MH step serves to bring the position-momentum coordinates back toward the desired trajectory.

이러한 열역학적 오류 수정에 대한 접근법을 연구할 때의 하나의 고려사항은 제안되는 샘플들의 품질을 반영하는 수용률(성공률 또는 수용 확률이라고도 알려짐)의 동작이다. 다음 하위 섹션은 이 양에 대한 심층적인 조사를 제시하며, 커패시터 부정밀도, 허용오차 및 범위 그리고 장치 연결성 제약조건에 따른 수용률의 동작을 강조한다. One consideration when studying approaches to thermodynamic error correction is the behavior of the acceptance rate (also known as the success rate or acceptance probability) that reflects the quality of the proposed samples. The following subsections present an in-depth examination of this quantity, emphasizing the behavior of the acceptance rate as a function of capacitor imprecision, tolerance and range, and device connectivity constraints.

11.2 커패시터 부정밀도, 허용오차 및 범위 처리11.2 Handling capacitor imprecision, tolerances and ranges

위에서 논의된 바와 같이, 프로세스의 수용/거부 단계는 하드웨어에 대한 오류 수정의 한 형태이다. 물리적 하드웨어에 의해 설명된 분포가 목표 분포로부터 벗어난다면, 이 하드웨어 분포로부터 추출된 샘플들은 거부되고 전반적인 샘플 품질은 손상되지 않을 것이다. 이로 인해 원하는 샘플들을 추출하는 데 걸리는 전체 시간과 하드웨어의 정확도 또는 정밀도 간에 상충 관계가 발생한다. 이 상충 관계는 불완전한 하드웨어를 사용하여 프로세스의 평균 수용률을 계산함으로써 정량화될 수 있다. 이 오류 수정은 하드웨어가 보다 보수적인 수준의 조정성을 사용하여 구성될 수 있으면서도 여전히 유용한 가우시안 분포를 신뢰성 있게 표현할 수 있음을 의미한다. As discussed above, the accept/reject phase of the process is a form of error correction for the hardware. If the distribution described by the physical hardware deviates from the target distribution, samples drawn from this hardware distribution will be rejected, and the overall sample quality will remain intact. This leads to a tradeoff between the overall time taken to extract the desired samples and the accuracy or precision of the hardware. This tradeoff can be quantified by computing the average acceptance ratio of the process using imperfect hardware. This error correction means that the hardware can be configured with a more conservative level of tunability while still reliably representing a useful Gaussian distribution.

그러면 장치는 이 개념을 염두에 두고 설계될 수 있다. 커패시터들 및 인덕터들의 정밀도 비트 수 및 조정 범위는 수용률과 하드웨어 아키텍처의 제약조건을 최적화함으로써 선택될 수 있다. 예를 들어, 도 29는 수치 시뮬레이션에 기반한 커패시터 부정밀도가 수용률에 미치는 영향을 보여준다. 수용률이 약한 부정밀도 함수일 뿐이기 때문에, 하드웨어에서 적은 비트 수(예컨대, 2비트 또는 3비트)에 의해 표현되는 커패시터들을 사용하면서도 양호한 성능을 유지할 수 있다. The device can then be designed with this concept in mind. The number of precision bits and the tuning range of the capacitors and inductors can be chosen by optimizing the acceptance ratio and the constraints of the hardware architecture. For example, Fig. 29 shows the effect of capacitor imprecision on the acceptance ratio based on numerical simulations. Since the acceptance ratio is only a weak imprecision function, it is possible to use capacitors represented by a small number of bits in hardware (e.g., 2 or 3 bits) while maintaining good performance.

설계 단계 동안의 추가적인 고려사항은 부품의 허용오차이다. 이는 부품의 값이 공칭 값에 대해 가능한 편차를 나타낸다. 이들 추가된 편차는 수용/거부 단계에 의해 수정될 수 있으며, 도 30을 참조한다. 그러나 이들 허용오차는 하드웨어를 서비스에 적용하기 전에 하드웨어의 전체 특성 분석에 의해 고려될 수 있다. An additional consideration during the design phase is the tolerance of the component. This represents the possible deviation of the component's value from the nominal value. These added deviations can be corrected by the acceptance/rejection phase, see Figure 30. However, these tolerances can be taken into account by a full characterization of the hardware before putting it into service.

11.3 제한된 연결성 처리11.3 Handling Limited Connectivity

섹션 10.2에서 논의된 로컬 연결과 같은 제한된 연결성의 경우를 고려한다. 장치의 제한된 연결성으로 인해 HMC에 본 발명의 하드웨어를 적용할 때 여러 가지 결과가 초래된다. 특히, 아래에서 논의된 바와 같이, 디지털 방법들에 비해 예상되는 개선은 다변량 가우시안으로부터 샘플들을 생성하는 것과 같은 일부 응용 분야에서 장치의 연결성과 직접 관련되어야 한다. Consider the case of limited connectivity, such as the local connection discussed in Section 10.2. The limited connectivity of the device has several consequences when applying the hardware of the present invention to HMC. In particular, as discussed below, the expected improvement over digital methods should be directly related to the connectivity of the device in some applications, such as generating samples from multivariate Gaussians.

위에서 논의된 바와 같이, 수용/거부 단계의 특성은 수용된 샘플들이 원하는 분포를 나타내는 것을 보장하는 역할을 한다. 고려해야 할 하나의 지표는 수용 확률이며, 이 확률이 현저히 감소하지 않는다는 확신을 갖는 것이다. As discussed above, the nature of the acceptance/rejection step serves to ensure that the accepted samples represent the desired distribution. One metric to consider is the acceptance probability, and we must be confident that this probability does not decrease significantly.

제한된 하드웨어 연결성의 가능한 부정적 영향을 완화하는 또 다른 접근법은 고전적인 전처리에 의해 잠재적으로 완화될 수 있으며, 이는 다변량 가우시안 샘플링을 위한 HMC의 사례에 대해 아래에서 논의된다. Another approach to mitigate the possible negative impact of limited hardware connectivity is to potentially mitigate it by classical preprocessing, which is discussed below for the case of HMC for multivariate Gaussian sampling.

11.3.1 로컬 연결성 제약에 대한 고전적 전처리11.3.1 Classical preprocessing for local connectivity constraints

제한된 연결성에서도 하드웨어로 인한 속도 향상을 높이기 위해, 주어진 밴드폭(bandwidth) 내의 공분산 값의 크기를 증가시키는 방법을 개발할 수 있다. 순열 행렬들을 사용하여 결합된 셀들을 재순서화하고 주어진 밴드폭에 대한 가중치를 극대화하는 대략적으로 최적의 순서를 찾을 수 있다. To increase the hardware-induced speedup even with limited connectivity, one can develop methods to increase the size of the covariance values within a given bandwidth. Using permutation matrices, one can reorder the combined cells and find an approximately optimal order that maximizes the weights for a given bandwidth.

이 순열을 달성하는 한 가지 방법은 공분산 행렬의 절댓값들을 사용하여 가중된 그래프의 라플라시안을 구성하는 것이다. 라플라시안의 두 번째로 작은 고유 벡터는 피들러(Fiedler) 벡터를 정의한다. 이 벡터의 요소들의 순서는 단위 셀들 각각을 라벨 표시하는 대략적인 가장 적합한 순서를 포함한다. One way to achieve this permutation is to construct the Laplacian of the weighted graph using the absolute values of the covariance matrix. The second smallest eigenvector of the Laplacian defines the Fiedler vector. The order of the elements of this vector contains an approximate best-fit order for labeling each of the unit cells.

그러므로 공분산 행렬 값들을 하드웨어에 가장 잘 매핑하기 위해 공분산 행렬로부터 구성된 라플라시안의 두 번째로 작은 고유 벡터를 계산한다. 이 연산의 복잡도는 행렬의 특성에 따라 달라진다. 최악의 경우, 이는 (d 2) 연산들에서 고유값의 오차 까지 계산될 수 있다. 희소한 공분산 행렬들의 경우 이 계산은 더 저렴해야 한다. Therefore, in order to best map the covariance matrix values to the hardware, the second smallest eigenvector of the Laplacian constructed from the covariance matrix is computed. The complexity of this operation depends on the characteristics of the matrix. In the worst case, this is ( d 2 ) Eigenvalue error in operations can be computed up to . For sparse covariance matrices, this computation should be cheaper.

동일한 목적을 달성하기 위한 또 다른 접근법은 조밀 행렬을 희소 형태로 만드는 직접 절단과, 이것에 뒤따르는 희소 행렬을 밴드 형태로 만드는 컷힐-맥키(Cuthill-Mckee) 프로세스를 적용하는 것이다. 직접 절단은 공분산 행렬의 구성 동안 적용될 수 있고 일부 원소들이 일부 컷오프 값보다 작다면 해당 원소들을 0으로 설정하는 것일 수 있다. 그러므로 이는 행렬 자체를 계산하는 동안 완료될 수 있다. 그러면 컷힐-맥키 프로세스는 얼마나 많은 0이 아닌 원소들이 희소 행렬에 남아 있는지, 즉, O(n nz )에 따라 스케일링되며, 이는 O(d 2)보다 작아야 한다. 그러므로 컷힐-맥키가 뒤따르는 단순 절단을 적용하면 O(n nz ) 단계에서 조밀한 공분산 행렬을 밴드 형태로 취할 수 있다. 0이 아닌 원소들의 수는 절단에 따라 달라질 것이며, 이는 사용자에 의해 설정될 파라미터이다. Another approach to achieve the same goal is to apply a direct cut to sparse a dense matrix, followed by the Cuthill-Mckee process to band the sparse matrix. The direct cut can be applied during the construction of the covariance matrix, setting some elements to zero if they are smaller than some cutoff value. Thus this can be done while computing the matrix itself. Then the Cuthill-Mckee process scales with how many non-zero elements remain in the sparse matrix, i.e. O ( n nz ), which should be less than O ( d 2 ). Thus applying a simple cut followed by Cuthill-Mckee can take a dense covariance matrix to band form in O ( n nz ) steps. The number of non-zero elements will depend on the cut, which is a parameter to be set by the user.

원소들이 대각선으로부터의 거리에 따라 기하급수적으로 감소하는 랜덤 공분산 행렬에 대한 다변량 가우시안 샘플링의 특정 예에 대해, 도 31a는 수용 비율(acceptance ratio)이 차원이 증가함에 따라 대략 일정하다는 것을 보여준다. 공분산 행렬이 조밀한 랜덤 행렬인 사례에 대해, 도 31b는 밴드폭 k를 갖는 실제 공분산 행렬의 근사치로부터 샘플들을 생성하려고 시도할 때 차원에 따른 수용 확률의 지수적 감소를 보여준다. 이들 두 가지 예는 다양한 유형의 공분산 행렬들에 적용되는 하드웨어의 다양한 예상 성능을 강조한다. 또한 더 큰 원소들을 대각선에 더 가깝게 만들고 잠재적으로 지수 스케일링을 방지하기 위하여(위에서 설명된 바와 같이) 공분산 행렬을 전처리하는 것의 잠재적 이점을 강조한다. For a specific example of multivariate Gaussian sampling for a random covariance matrix where elements decrease exponentially with distance from the diagonal, Fig. 31a shows that the acceptance ratio is approximately constant with increasing dimensionality. For the case where the covariance matrix is a dense random matrix, Fig. 31b shows the exponential decay of the acceptance probability with dimensionality when attempting to generate samples from an approximation of the actual covariance matrix with bandwidth k . These two examples highlight the different expected performances of hardware applied to different types of covariance matrices. They also highlight the potential benefit of preprocessing the covariance matrix (as described above) to bring larger elements closer to the diagonal and potentially prevent exponential scaling.

12 열역학적 오류 완화 방법12 Thermodynamic Error Mitigation Methods

오류 완화는 열역학 샘플링 장치와 연관된 오류의 영향을 줄일 수 있다. 특히, 이 오류 완화 방법은 아날로그 하드웨어 구성요소들의 부정밀도와 연관된 오류인 부정밀도 오류를 목표로 한다. 이 방법의 약어는 THERMIES(THermodynamic ERror Mitigation via Imprecise Ensemble Sampling)이다. Error mitigation can reduce the impact of errors associated with thermodynamic sampling devices. In particular, this error mitigation method targets imprecision errors, which are errors associated with imprecision of analog hardware components. The acronym for this method is THERMIES (THermodynamic ERror Mitigation via Imprecise Ensemble Sampling).

12.1 12.1 단변량Univariate 프로토콜Protocol

핵심 개념을 설명하기 위해 1차원 사례의 예로 시작한 다음, 더 일반적인 사례를 지원 문서(지원 문서 참조: Error Mitigation for Thermodynamic Sampling Hardware)에서 검토한다. 확률 밀도 함수가 다음과 같은 확률 변수 X를 실현할 수 있는 가우시안 샘플링 장치를 상상한다.We begin with a one-dimensional case to illustrate the core concepts, and then consider a more general case (see the supporting documentation: Error Mitigation for Thermodynamic Sampling Hardware). Imagine a Gaussian sampling device that can realize a random variable X whose probability density function is

즉, 이 장치는 분산이 ε의 배수인 평균-0(mean-zero) 정규 분포 확률 변수를 샘플링할 수 있다. 평균-0 제약조건은 제한적이지 않은데, 왜냐하면 샘플링 후 계산 오버헤드가 거의 없이 편향이 추가될 수 있고 분산의 이산화가 장치를 조정하는 파라미터의 디지털 인코딩의 결과이기 때문이다. That is, the device can sample a mean-zero normally distributed random variable whose variance is a multiple of ε . The mean-zero constraint is not restrictive, because bias can be added after sampling with little computational overhead, and the discretization of the variance is a result of the digital encoding of the parameters that tune the device.

실제로 샘플들은 ε의 배수가 아닌 분산을 갖는 분포로부터 추출될 수 있다. 예를 들어 정규 분포 를 샘플링하고 싶다고 가정한다(여기와 다음에서 는 평균 a와 (공)분산 b를 갖는 정규 분포를 나타낸다). 이 분포는 도 32에 예시되어 있다. In fact, samples can be drawn from distributions with variances that are not multiples of ε , for example, the normal distribution. Suppose we want to sample (here and in the following represents a normal distribution with mean a and (co)variance b ). This distribution is illustrated in Figure 32.

이 분포를 (대략적으로) 샘플 추출하기 위해 써미즈(Thermies) 법의 기초가 되는 다음 절차를 수행한다:To (roughly) sample this distribution, we perform the following procedure, which is the basis of Thermies' law:

그러면 확률 변수 X의 확률 밀도 함수는 다음과 같으며Then, the probability density function of the random variable X is as follows:

여기서 아래 첨자 a는 이 분포가 목표 분포 f t의 근사치임을 나타낸다. 분포 f 1f 2가 모두 평균이 0이므로, f a 도 평균이 0이다. 또한, f a 의 분산은 다음과 같다Here, the subscript a indicates that this distribution is an approximation of the target distribution f t . Since both distributions f 1 and f 2 have zero mean, f a also has zero mean. Furthermore, the variance of f a is

이 예의 경우 f a 분포는 파선으로서 도 32에 선도로 표시되어 있으며, 이는 f 1f 2 중 어느 것보다 목표 분포에 더 잘 부합한다. For this example, the f a distribution is indicated by the dashed line in Figure 32, which fits the target distribution better than either f 1 or f 2 .

대신 의 혼합을 형성하고 이면, f a 의 분산은 다음과 같으며instead Forming a mixture of Then, the variance of f a is as follows:

이는 임의의 를 얻기 위해 wm을 선택할 수 있다는 것을 의미하며, 그래서 를 보장할 수 있으며, 이는 분산 매칭이라고 한다. 를 갖는 근사 분포를 얻는 것은 문제가 있으며, 이 문제는 아래에서 다시 논의된다. This is arbitrary This means that we can choose w and m to obtain , so , which can be guaranteed, and is called distributed matching. Obtaining an approximate distribution with is problematic, and this problem is discussed again below.

단변량의 경우, 실현 가능한 분산을 갖도록 확률 변수를 다시 스케일링(rescaling)함으로써 부정밀도 문제는 회피될 수 있다. 즉, 어떤 m {1, 2, ...}에 대해 가 되도록 하는 새로운 확률 변수 를 정의할 수 있으며, 그래서 오류 완화는 필요하지 않다. 이는 다변량 사례에서 어렵거나 불가능할 수 있으며, 이는 오류 완화 방법이 유용한 이유이고, 이제 써미즈 법의 다변량 일반화를 개발한다.In the univariate case, the imprecision problem can be avoided by rescaling the random variables to have a feasible variance, i.e., some m About {1, 2, ...} A new probability variable that makes it so can be defined, so that error mitigation is not necessary. This can be difficult or impossible in the multivariate case, which is why error mitigation methods are useful, and we now develop a multivariate generalization of the Thermise method.

12.2 부정밀도 종속성12.2 Inaccuracy Dependency

하드웨어 구현의 정밀도에 따라 샘플의 품질이 달라지지 않는 것이 바람직한다. 다행히도 써미즈 프로토콜은 ε가 0으로 갈 때 ε에 대한 근사 분포의 1차 종속성을 제거한다. 도 33은 써미즈 오류 완화 유무에 관계없이 f a f t 사이의 L 1 거리를 도시한다. 오류가 완화된 경우 기울기는 ε = 0에서 사라지지만 오류가 완화되지 않은 경우 기울기는 ε = 0에서 사라지지 않는다. 이 수치적 결과는 써미즈 법(또는 유사한 방법)이 하드웨어 부정밀도에 대한 샘플 품질의 민감도를 줄이거나 없앤다는 증거를 제공한다. It is desirable that the quality of the samples should not vary with the precision of the hardware implementation. Fortunately, the thermise protocol removes the first-order dependence of the approximate distribution on ε as ε goes to 0. Figure 33 shows the L 1 distance between f a and f t with and without thermise error mitigation. For the mitigated case, the slope vanishes at ε = 0, whereas for the unmitigated case, the slope does not vanish at ε = 0. These numerical results provide evidence that the thermise method (or similar methods) reduces or eliminates the sensitivity of the sample quality to hardware imprecision.

13 13 비가우시안Non-Gaussian 분포로의 확장Extension to distribution

13.1 일반 전략13.1 General Strategy

이제까지 가우시안 분포들로부터의 샘플링을 위한 아날로그 하드웨어를 설명하였다. 그러나 관심을 가질 만한 많은 다른 분포들도 많이 있다. 그런고로 이제 비가우시안 분포들로부터의 샘플들을 생성할 수 있는 아날로그 하드웨어를 구성하는 전략들을 고려할 것이다. So far we have described analog hardware for sampling from Gaussian distributions. However, there are many other distributions that may be of interest. Therefore, we will now consider strategies for constructing analog hardware that can generate samples from non-Gaussian distributions.

섹션 2.1에서 소개된 프레임워크는 좌표 {x, p}, 퍼텐셜 에너지 함수 U(x) 및 운동 에너지 함수 K(p)를 갖는 모든 연속 물리계에 적용된다. 가우시안 HMC 샘플러의 경우, 2차 퍼텐셜은 위치 좌표 x의 함수로서 규정될 수 있다. 그러나 다른 퍼텐셜(2차 퍼텐셜을 넘어선 퍼텐셜)이 실현될 수 있고, 이는 가우시안 샘플링을 넘어 확장하는 개념적 기반이다. The framework introduced in Section 2.1 applies to any continuous physical system with coordinates { x , p }, a potential energy function U ( x ), and a kinetic energy function K ( p ). For the Gaussian HMC sampler, the second-order potential can be defined as a function of the position coordinate x . However, other potentials (potentials beyond the second-order potential) can be realized, and this is the conceptual basis for extending beyond Gaussian sampling.

HMC 프로세스의 확률적 동역학은 긴 시간 제한에서 식 (2)에 주어진 볼츠만 분포에 따라 위치와 운동량이 분포됨을 보장하며, 이러한 분포는 퍼텐셜 함수 U(x)의 적절한 정의된 선택에 대해 참이다. 또한, xp에 대한 분포들은 독립적일 것이며, x에 대한 주변 분포는 에 비례한다. 따라서 퍼텐셜 U(x)를 적절하게 선택하면 샘플을 추출할 확률 분포를 설계 구현할 수 있다는 것을 알 수 있다. The stochastic dynamics of the HMC process guarantees that in the long time limit, the positions and momentum are distributed according to the Boltzmann distribution given in equation (2), and this distribution is true for a well-defined choice of the potential function U ( x ). Furthermore, the distributions for x and p will be independent, and the marginal distribution for x will be is proportional to . Therefore, we can see that by appropriately selecting the potential U ( x ), we can design and implement a probability distribution from which to extract samples.

2차 퍼텐셜의 경우, 위치 좌표에 대한 볼츠만 분포는 가우시안 분포이므로, 가우시안~exp (-U(x))에서 위치 x 샘플을 샘플링한다. 위에서 언급된 바와 같이, 이 2차 퍼텐셜은 LC 오실레이터 시스템과 연관된 자연스러운 물리적 퍼텐셜이다. 그러나 LC 오실레이터 회로에 의해 제공되는 기존 2차 퍼텐셜 에너지 함수 U(x)의 모양을 수정할 수 있다면, 비2차 퍼텐셜과 연관된 분포로부터 샘플들을 추출할 수 있다. For the second-order potential, since the Boltzmann distribution over the position coordinates is Gaussian, we sample the position x from Gaussian~exp( -U ( x )). As mentioned above, this second-order potential is a natural physical potential associated with the LC oscillator system. However, if we can modify the shape of the original second-order potential energy function U ( x ) provided by the LC oscillator circuit, we can extract samples from distributions associated with non-second-order potentials.

다음에서는 퍼텐셜 함수의 모양을 수정하는 두 가지 접근법을 제공한다. In the following, we present two approaches to modifying the shape of the potential function.

맥스웰 데몬의 열역학적 개념에 기반한 접근법; 그리고 An approach based on the thermodynamic concepts of Maxwell's Demon; and

LC 오실레이터의 다체 결합에 기반한 접근법. An approach based on multibody coupling of LC oscillators.

13.2 맥스웰 데몬 접근법 개요13.2 Overview of the Maxwell Demon Approach

섹션 14는 맥스웰 데몬의 개념에 기반한 비가우시안 분포로부터 샘플을 추출하는 접근법을 자세히 설명한다. Section 14 details an approach to sampling from non-Gaussian distributions based on the concept of Maxwell's demon.

결합된 LC 오실레이터 시스템을 고려한다 맥스웰 데몬은 조화 오실레이터 시스템에 상태 의존적인 물리적 힘을 가하는 디지털 또는 아날로그 장치이다. 이 힘은 오실레이터의 상태에 따라 달라진다는 의미에서 상태 의존적이며, 예컨대, 이는 각 단위 셀의 커패시터 양단의 전압에 따라 달라질 수 있다. 실제로 이 힘은 물리적으로 각 단위 셀에 인가되는 전압원(또는 전압원 세트)에 대응한다. Consider a coupled LC oscillator system. A Maxwell demon is a digital or analog device that applies a state-dependent physical force to a harmonic oscillator system. This force is state-dependent in the sense that it depends on the state of the oscillator, for example, it may depend on the voltage across the capacitor of each unit cell. In practice, this force corresponds to a voltage source (or set of voltage sources) that is physically applied to each unit cell.

간단히 말해, 맥스웰 데몬 장치에 의한 전압원 출력은 LC 오실레이터 회로의 기존 위치 좌표 x에 대해 새로운 퍼텐셜 에너지 함수 U(x)를 인위적으로 생성한다. 이는 LC 오실레이터 시스템이 새로운 해밀토니안에 따라 진화하는 것을 허용한다. 그 결과 U(x)를 적절하게 선택함으로써 샘플링되는 확률 분포를 프로그래밍하는 것이 가능하다. In simple terms, the voltage source output by the Maxwell demon device artificially generates a new potential energy function U ( x ) for the original position coordinate x of the LC oscillator circuit. This allows the LC oscillator system to evolve according to a new Hamiltonian. As a result, it is possible to program the probability distribution being sampled by appropriately choosing U ( x ).

13.3 13.3 다체Multi-body 결합 접근법 개요Overview of the Combination Approach

섹션 16은 단위 셀의 다체 결합(예컨대, 2체 결합)을 설계 구현하여 비가우시안 분포로부터 샘플들을 추출하는 접근법을 자세히 설명한다. Section 16 details an approach to design and implement multi-body combinations (e.g., two-body combinations) of unit cells to sample from non-Gaussian distributions.

다변량 가우시안 분포는 처음 두 모멘트, 즉 평균 벡터와 공분산 행렬에 의해 기술될 수 있다. 그러므로, 비자명 고차 모멘트들(예컨대, 3차 모멘트들)을 갖는 분포는 비가우시안 분포이다. 그런고로 분포에서 고차 모멘트 생성에 집중하면 가우시안 분포를 이동시키는 것이 가능하다. The multivariate Gaussian distribution can be described by the first two moments, i.e., the mean vector and the covariance matrix. Therefore, a distribution with non-trivial higher-order moments (e.g., third-order moments) is a non-Gaussian distribution. Therefore, it is possible to shift the Gaussian distribution by focusing on generating higher-order moments in the distribution.

HMC 프레임워크 내에서 이는 해밀토니안에서 고차 결합 항을 생성하는 것에 해당한다. 2체 결합은 물리 시스템에서 아주 흔하게 발생하지만, 고차 결합(예컨대, 3차)은 드물다. 그런고로 물리 시스템에서 이들 결합은 신중하게 생성되어야 한다. Within the HMC framework, this corresponds to generating higher-order coupling terms in the Hamiltonian. Two-body couplings are very common in physical systems, but higher-order couplings (e.g., cubic) are rare. Therefore, these couplings must be generated carefully in physical systems.

높은 수준에서, LC 오실레이터 시스템의 설계에서 2체 결합을 달성하는 이유는 단위 셀들을 결합하기 위해 2포트 소자(예컨대, 커패시터)를 사용한다는 것이다. 이는 2포트 소자를 3포트 소자로 대체하여 3체 결합을 달성할 수 있음을 시사한다. At a high level, the reason for achieving two-body coupling in the design of an LC oscillator system is to use two-port elements (e.g. capacitors) to couple the unit cells. This suggests that three-body coupling can be achieved by replacing the two-port elements with three-port elements.

실제로 3포트 소자를 사용하여 3개의 단위 셀을 결합할 수 있다. 예를 들어, 트랜지스터는 소스, 드레인, 및 게이트를 포함하는 세 개의 포트를 갖는다. 이는 해밀토니안에서 진정한(genuine) 3체 결합을 생성하며, 그런고로 샘플링되는 해당 확률 분포에서 3차 모멘트를 생성할 수 있다. 바리캡들(버랙터들이라고도 알려짐)은 이러한 목적에 트랜지스터의 대안을 제공한다. In fact, it is possible to combine three unit cells using a three-port device. For example, a transistor has three ports: a source, a drain, and a gate. This creates a genuine three-body coupling in the Hamiltonian, and thus a third moment in the corresponding probability distribution being sampled. Varicaps (also known as varactors) provide an alternative to transistors for this purpose.

더 일반적으로, 3포트 소자 세트들을 함께 연쇄적으로 연결하여 n-포트 소자를 얻을 수 있는데 여기서 n ≥ 3이다. 이는 단위 셀들 간에 진정한 n체 결합을 생성할 수 있게 하며, 그런고로 해당 확률 분포에서 n차 모멘트들을 생성할 수 있게 한다. 이는 섹션 16에서 자세히 논의된다. More generally, sets of 3-port elements can be cascaded together to obtain n -port elements, where n ≥ 3. This allows generating true n- field couplings between the unit cells, and hence n- th moments in the corresponding probability distribution. This is discussed in detail in Section 16.

13.4 추가 관심 분포13.4 Additional Interest Distribution

13.4.1 13.4.1 단변량Univariate 분포 distribution

여기서 샘플들이 추출될 수 있는 확률 분포(가우시안 분포 제외)의 종류에 대한 몇 가지 수학적 세부사항을 제공한다. Here we provide some mathematical details about the kinds of probability distributions (other than Gaussian distributions) from which samples can be drawn.

먼저, 단순화를 위해 단변량 분포를 고려한다. 주목할 만한 몇 가지 예는 다음을 포함한다: First, for simplicity, we consider univariate distributions. Some notable examples include:

지수 분포; exponential distribution;

감마 분포; gamma distribution;

라플라스 분포; Laplace distribution;

일반화된 정규 분포; 그리고 Generalized normal distribution; and

지수족. The exponential family.

음수 아닌 수에 대해서만, 즉 정의역 에 대해서만 정의되는 두 분포를 고려하며, 다음과 같은 지수 분포부터 시작한다: Only for non-negative numbers, i.e. the domain Consider two distributions that are defined only for , starting with the exponential distribution:

다음으로 지수 분포를 일반화한 감마 분포를 고려한다: Next, we consider the gamma distribution, which is a generalization of the exponential distribution:

여기서 α > 0을 형상 파라미터, β > 0을 속도 파라미터(rate parameter), 그리고 를 감마 함수라고 한다. α = 1로 설정함으로써 감마 분포는 지수 분포로 축소된다. Here, α > 0 is the shape parameter, β > 0 is the rate parameter, and is called the gamma function. By setting α = 1, the gamma distribution is reduced to an exponential distribution.

라플라스 분포는, 감마 분포와 달리, 의 전체인 지지집합을 가진다. 이 분포는 "위치" 파라미터 와 척도 파라미터 σ를 변수로 하여 다음과 같이 주어진다: The Laplace distribution, unlike the gamma distribution, has a support set which is the entire distribution of the "location" parameter and the scale parameter σ is given as follows:

다음으로, 다음의 확률 밀도를 갖는 일반화된 정규 분포를 고려한다: Next, consider a generalized normal distribution with the following probability density:

β = 2를 선택하면 표준 가우시안 분포에 해당한다. 또한, β = 1을 선택하면 라플라스 분포에 해당한다. 그런고로, 식 (74)는 가우시안 분포와 라플라스 분포를 특수한 경우로서 포함한다. If β = 2 is chosen, it corresponds to the standard Gaussian distribution. Also, if β = 1 is chosen, it corresponds to the Laplace distribution. Therefore, equation (74) includes Gaussian distribution and Laplace distribution as special cases.

이들 분포는 지수 분포족의 특수한 경우들이다. 지수 분포족은 다음과 같이 쓸 수 있다: These distributions are special cases of the exponential distribution family. The exponential distribution family can be written as:

예를 들어, 지수 분포의 경우, T(x) = x, η(Θ) = -β, h(x) = 1, 및 A(Θ)= - logβ이다. 마찬가지로 다른 분포들은 식 (75)의 일반 공식으로부터 복원될 수 있다. For example, for the exponential distribution, T ( x ) = x, η (Θ) = -β, h ( x ) = 1, and A( Θ) = -logβ. Similarly, other distributions can be reconstructed from the general formula in equation (75).

13.4.2 다변량 분포13.4.2 Multivariate Distribution

일반적으로, 고차 큐뮬런트가 통계적으로 유의미한 방식으로 분포 모양에 영향을 미치는 다변량 확률 변수를 고려할 수 있다. 예를 들어, 다변량 확률 변수가 비자명 3차 큐뮬런트들을 갖는다면, 확률 분포는 왜곡될 것이다. 고차 큐뮬런트들은 분포의 모양의 다른 특징들을 정의한다. 아래에서 큐뮬런트에 대해 더 자세히 논의한다. In general, we can consider multivariate random variables in which higher-order cumulants affect the shape of the distribution in a statistically significant way. For example, if a multivariate random variable has nontrivial third-order cumulants, the probability distribution will be skewed. Higher-order cumulants define different features of the shape of the distribution. Cumulants are discussed in more detail below.

위에서 논의된 지수족은 다음과 같이 다변량 경우로 확장될 수 있다: The exponential family discussed above can be extended to the multivariate case as follows:

여기서 h(x)는 스케일링 상수이며, s는 자연 파라미터라고 하는 벡터이며, t(x)는 충분 통계량이라고 하고, A(s)는 로그 분배 함수(log partition function)이다. Here, h ( x ) is a scaling constant, s is a vector called the natural parameter, t ( x ) is called the sufficient statistic, and A ( s ) is the log partition function.

13.4.3 분포에 대한 13.4.3 About distribution 큐뮬런트Cumulent 접근법Approach

섹션 2.1은 정규 분포로부터 샘플들을 추출하는 회로에 대해 논의한다. 비가우시안 분포로부터 샘플링을 진행하기 위해 가우시안 분포에서 작은 섭동만큼 떨어진 분포로부터 샘플들을 추출하는 문제를 고려할 수 있다. 이 섭동 전개(perturbative expansion)를 어떤 작은 파라미터에 적용해야 할까?Section 2.1 discusses circuits that sample from a normal distribution. To proceed with sampling from non-Gaussian distributions, we can consider the problem of sampling from a distribution that is a small perturbation away from the Gaussian distribution. To what small parameter should we apply this perturbative expansion?

분포의 큐뮬런트들은 다음과 같이 정의된다.The cumulants of the distribution are defined as follows:

이는 분포의 모멘트들에 밀접한 관련이 있는 것으로 밝혀졌다. 사실, 큐뮬런트들은 정수 계수들을 갖는 모멘트들의 다항 함수들이며, 처음 두 큐뮬런트는 단순히 분포의 평균 및 분산이다. 그러나 정규 분포가 n ≥ 3에 대해 k n = 0이라는 특수한 특성을 가지고 있기 때문에 큐뮬런트들이 분포의 모멘트들보다 더 유용한 것으로 밝혀졌다. 그러므로 섭동 전개 파라미터에 대한 답, 즉 k ≥3을 얻는다.It turns out that this is closely related to the moments of the distribution. In fact, the cumulants are polynomial functions of the moments with integer coefficients, and the first two cumulants are simply the mean and variance of the distribution. However, the cumulants turn out to be more useful than the moments of the distribution, since the normal distribution has the special property that k n = 0 for n ≥ 3. Hence the answer to the question of the perturbation expansion parameter, i.e. k ≥ 3 .

이 전개에 대한 형식체계는 그람-샤를리에 A 급수(Gram-Charlier A series)(에지워스 급수(Edgeworth series)와 밀접하게 관련됨)로 알려져 있으며, 이는 다음과 같이 표현되며: The formalism for this expansion is known as the Gram-Charlier A series (closely related to the Edgeworth series), which is expressed as:

여기서 μ 및 σ 2는 각각 p(x)의 평균 및 분산이고, D는 미분 연산자이다. 단순화를 위해 μ = 0 및 σ = 1이라고 가정한다. 그런 다음 지수를 전개하고 유사한 항들을 수집한다. 더욱이 정규 분포의 도함수가 정규 분포에 에르미트(Hermite) 다항식 Hen을 곱한 것과 같다는 사실을 이용하여 다음을 구하며: Here μ and σ 2 are the mean and variance of p ( x ), respectively, and D is the differentiation operator. For simplicity, we assume μ = 0 and σ = 1. Then we expand the exponent and collect similar terms. Furthermore, we use the fact that the derivative of the normal distribution is equal to the normal distribution times the Hermite polynomial He n , and we obtain:

여기서 B n은 벨(Bell) 다항식이고 Hen은 에르미트 다항식이다. 이제 덧셈 상수를 생략하면 로그 확률은 다음과 같다.Here, B n is a Bell polynomial and He n is a Hermitian polynomial. Now, if we omit the addition constant, the log probability is as follows.

이것이 무슨 뜻인지 이해하기 위해 처음 두 개의 수정 항만 포함시켜 둔다. To understand what this means, let's include only the first two amendments.

여기서 처음 두 개의 수정 항만 유지하는 것은 모든 x에 대해 유효할 수 없는데, 로그 내부의 표현식이 음수가 되는 것이 가능하기 때문이다. 그러나 k 3k 4가 어쨌든 작다고 가정하고 있고, 그래서 이 x는 이 이상현상(pathology)을 무시할 수 있을 만큼 충분히 멀리 떨어져 있다. 완전히 엄격한 전개를 위해, 에지워스 급수를 고려할 수 있다. 그러나 다음과 같이 log(1 + x) x 전개를 행함으로써 진행하며: Here, maintaining only the first two modification terms cannot be valid for all x , since it is possible for the expression inside the log to be negative. However, we assume that k 3 and k 4 are small anyway, so these x are far enough away that we can ignore this pathology. For a completely rigorous expansion, we can consider the Edgeworth series. However, as follows, log(1 + x ) Proceed by performing x expansion:

그래서 고차 다항식을 해밀토니안에 추가하는 기능을 통해 비가우시안로부터 샘플들을 추출할 수 있다는 것을 알 수 있다. 이는 log(1 + x) 전개(및 급수 전개의 절단)가 무효화되는 영역들을 피해야 한다는 주의사항을 수반한다. 그러나 실제로 k 3k 4가 작다면, 2차 힘 x 2은 문제 있는 영역들에 접근하지 못할 만큼 충분한 퍼텐셜 장벽을 형성해야 한다. So we see that the ability to add higher-order polynomials to the Hamiltonian allows us to sample from non-Gaussian regions. This comes with the caveat that we must avoid regions where the log(1 + x ) expansion (and the truncation of the series expansion) is invalid. However, in practice, if k 3 and k 4 are small, the quadratic force x 2 should form a large enough potential barrier to keep the problematic regions out.

14 14 비가우시안Non-Gaussian 분포 샘플링에 대한 맥스웰 데몬 접근법Maxwell's Demon Approach to Distribution Sampling

14.1 맥스웰 데몬 소개14.1 Introducing the Maxwell Daemon

비가우시안 분포로부터 샘플들을 추출하는 것을 시스템의 퍼텐셜 에너지 함수를 변경하는 것을 수반한다. 이를 위해 맥스웰 데몬이라는 개념을 소개한다. 도 34는 맥스웰 데몬의 기본 개념을 예시한다. 역사적으로, 제임스 클러크 맥스웰은 지적인 관찰자가 두 개의 방이 있는 상자 안의 기체 입자들을 관찰하고 빠르게 움직이는 입자들에 대해서만 선택적으로 문을 열어 시간 경과에 따라 빠른 입자와 느린 입자를 분리하는 실험을 고려했다. 이는 시간 경과에 따라 기체 시스템의 엔트로피를 감소시키지만, 엔트로피는 다른 곳에서 생성되므로 열역학 제2 법칙을 위반하지 않는다. 지적인 관찰자는 맥스웰 데몬이라고 불린다. Sampling from a non-Gaussian distribution involves changing the potential energy function of the system. For this purpose, we introduce the concept of Maxwell's Demon. Figure 34 illustrates the basic concept of Maxwell's Demon. Historically, James Clerk Maxwell considered an experiment in which an intelligent observer observes gas particles in a two-chambered box and selectively opens a door only for the fast-moving particles, thereby separating the fast and slow particles over time. This decreases the entropy of the gas system over time, but does not violate the second law of thermodynamics because entropy is created elsewhere. The intelligent observer is called Maxwell's Demon.

아래에서 자세히 설명하겠지만, 맥스웰 데몬은 HMC 하드웨어가 가우시안 분포를 넘어설 수 있도록 허용한다. 아래에서 논의되는 바와 같이, 맥스웰 데몬(MD)을 물리적으로 구성하는 방법에는 디지털 및 아날로그 방식을 포함하여 다양한 방법이 있다. As will be discussed in detail below, the Maxwell Daemon allows HMC hardware to go beyond Gaussian distributions. As discussed below, there are a variety of ways to physically construct a Maxwell Daemon (MD), including digital and analog approaches.

14.2 HMC 맥락에서의 맥스웰 데몬14.2 Maxwell Demon in the HMC Context

14.2.1 14.2.1 퍼텐셜Potential 에너지 지형 변경Changing the energy landscape

다양한 분포에 대해 HMC 샘플링을 수행하는 것은 회로 해밀토니안 에서 퍼텐셜 에너지 U(x) 함수의 형태를 변경하는 것을 수반한다. 이는 도 35에 예시되어 있다. Performing HMC sampling for various distributions is done by It involves changing the form of the potential energy U ( x ) function in , which is illustrated in Fig. 35.

가우시안 샘플링에서 이 퍼텐셜 에너지 함수 U(x)는 도 35의 왼쪽 패널에 도시된 바와 같이 공분산 행렬 ∑로 표현되는 2차 형태이다. 결합된 LC 오실레이터 시스템(위에서 설명됨)은 이러한 종류의 2차 퍼텐셜이 갖추어져 있어 가우시안 분포 P(x)로부터 샘플들을 추출하는 것을 허용한다. In Gaussian sampling, this potential energy function U ( x ) is of quadratic form, represented by the covariance matrix ∑ , as shown in the left panel of Fig. 35. The coupled LC oscillator system (described above) is equipped with this kind of quadratic potential, allowing it to draw samples from a Gaussian distribution P ( x ).

기존 LC 오실레이터 프레임워크에 맥스웰 데몬 장치를 도입하면 회로 변수들 x에 대한 퍼텐셜 에너지 지형을 변경하여 해밀토니안 회로를 수정한다. "이상적인" 맥스웰 데몬은 적절하게 매끄러운 퍼텐셜 에너지 함수 U(x)에 따라 기존 HMC 셀에 힘을 가할 수 있다. LC 단위 셀들의 동적 상태 x는 맥스웰 데몬에 전달되며, 이는 를 효과적으로 계산하고 계산결과를 힘으로서 다시 LC 셀에 전달한다. 이는 HMC로 샘플링되는 확률 분포 P(x)를 조정하는 것을 허용한다. 확률 분포는 다음과 같이 정규화까지 퍼텐셜 에너지의 지수함수이다: Introducing a Maxwell demon device into the conventional LC oscillator framework modifies the Hamiltonian circuit by changing the potential energy landscape with respect to the circuit variables x . An "ideal" Maxwell demon can force the conventional HMC cell according to a suitably smooth potential energy function U ( x ). The dynamical state x of the LC unit cells is fed to the Maxwell demon, which efficiently computes and transmits the result back to the LC cell as a force. This allows adjusting the probability distribution P ( x ) sampled by the HMC. The probability distribution is an exponential function of the potential energy up to normalization as follows:

14.2.2 전압 제어 14.2.2 Voltage Control 전압원으로서의As a voltage source MDMD

도 36은 맥스웰 데몬 장치를 전압 제어 전압원(VCVS)로서 볼 수 있음을 도시한다. 이 경우 도면은 단일 단위 셀에 대해 도시되지만 개념은 여러 단위 셀로 일반화될 수 있다. Figure 36 illustrates that the Maxwell Demon device can be viewed as a voltage-controlled voltage source (VCVS). In this case, the drawing is shown for a single unit cell, but the concept can be generalized to multiple unit cells.

도시된 바와 같이, i번째 단위 셀의 커패시터 양단의 전압 x i 는 디지털 또는 아날로그 장치일 수 있는 맥스웰 데몬(MD) 장치에 피드된다. MD 장치는 어떤 함수 f를 입력에 적용하여 이 입력을 처리한다. 출력 f(x i )는 전압원에 다시 전송되며, 이는 원래 단위 셀 내부의 전압으로서 적용된다. 그런고로 MD 장치는 VCVS로서 역할을 하는데, 전압 출력이 커패시터 양단의 전압에 의해 제어되기 때문이다. As shown, the voltage x i across the capacitor of the i -th unit cell is fed to a Maxwell Demon (MD) device, which can be either a digital or analog device. The MD device processes this input by applying some function f to the input. The output f ( x i ) is fed back to the voltage source, which is applied as the voltage inside the original unit cell. Therefore, the MD device acts as a VCVS, since the voltage output is controlled by the voltage across the capacitor.

14.2.3 하나의 단위 셀에 대한 수정된 14.2.3 Modified for one unit cell 퍼텐셜Potential

MD 장치가 퍼텐셜 에너지 함수를 수정하는 방법에 대한 수학적 분석은 도 36에 도시된 단일 단위 셀의 경우를 고려하는 것으로 시작한다. The mathematical analysis of how the MD device modifies the potential energy function begins by considering the case of a single unit cell, as illustrated in Fig. 36.

MD 장치는 단위 셀로부터 어떠한 전류도 끌어오지 않다고 가정한다. 이 가정을 하면 분석이 간소화되지만, 이 가정은 약간 더 복잡한 유도를 통해 완화될 수 있다.The MD device is assumed to draw no current from the unit cell. This assumption simplifies the analysis, but can be relaxed through a slightly more complex derivation.

이 가정 하에 도 36의 회로에 키르히호프의 전압 법칙을 적용하여 다음 방정식을 얻을 수 있다: Under this assumption, Kirchhoff's voltage law can be applied to the circuit of Fig. 36 to obtain the following equation:

여기서, 는 회로를 통과하는 전류, 는 커패시터 양단의 전압, 는 맥스웰 데몬 장치의 출력 전압이다. Here, is the current passing through the circuit, is the voltage across the capacitor, is the output voltage of the Maxwell Demon device.

이 방정식을 뉴턴 물리학의 표기법으로 다시 쓸 수 있다. 즉, x i = V i 를 위치로 설정하며, p i = I i (m i /C i )를 질량이 m i 인 운동량으로 설정하고, 힘을 f i (x i )로 쓴다. 이는 다음 방정식이 나오게 한다: This equation can be rewritten in Newtonian notation. That is, let x i = V i be the position, let p i = I i ( m i / C i ) be the momentum of mass m i , and let f i ( x i ) be the force. This gives the following equation:

그런 다음 힘의 부정적분을 취함으로써 다음과 같은 퍼텐셜 에너지 함수를 얻을 수 있다: Then, by taking the indefinite integral of the force, we obtain the following potential energy function:

이 방정식으로부터 원하는 퍼텐셜 에너지 함수 U(x i )를 얻을 수 있는데, 왜냐하면 에 대한 함수를 자유롭게 선택할 수 있기 때문이다. 구체적으로, 를 선택할 수 있으며 여기서 h i (x i )는 임의의 함수이다. 그러면 다음에 도달한다: From this equation we can obtain the desired potential energy function U ( x i ), because Because we can freely choose the function for . Specifically, We can choose , where h i (x i ) is any function. Then we arrive at:

따라서 맥스웰 데몬 장치의 출력 를 적절히 선택함으로써 퍼텐셜 에너지 함수를 본질적으로 원하는 함수로 설계 구현할 수 있다. So the output of the Maxwell Demon device By appropriately selecting the potential energy function, the potential energy function can be designed and implemented as a desired function.

14.2.4 여러 결합해제된 단위 셀에 대한 수정된 14.2.4 Modified for multiple uncoupled unit cells 퍼텐셜Potential

위의 분석을 여러 단위 셀로 확장하는 것은 두 단계로 행해질 수 있다. 먼저, 단위 셀들 간의 용량성 결합이 무시되는 경우를 고려하고, 그런 다음 하위섹션에서 이 결합을 포함시킬 것이다. Extending the above analysis to multiple unit cells can be done in two steps. First, we consider the case where capacitive coupling between unit cells is neglected, and then we include this coupling in a subsequent subsection.

여러 단위 셀을 사용하면, MD 장치가 전체 상태 벡터 x= {x 1, x 2, ..., x d }를 입력으로서 받는다고 상상할 수 있다. 그런 다음 전압 벡터 g(x)를 출력한다. g는 전체 상태 벡터 x에 작용할 수 있고, 그래서 (직접적인 용량 결합이 없는 경우에도) 단위 셀들을 효과적으로 결합할 수 있다. With multiple unit cells, one can imagine that the MD device takes as input the full state vector x = { x 1 , x 2 , ..., x d }. It then outputs a voltage vector g(x) . g can act on the full state vector x , and thus effectively couples the unit cells (even in the absence of direct capacitive coupling).

이 경우, 각 단위 셀의 진화에 대해 위에서 설명한 것들과 유사한 다음과 같은 방정식들을 얻는다: In this case, we obtain the following equations, similar to those described above for the evolution of each unit cell:

전체 힘을 다음과 같이 벡터로서 쓸 수 있으며: The total force can be written as a vector as:

여기서 는 원소 를 갖는 대각 행렬이다. 그런 다음 x에 대한 f(x)의(성분별) 부정적분으로서 퍼텐셜 에너지를 계산할 수 있다. 그러면 퍼텐셜 에너지는 다음에 의해 주어진다: Here is an element is a diagonal matrix with . Then, we can compute the potential energy as the (component-wise) indefinite integral of f(x) with respect to x . Then, the potential energy is given by:

그런고로, g(x)를 적절하게 선택함으로써, 본질적으로 원하는 퍼텐셜 에너지 함수 U(x)를 셋업할 수 있다. Therefore, by appropriately choosing g ( x ), we can essentially set up the desired potential energy function U ( x ).

예를 들어, g(x) = x - F -1 h(x)를 선택할 수 있다. 이는 다음에 의해 주어지는 퍼텐셜 에너지로 이어지고: For example, we can choose g ( x ) = x - F -1 h ( x ). This leads to the potential energy given by:

그래서 h(x)를 적절하게 선택하면 U(x) 함수를 설계 구현하는 것을 허용한다. 결국, 방정식 P(x) = exp(-U(x))로부터, 이는 샘플들이 추출되는 확률 분포를 설계 구현할 수 있음을 의미한다. So, a proper choice of h ( x ) allows us to design and implement the function U ( x ). After all, from the equation P ( x ) = exp(- U ( x )), this means that we can design and implement the probability distribution from which the samples are drawn.

14.2.5 여러 14.2.5 several 결합된Combined 단위 셀에 대한 수정된 Modified for unit cell 퍼텐셜Potential

여러 결합된 단위 셀의 경우, 분석은 더 복잡하다. 그럼에도 불구하고 개념적 수준에서 결합해제된 경우와 큰 차이는 없다. 결합해제된 경우에 대해 위에서 주어진 도출은 결합된 경우가 어떻게 동작하는지에 대한 필수적인 직관을 제공한다. 그런고로 단순화를 위해, 결합된 경우에서 퍼텐셜이 어떻게 수정되는지에 대한 유도는 생략한다. For multiple coupled unit cells, the analysis is more complicated. Nevertheless, at the conceptual level, there is not much difference from the uncoupled case. The derivation given above for the uncoupled case provides essential intuition about how the coupled case works. Therefore, for simplicity, the derivation of how the potential is modified in the coupled case is omitted.

14.3 디지털 맥스웰 데몬14.3 Digital Maxwell Demon

도 37은 디지털 맥스웰 데몬 장치가 아날로그 LC 오실레이터 시스템과 어떻게 상호 작용하는지를 예시한다. 이는 MD 장치를 전압 제어 전압원으로 보는 도 36에 도시된 패러다임에 부합한다. Figure 37 illustrates how a digital Maxwell Demon device interacts with an analog LC oscillator system. This fits into the paradigm illustrated in Figure 36, which views the MD device as a voltage-controlled voltage source.

디지털 MD 장치는 CPU 또는 FPGA 상에 저장되고 처리될 수 있다. ADC와 DAC는 아날로그 신호와 디지털 신호를 상호변환하기 위해 채용된다. 구체적으로, 단위 셀들에서 커패시터 양단의 전압들(x로 표시됨)은 디지털 신호로 변환되어 디지털 MD 장치에 피드될 수 있다. 그런 다음 디지털 MD 장치는 디지털 신호를 출력하며, 이 신호는 그러면 아날로그 전압 벡터 g(x)로 변환되고, 이 벡터의 성분들은 적절한 단위 셀들에서의 전압원들로서 적용된다. The digital MD device can be stored and processed on the CPU or FPGA. ADC and DAC are employed to convert analog signals and digital signals to each other. Specifically, the voltages across the capacitors (denoted as x ) in the unit cells can be converted into digital signals and fed to the digital MD device. The digital MD device then outputs a digital signal, which is then converted into an analog voltage vector g ( x ), and the components of this vector are applied as voltage sources in the appropriate unit cells.

MD 장치에 대한 디지털 접근법의 주요 이점은 유연성과 프로그래밍 가능성이다. 디지털 장치는 출력에 대해 본질적으로 어떠한 함수g(x)라도 선택하는 유연성을 제공한다. 이러한 의미에서 MD 장치에 대한 디지털 접근법은 프로그래밍 가능하고 유연하여, 광범위한 확률 분포들 P(x)로부터 샘플들을 추출하는 것을 허용한다. The main advantage of the digital approach to MD devices is their flexibility and programmability. Digital devices provide the flexibility to choose essentially any function g ( x ) for the output. In this sense, the digital approach to MD devices is programmable and flexible, allowing for sampling from a wide range of probability distributions P ( x ).

MD 장치에 대한 디지털 접근법의 주요 단점은 아날로그 하드웨어에서 얻을 수 있는 잠재적인 속도 향상을 충분히 활용하지 못한다는 것이다. 디지털 장치는 복잡한 퍼텐셜 에너지 함수의 경우 까다로울 수 있는 퍼텐셜 에너지 함수의 기울기를 계산할 수 있다. 그 반면, MD 장치에 대한 아날로그 접근법으로는 퍼텐셜 에너지 함수의 기울기가 물리적인 힘에 해당하며, 이 물리적인 힘은 어떠한 계산을 수반하지 않고서도 LC 오실레이터 시스템에 자연스럽게 가해진다. (이는 아래에서 더 자세히 논의된다.) 그런고로 아날로그 MD 장치를 사용하면 계산 속도 향상에 대한 가능성이 있다. A major drawback of the digital approach to MD devices is that it does not fully exploit the potential speedup that can be achieved with analog hardware. Digital devices can compute the slope of the potential energy function, which can be difficult for complex potential energy functions. In contrast, in the analog approach to MD devices, the slope of the potential energy function corresponds to a physical force, which is applied naturally to the LC oscillator system without any computational effort (this is discussed in more detail below). Therefore, there is a potential for computational speedup using analog MD devices.

14.4 아날로그 맥스웰 14.4 Analog Maxwell 데몬의Demon's 동기Motivation

맥스웰 데몬(MD) 장치는 아날로그 방식으로 구성된다면 계산을 상당히 가속화할 기회를 제공한다. 이는 아날로그 MD 장치가 힘을 계산하기 위한 계산을 수행하지 않고도 LC 오실레이터 시스템에 힘을 가할 수 있기 때문이다. 이는 퍼텐셜 에너지 함수로부터 힘을 계산하는 디지털 MD 장치와는 대조적이다. 이 계산은 일반적으로 비용이 많이 들고, 선형 또는 2차 스케일링과 같이 문제의 차원에 따라 비자명한 스케일링이 발생할 수 있다. 그런고로 퍼텐셜 에너지 함수의 기울기를 계산할 필요가 없다는 것은 아날로그 MD 접근법의 장점이다. The Maxwell Demon (MD) device, if implemented in an analog fashion, offers the opportunity to significantly accelerate the computation. This is because the analog MD device can apply forces to the LC oscillator system without performing any computations to compute the forces. This is in contrast to digital MD devices, which compute forces from the potential energy function. This computation is usually expensive and can lead to non-trivial scaling, such as linear or quadratic scaling, depending on the dimensionality of the problem. Therefore, the advantage of the analog MD approach is that there is no need to compute the gradient of the potential energy function.

14.5 아날로그 맥스웰 14.5 Analog Maxwell 데몬에To the demon 대한 About Korea 비상관Emergency 접근법Approach

14.5.1 개요14.5.1 Overview

다음으로, 아래의 섹션 14.6에서 기본 단위 셀들을 상관시키는 대안적인 접근법을 소개하기에 앞서 기본 단위 셀들을 상관시키지 않는 MD 장치를 구성하는 접근법을 고려한다. 위에서 논의된 HMC 하드웨어의 각 LC 오실레이터는 기본 단위 셀이라고 한다. 다음에서는 보조 단위 셀이라는 추가 회로를 소개한다. Next, we consider an approach to constructing an MD device that does not correlate the elementary unit cells, before introducing an alternative approach that correlates the elementary unit cells in Section 14.6 below. Each LC oscillator in the HMC hardware discussed above is called a elementary unit cell. In the following, we introduce additional circuitry called auxiliary unit cells.

아날로그 맥스웰 데몬을 구성하기 위한 비상관 전략은 여러 개의 구성 블록을 포함하며 이들 블록은 도 38에 도시되고 다음과 같이 설명된다: The uncorrelated strategy for constructing an analog Maxwell daemon involves several building blocks, which are illustrated in Figure 38 and described as follows:

1. 기본 단위 셀 커패시터의 전압 측정, 이는 전압원으로서 적용되어 보조 단위 셀을 통해 전류를 공급한다. 1. Voltage measurement of the basic unit cell capacitor, which is applied as a voltage source to supply current through the auxiliary unit cell.

2. 보조 단위 셀에서 복잡한 I-V 관계를 허용하는 비선형 회로 소자. 2. Nonlinear circuit elements that allow complex I-V relationships in auxiliary unit cells.

3. 보조 단위 셀의 저항기 양단의 전압 측정(이 셀의 전류를 판독하기 위함), 이는 부호가 반전된 다음 기본 단위 셀의 전압원으로서 적용된다. 3. Measure the voltage across the resistor of the auxiliary unit cell (to read the current in this cell), which is then inverted and applied as a voltage source to the primary unit cell.

도 38은 단일 단위 셀에 있는 이들 부품을 예시한다. 실제로 동일한 5개의 구조는 d개의 단위 셀에 대해 d번 복사될 수 있으며, 어쩌면 각 복사마다 서로 다른 하이퍼파라미터(예컨대, 서로 다른 비선형 소자)를 가질 수 있다. Figure 38 illustrates these components in a single unit cell. In reality, the same five structures can be replicated d times for d unit cells, possibly with different hyperparameters (e.g., different nonlinear elements) for each copy.

보조 단위 셀에 의해 출력된 전압은 기본 단위 셀에 인가되기 전에 부호가 반전된다. 이는 시스템이 안정성을 유지하기 위하여(양의 피드백 대신) 음의 피드백을 가져야 하기 때문이다. 음의 피드백은 복원력을 제공하는데, 이는 물리학에서 스프링이 질량을 평형점을 향해 거꾸로 당기는 것과 유사하다. 요약하자면, 전압 반전은 시스템의 안정성을 유지하는 데 도움이 된다. The voltage output by the auxiliary unit cell is reversed before being applied to the primary unit cell. This is because the system must have negative feedback (instead of positive feedback) to maintain stability. Negative feedback provides a restoring force, similar to how a spring in physics pulls a mass back toward its equilibrium point. In short, the voltage reversal helps maintain the stability of the system.

그러나 도 39는 보조 단위 셀에서의 저항기를 접지 해제함으로써 전압 반전이 방지될 수 있음을 보여준다. 이는 도 39에 도시된 바와 같이 이 저항기 양단의 전압 차이를 전달하는 전선을 물리적으로 반전(또는 교환)하는 것을 허용한다. However, Fig. 39 shows that voltage reversal can be prevented by disconnecting the resistor in the auxiliary unit cell from ground. This allows physically reversing (or swapping) the wires that carry the voltage difference across this resistor as shown in Fig. 39.

유연성을 높이기 위해 회로에 삽입될 수 있는 여러 가지 추가 소자들이 있다. 이들 선택적인 추가 소자는 다음을 포함한다: There are a number of additional components that can be inserted into the circuit to increase flexibility. These optional additional components include:

두 단위 셀 사이의 결합에 삽입된 조정가능 이득을 가진 증폭기. 예를 들어, 증폭기는 기본 단위 셀의 커패시터에서 판독한 전압을 증폭하여 보조 단위 셀에 인가되는 전압원을 승압할 수 있다. 대안적으로, 증폭기는 보조 단위 셀의 저항기에서 판독한 전압을 증폭하여 기본 단위 셀에 인가되는 전압원을 승압할 수 있다. An amplifier with adjustable gain inserted into the coupling between the two unit cells. For example, the amplifier can amplify the voltage read from the capacitor of the primary unit cell to boost the voltage source applied to the auxiliary unit cell. Alternatively, the amplifier can amplify the voltage read from the resistor of the auxiliary unit cell to boost the voltage source applied to the primary unit cell.

기본 단위 셀에 삽입된 추가 전압원, 이는 일정하지만(상태 변수와 무관함) 조정 가능할 것이다. 이는 맥스웰 데몬에 의해 출력된 전압에 일정한 오프셋을 제공함으로써 유연성을 높이고, 기본 단위 셀에 가해지는 힘에 일정한 오프셋을 발생시킨다. An additional voltage source inserted into the basic unit cell, which will be constant (independent of the state variables) but adjustable. This provides flexibility by providing a constant offset to the voltage output by the Maxwell Demon, and a constant offset to the force applied to the basic unit cell.

14.5.2 보조 단위 셀14.5.2 Auxiliary Unit Cells

도 38 및 도 39에 도시된 바와 같이, 보조 단위 셀의 기본 부품들은 전압원(기본 단위 셀에서 제공), 비선형 소자, 저항기이다. As illustrated in FIGS. 38 and 39, the basic components of the auxiliary unit cell are a voltage source (provided from the basic unit cell), a nonlinear element, and a resistor.

한 가지 전략은 비선형 소자(NLE)의 I-V 특성을 함수 생성기로서 사용하는 것이다. 입력 V i 와 출력 사이의 복잡한 함수 관계를 생성하려고 하는데, 이는 예를 들어 식 (81)에 대한 논의에서 언급된 바와 같다. NLE의 I-V 특성은 이 복잡한 함수 관계를 설계 구현하는 한 가지 방법을 제공한다. 따라서 원하는 함수 를 생성하는 문제는 NLE에 대한 원하는 I-V 특성을 설계 구현하는 문제로 변환된다. One strategy is to use the IV characteristics of a nonlinear element (NLE) as a function generator. The input V i and the output We want to generate a complex functional relationship between, for example, as mentioned in the discussion of equation (81). The IV property of NLE provides one way to design and implement this complex functional relationship. Thus, the desired function The problem of generating is transformed into the problem of designing and implementing the desired IV characteristics for an NLE.

다음에서는 개별 회로 소자들에 기반하여 또는 여러 소자 조합에 기반하여 NLE를 구성하는 명시적 전략을 논의한다. In the following, we discuss explicit strategies for constructing NLEs based on individual circuit elements or on combinations of elements.

14.5.3 14.5.3 단봉Single peak 분포를 위한 비선형 소자Nonlinear elements for distribution

비선형 소자(NLE)는 단봉 분포(unimodal distribution)로부터 샘플들을 추출하는 데 사용할 수 있다. 단조 I-V 특성을 갖는 NLE는 수학적으로 단봉 확률 분포를 생성한다. 그래서 여기서는 단조 I-V 특성을 갖는 NLE에 대해서만 살펴본다. Nonlinear elements (NLEs) can be used to extract samples from a unimodal distribution. An NLE with a unimodal I-V characteristic mathematically generates a unimodal probability distribution. Therefore, we will only consider NLEs with a unimodal I-V characteristic here.

i번째 기본 단위 셀로부터의 전압의 함수로서 i번째 NLE를 통과하는 전류에 대해 I i (V i )라고 적어 둔다. 맥스웰 데몬의 출력은 로 표시되며, 이는 단순화를 위해 i번째 기본 단위 셀에 작용하는 힘 f i (V i )와 같게 설정할 수 있다. 이 가정은 V i 에 비해 크다고 가정함으로써 정당화될 수 있는데, 이는 식 (82)에 나와 있다(여기서 x iV i 대신 사용되었다). 결과적인 퍼텐셜 에너지 U i (V i )는 그러면 힘 f i (V i )의 적분에 음수를 취한 것이고, 그러면 연관된 로컬 확률 분포 P i (V i )는 퍼텐셜 에너지의 지수에 음수를 취한 것이다. 표기법을 단순화하기 위해 전류, 힘, 퍼텐셜 에너지 및 확률 분포를 각각 I(x), f(x), U(x), 및 P(x)로서 쓸 수 있다. Let I i ( V i ) be the current through the ith NLE as a function of the voltage from the ith elementary unit cell. The output of Maxwell's demon is , which can be set equal to the force f i ( V i ) acting on the i-th basic unit cell for simplicity. This assumption is This can be justified by assuming that is large compared to V i , as shown in equation (82) (where x i is used instead of V i ). The resulting potential energy U i ( V i ) is then the negative integral of the force f i ( V i ), and the associated local probability distribution P i ( V i ) is then the negative exponent of the potential energy. To simplify notation, the current, force, potential energy, and probability distribution can be written as I ( x ), f ( x ), U ( x ), and P ( x ), respectively.

도 40은 NLE가 순방향 바이어스 다이오드인 특수한 경우에 대한 이들 네 가지 함수의 개략도를 도시한다. 다이오드는 순방향 바이어스 전압에 따라 전류가 기하급수적으로 증가하면서 대략 한 방향으로 전류를 전달하는 비선형 소자이다. 그러나 반대 방향으로 전류 흐름을 허용하는 항복 전압이 있다. 이는 도 40의 첫 번째 패널에서 도시된 바와 같이 다소 비대칭적인 I-V 특성을 발생시킨다. 두 번째 패널은 힘 f(x)를 보여주며, 이는 (도 38에 도시된 전압 인버터로 인해) I(x)의 음수이다. 세 번째 패널은 U(x)를 보여주고, 네 번째 패널은 P(x)를 보여준다. P(x)는 비대칭이므로 비가우시안이고 가우시안보다 급격한 감소를 갖는다. Figure 40 shows a schematic diagram of these four functions for the special case where the NLE is a forward-biased diode. A diode is a nonlinear device that conducts current roughly in one direction, with the current increasing exponentially with the forward-bias voltage. However, there is a breakdown voltage that allows current flow in the opposite direction. This gives rise to a somewhat asymmetric IV characteristic, as shown in the first panel of Figure 40. The second panel shows the force f ( x ), which is the negative of I ( x ) (due to the voltage inverter shown in Figure 38). The third panel shows U ( x ), and the fourth panel shows P ( x ). Since P ( x ) is asymmetric, it is non-Gaussian and has a steeper decay than Gaussian.

단일 다이오드를 고려하는 대신 반대 방향들로 병렬로 지향되는 두 개의 다이오드를 고려한다. 이들 두 개의 다이오드를 NLE와 병렬로 선택하면 대칭 분포 P(x)가 되는데, 이는 회로 소자가 양의 전압과 음의 전압에 대해 대칭이기 때문이다. NLE를 선택하면 도 40에 도시된 확률 분포의 대칭 버전을 설계 구현하는 것이 가능해진다. Instead of considering a single diode, we consider two diodes oriented in parallel with opposite directions. Choosing these two diodes in parallel with the NLE will result in a symmetric distribution P ( x ), since the circuit elements are symmetric with respect to positive and negative voltages. Choosing the NLE makes it possible to design and implement a symmetric version of the probability distribution shown in Fig. 40.

트랜지스터들은 또한 비선형 I-V 특성을 제공한다. 예를 들어, 공통 베이스 구성의 경우, 입력 특성은 볼록한 비선형 함수인 반면, 출력 특성은 큰 전압에 대해 포화되는 오목한 비선형 함수이다. 전자의 경우(입력 특성)는 다이오드의 분포와 유사한 분포 P(x)를 발생시키는 반면, 후자의 경우(출력 특성)는 길고 느리게 감소하는 꼬리를 갖는 분포 P(x)를 발생시킨다. 그런고로 후자를 채용하면 긴 꼬리를 가진 비가우시안 분포가 가능해진다. 이번에도, 두 개의 트랜지스터를 반대 방향들로 병렬로 지향시켜 이들 분포를 0 전압에 대해 대칭으로 만드는 것이 가능하다. 트랜지스터들의 경우 다른 구성(예컨대, 공통 이미터)도 가능하다. Transistors also exhibit nonlinear IV characteristics. For example, in the common-base configuration, the input characteristic is a convex nonlinear function, while the output characteristic is a concave nonlinear function that saturates for large voltages. The former case (the input characteristic) produces a distribution P ( x ) similar to that of a diode, while the latter case (the output characteristic) produces a distribution P ( x ) with a long, slowly decaying tail. Thus, the latter allows for non-Gaussian distributions with long tails. Again, it is possible to make these distributions symmetrical about zero voltage by orienting the two transistors in parallel in opposite directions. Other configurations for transistors are also possible, such as common-emitter.

14.5.4 다중 14.5.4 Multi 모드mode 분포에 대한 비선형 소자Nonlinear elements for distribution

이제 다중 모드 분포들로부터 샘플들을 추출하기 위한 NLE들에 대해 논의한다. 여러 모드를 얻으려면 퍼텐셜 에너지가 여러 극솟값들(예컨대, 국소 및 전역 최솟값들)을 가져야 한다. 이는 퍼텐셜 에너지의 도함수, 즉 힘이 한 번 이상 부호를 바뀌어야 함을 의미한다. 힘이 여러 번 부호를 바꾸면 이는 비단조 함수여야 한다. 그런고로 NLE의 I-V 특성은 비단조 함수여야 한다(상기 특성이 힘의 음수이기 때문이다). 따라서 비단조적 I-V 특성을 지닌 NLE에 대해 논의한다. We now discuss NLEs for sampling from multimodal distributions. To obtain multiple modes, the potential energy must have multiple local minima (e.g., local and global minima). This means that the derivative of the potential energy, i.e., the force, must change sign more than once. If the force changes sign more than once, it must be a nonmonotonic function. Therefore, the I-V characteristic of an NLE must be a nonmonotonic function (since the property is the negative of the force). Therefore, we discuss NLEs with nonmonotonic I-V characteristics.

먼저 터널 다이오드를 NLE로서 간주한다. 이 경우, 도 41은 전류, 힘, 퍼텐셜 에너지, 확률 분포에 대한 연관된 곡선들을 보여준다. 전류는 다소 3차 함수처럼 보이고, 명백히 단조적이지 않으며, 1사분면에 국소 최댓값과 국소 최솟값이 있다. 그러면 힘을 일정한 음수 양만큼 이동시킨다는 것을 전제로, 부호를 여러 번 바꾸는 힘 f(x)를 얻을 수 있다. 이는 맥스웰 데몬의 출력에서 일정한 전압을 뺌으로써 달성되는데, 이는 물리적으로 기본 단위 셀에 일정한 음의 전압원이 적용되는 것에 해당한다. 결과적인 f(x) 곡선은 도 41의 두 번째 패널에 나와 있다. 이는 두 개의 극솟값을 갖는 퍼텐셜 에너지 U(x)를 발생시키고, 결과적으로 두 개의 모드를 갖는 다중 모드 확률 분포 P(x)를 생성한다. First, consider the tunnel diode as an NLE. In this case, Fig. 41 shows the associated curves for the current, force, potential energy, and probability distribution. The current looks somewhat cubic, is clearly not monotonic, and has local maxima and minima in the first quadrant. Then, assuming that we shift the force by a constant negative amount, we obtain a force f ( x ) that changes sign many times. This is achieved by subtracting a constant voltage from the output of Maxwell's demon, which physically corresponds to applying a constant negative voltage source to the basic unit cell. The resulting f ( x ) curve is shown in the second panel of Fig. 41 . This gives rise to a potential energy U ( x ) with two local minima, and consequently to a multimodal probability distribution P ( x ) with two modes.

터널 다이오드의 대안으로서, NLE 후보로서 건(Gunn) 다이오드도 고려한다. 건 다이오드는 또한 순방향 바이어스 하에 비단조 I-V 특성을 가지며, 1사분면에서 로컬 최댓값과 로컬 최솟값을 갖는다. 또한, 역방향 바이어스 하에 비단조 I-V 특성을 갖는다. 그런고로 곡선은 양전압 및 음전압 둘 다에 대해 비단조적이다. 이는 터널 다이오드의 경우보다 더 복잡한 확률 분포 P(x)가 발생시킬 수 있다. 특히, 건 다이오드의 경우 P(x)는 양전압 영역 및 음전압 영역 둘 다에서 여러 모드를 가질 수 있다. As an alternative to the tunnel diode, the Gunn diode is also considered as a NLE candidate. The Gunn diode also has a nonmonotonic IV characteristic under forward bias, with local maxima and local minima in the first quadrant. It also has a nonmonotonic IV characteristic under reverse bias. Therefore, the curve is nonmonotonic for both positive and negative voltages. This can lead to a more complex probability distribution P ( x ) than that of the tunnel diode. In particular, for the Gunn diode, P ( x ) can have multiple modes in both the positive and negative voltage regions.

멤리스터와 같은 다른 NLE도 고려될 수 있다. 또한, 다양한 비선형 소자를 직렬로 또는 병렬로 조합함으로써 복잡한 I-V 특성을 생성할 수 있다. 예를 들어, NLE들이 직렬로 조합되는 경우 전체 I-V 곡선은 개별 I-V 곡선들의 합성이 된다. 이와 같이, 다양한 회로 소자를 결합하여 전체 NLE 블록을 형성함으로써 복잡한 I-V 곡선들이 설계 구현될 수 있다. Other NLEs such as memristors can also be considered. In addition, complex I-V characteristics can be generated by combining various nonlinear elements in series or in parallel. For example, when NLEs are combined in series, the overall I-V curve becomes a composite of the individual I-V curves. In this way, complex I-V curves can be designed and implemented by combining various circuit elements to form an overall NLE block.

14.6 아날로그 맥스웰 14.6 Analog Maxwell 데몬에To the demon 대한 상관관계 접근법Korean Correlation Approach

14.6.1 개요14.6.1 Overview

이제 여러 단위 셀의 상관관계를 수반하는 아날로그 맥스웰 데몬을 구성하는 접근법을 고려한다. 이 전략의 개요는 도 42에 묘사되어 있고 다음과 같은 구성 블록들을 포함한다: We now consider an approach to constructing an analog Maxwell demon involving correlation of multiple unit cells. The outline of this strategy is depicted in Fig. 42 and includes the following building blocks:

1. 콜렉션이 전압 벡터 v를 형성하는 각 기본 단위 셀 커패시터의 전압 측정값. 1. Voltage measurements of each basic unit cell capacitor whose collection forms a voltage vector v .

2. 전압 벡터 v의 요소들이 서로 결합되게 하여, 결합 동작의 출력은 또 다른 벡터 h(v)인 아날로그 결합 동작. 이 결합은 아핀 변환 h(v) = A v + b에 해당할 수도 있거나, 2차 형태이나 3차 형태와 같은 고차 텐서에 해당할 수 있다. 2. An analog coupling operation, where the elements of the voltage vector v are coupled together, so that the output of the coupling operation is another vector h(v) . This coupling may correspond to an affine transformation h ( v ) = A v + b , or it may correspond to a higher-order tensor, such as a second- or third-order form.

3. 벡터 h(v)의 각 성분에 작용하는 비선형 연산. 이는 h(v)의 벡터 성분들을 사용하여 비선형 회로 소자를 통해 전류를 구동한 다음 NLE와 직렬로 연결된 저항기의 전압을 선택함으로써 이 비선형 소자(NLE)를 통해 전류를 판독하는 것을 수반할 수 있다. 다양한 유형의 다이오드 및 트랜지스터를 포함하는 NLE의 예들은 섹션 14.5.3 및 14.5.4를 참조한다. 결과적인 전압 벡터를 n(h(v))로서 쓰며, n은 비선형 연산에 해당한다. 3. A nonlinear operation acting on each component of the vector h ( v ). This may involve driving a current through a nonlinear circuit element using the vector components of h ( v ), and then reading the current through this nonlinear element (NLE) by selecting the voltage across a resistor connected in series with the NLE. Examples of NLEs, including various types of diodes and transistors, are given in Sections 14.5.3 and 14.5.4. The resulting voltage vector is written as n ( h ( v )), where n corresponds to the nonlinear operation.

4. 이전 두 단계는 여러 층의 결합 및 비선형 연산들이 있도록 여러 번 반복될 수 있다. L개 층이 있다면, 최종 출력 벡터는 다음과 같은 형태를 가지며: 4. The previous two steps can be repeated multiple times so that there are multiple layers of combinations and nonlinear operations. If there are L layers, the final output vector will have the following form:

여기서 기호 "o"는 연산들이 순차적으로 함께 구성됨을 나타낸다. 여기서, h j n j 는 각각 j번째 층에 대한 결합 및 비선형 변환이다. Here, the symbol "o" indicates that the operations are composed together sequentially. Here, h j and n j are the coupling and nonlinear transformations for the j -th layer, respectively.

5. v 출력의 성분들은 음의 피드백을 달성하도록 부호가 반전되고 그 원인은 섹션 14.5.1에서 설명된다. 이는 전압 인버터를 이용하여 또는 보조 단위 셀의 저항기를 접지 해제하고 이 저항기 양단의 전압 차이와 연관된 와이어들을 교체함으로써 수행할 수 있다. 5. The components of the v output are inverted to achieve negative feedback, the reason being explained in Section 14.5.1. This can be done using a voltage inverter or by disconnecting the resistor of the auxiliary unit cell from ground and swapping the wires associated with the voltage difference across this resistor.

6. v 출력의 요소들의 부호를 반전시킨 후, 이들 요소는 해당 기본 단위 셀들 내부에 전압원들로서 적용된다. 6. After inverting the signs of the elements of the v output , these elements are applied as voltage sources inside the corresponding basic unit cells.

다음에서는 도 42에 나타난 아날로그 결합 연산을 구성하는 다양한 방법을 고려한다. In the following, we consider various methods of constructing the analog combination operation shown in Fig. 42.

14.6.2 아날로그 14.6.2 Analog 아핀Affin 변환Conversion

위에서 언급된 아날로그 결합 연산은 예를 들어 아핀 변환을 포함하여 다양한 형태를 취할 수 있다. 도 43은 벡터 v에 대한 아핀 변환을 구현하는 아날로그 회로를 제공한다. 어떤 행렬 A에 대해 A v 변환을 구현하고자 한다고 가정한다. A의 각 행은 v에 곱해지고, 이 곱셈은 도 43에 도시된 바와 같이 저항기 층을 이용하여 달성될 수 있다. A가 조밀 행렬이라고 가정하면, 이는 d² 개 저항기들을 수반하는데, A의 각 행과 연관된 저항기들이 d개이고 A의 행이 d개이기 때문이다. A가 조밀하지 않다면 더 적은 저항기들이 채용될 수 있다. 선택적인 특징으로서, 출력에 전압 벡터 b를 추가하면 일반적인 아핀 변환 A v + b가 생성된다. The analog combination operation mentioned above can take various forms, including, for example, affine transformations. Fig. 43 provides an analog circuit implementing an affine transformation for a vector v . Suppose we want to implement the A v transformation for some matrix A . Each row of A is multiplied by v , and this multiplication can be accomplished using layers of resistors as illustrated in Fig. 43 . Assuming that A is a dense matrix, this involves d ² resistors, since there are d resistors associated with each row of A and d rows of A . If A is not dense, fewer resistors can be employed. As an optional feature, adding a voltage vector b to the output yields the general affine transformation A v + b .

14.6.3 고차 결합 연산14.6.3 Higher-order combination operations

위에서 언급된 아날로그 아핀 변환은 1차 결합 연산으로 볼 수 있는데, 이것이 v의 성분들에서 선형인 항들의 가중된 합을 생성하기 때문이다. The analog affine transformation mentioned above can be viewed as a first-order associative operation, since it produces a weighted sum of terms that are linear in the components of v .

대안적으로, v의 성분들에 2차 또는 3차인 항과 같은 고차 항들을 포함하는 아날로그 결합 연산을 고려할 수 있다. 이러한 접근법의 하나의 이점은, 표준 디지털 방법들로 샘플들을 추출하기 어려울 분포들을 포함하여, 더 복잡한 확률 분포 P(x)를 표현을 가능하게 한다는 점이다. Alternatively, one could consider analog combination operations that include higher-order terms, such as quadratic or cubic terms, in the components of v . One advantage of this approach is that it allows representing more complex probability distributions P ( x ), including distributions that are difficult to sample using standard digital methods.

고차 항을 얻는 한 가지 방법은 도 43의 각 저항기를 다른 회로 소자, 이를테면 n > 2인 n포트 소자로 대체하여 고차 결합들을 달성하는 것이다. One way to obtain higher-order terms is to replace each resistor in Fig. 43 with another circuit element, say an n- port element where n > 2, to achieve higher-order couplings.

예를 들어, 3포트 소자인 트랜지스터를 고려한다. 도 44는 트랜지스터들을 사용하여 고차 결합들을 생성하는 한 가지 방법을 도시한다. 여기서 전압 소자 v j 를 회로의 k번째 팔(arm)에 있는 트랜지스터를 위한 게이트 전압으로서 사용할 수 있으며, 여기서 kj이다. 이러한 의미에서 v j 는 전압 v k 가 직면하는 저항을 제어하여 고차 결합을 발생시킨다. For example, consider a three-port device, a transistor. Figure 44 illustrates one way to create higher-order couplings using transistors. Here, a voltage component v j can be used as a gate voltage for a transistor in the k -th arm of the circuit, where kj . In this sense, v j controls the resistance encountered by the voltage v k to create higher-order couplings.

더 일반적으로, 여러 트랜지스터들의 체인들을 포함한 다른 멀티포트 소자를 사용하여 다른 고차 결합을 생성할 수 있다. More generally, other higher-order couplings can be created using other multiport devices, including chains of multiple transistors.

14.7 신경망에 의해 표현되는 분포들에 대한 맥스웰 데몬 접근법14.7 Maxwell's Demon Approach to Distributions Represented by Neural Networks

많은 응용 분야에서, 샘플링되는 로그 확률은 작업의 출력에 비례한다. 이 경우 확률들은 다음과 같이 표현할 수 있다: In many applications, the log probability being sampled is proportional to the output of the task. In this case, the probabilities can be expressed as:

구체적으로, 베이지안(Bayesian) 추론에서 샘플링되는 사후 확률 분포(posterior distribution)는Specifically, the posterior probability distribution sampled in Bayesian inference is

이며, 이는 사전 확률 분포 와 우도 의 곱으로서 정의되며, 는 집합 의 관측치를 조건으로 를 관측할 확률이다. 이 경우, 사전 확률 분포 및/또는 우도는 신경망에 의해 파라미터화될 수 있다. 여기서 디지털 HMC의 런타임은 전형적으로는 자동 미분을 사용하여 계산되는 기울기의 계산에 의해 제한될 수 있다. 신경망의 기울기 계산의 런타임은 네트워크의 파라미터 수와 층 수에 따라 달라진다. 예를 들어, 각 층 m에 동일한 수의 뉴런들이 있는 고밀도 피드 포워드 신경망의 경우, 자동 미분을 이용한 기울기 계산 런타임은 O(dm 2)이다. 많은 경우 m은 입력 크기에 따라 스케일 조정되도록 선택될 수 있으며, 그런고로 최신 애플리케이션에 채용되는 신경망에 대한 런타임은 O(d 3)이다. , which is the prior probability distribution Wow, too is defined as the product of , is a set Conditioned on the observations of is the probability of observing the gradient. In this case, the prior probability distribution and/or the likelihood can be parameterized by the neural network. Here, the runtime of the digital HMC can be limited by the computation of the gradient, which is typically computed using automatic differentiation. The runtime of the gradient computation in the neural network depends on the number of parameters and the number of layers in the network. For example, for a dense feedforward neural network with the same number of neurons in each layer m , the runtime of the gradient computation using automatic differentiation is O ( dm2 ). In many cases , m can be chosen to scale with the input size, and thus the runtime for neural networks employed in modern applications is O ( d3 ).

이러한 경우, 모델 이 아날로그로(예를 들면 위에서 설명된 바와 같이 아날로그 신경망 사용하여) 컴파일되고 그 기울기가 추정될 수 있다면, 아날로그 하드웨어를 사용하여 이러한 병목 현상은 제거될 수 있다. 이러한 장치를 이하 "기울기 계산기"(4114)라고 한다. 기울기 계산기(4114)는, 아날로그 신경망 장치의 출력에 해당하는 전압 벡터를 입력으로 하고 음의 기울기에 해당하는 전압 벡터 를 출력으로 하는 아날로그 장치이다. 기울기 계산기(4114)의 한 가지 가능한 구현예는 유한 차분을 사용하여 기울기를 추정하기 위하여 아날로그 가산기 및 감산기를 포함한다. 해밀턴 방정식을 푸는 것은 기울기 계산기의 출력 전압 벡터 (음의 기울기)를 d개의 적분기로 구성된 장치에 피드함으로써 하드웨어에서 수행될 수 있다. 이런 식으로, 적분기 출력에서 얻어진 전압들은 운동량 변수들(운동량 적분기 장치)을 나타내고, 이 적분 단계는 다음과 같은 운동량에 대한 해밀토니안 방정식에 해당한다: In this case, the model If this analog (e.g. using an analog neural network as described above) is compiled and its gradient can be estimated, this bottleneck can be eliminated by using analog hardware. Such a device is hereinafter referred to as a "gradient calculator" (4114). The gradient calculator (4114) takes as input a voltage vector corresponding to the output of the analog neural network device and a voltage vector corresponding to the negative gradient. is an analog device that outputs a gradient calculator (4114). One possible implementation of the gradient calculator (4114) includes an analog adder and subtractor to estimate the gradient using finite differences. Solving the Hamiltonian equations uses the output voltage vector of the gradient calculator (negative slope) can be performed in hardware by feeding the d integrator units. In this way, the voltages obtained at the integrator output represent the momentum variables (momentum integrator unit), and this integration step corresponds to the Hamiltonian equation for momentum:

그러므로 일정 시간 T 후에 다음이 얻어지며:Therefore, after some time T , we obtain:

여기서 위치의 시간 의존성을 명시적으로 나타내었고, 는 운동량 적분기 장치의 특성화하는 저항기와 커패시터이다. 그러면 위치는 운동량의 적분에 의해 주어지며, 이는 전압 벡터 를 두 번째 적분기 장치(위치 적분기 장치)에 피드함으로써 수행될 수 있다: Here we explicitly show the time dependence of the position, and are the resistors and capacitors that characterize the momentum integrator device. Then the position is given by the integral of the momentum, which is the voltage vector This can be done by feeding the second integrator device (position integrator device):

시간 증분 T 후에 역 질량 행렬 가 곱해진 전압 벡터는 기울기 계산기에 피드된다. 대부분의 경우 질량 행렬은 대각 행렬이며, 그런고로 이는 전압 벡터에 상수 값을 곱한 것에 해당하고, 도 43에 묘사된 바와 같이, d개의 저항기로 구성된 아핀 층을 사용함으로써 아날로그 방식으로 수행될 수 있다. 또한 1/RC 항을 사용하여 출력을 다시 스케일 조정하여 정확한 위치를 얻을 수 있다. 여기서는 RC의 모든 값을 동일하게 설정할 수 있다. 만약 부품이 아날로그이고 기울기 계산기, 운동량 적분기 장치 및 위치 적분기 장치 사이에 레이턴시가 없다면, 해밀턴 방정식들 각각의 적분은 (위에서 논의된 존슨-나이퀴스트 잡음과 같은 잡음원까지) 정확할 것이다. Inverse mass matrix after time increment T The multiplied voltage vector is fed to the gradient calculator. In most cases the mass matrix is diagonal, so this corresponds to multiplying the voltage vector by a constant value, which can be done in an analog fashion using an affine layer consisting of d resistors, as illustrated in Fig. 43. The output can also be rescaled using the 1/ RC term to obtain the exact position. Here all values of R and C can be set to the same. If the components are analog and there is no latency between the gradient calculator, the momentum integrator and the position integrator, then the integration of each of the Hamiltonian equations will be exact (up to noise sources such as the Johnson-Nyquist noise discussed above).

도 45는 신경망에 의해 표현된 분포로부터 샘플들을 추출하기 위한 맥스웰 데몬 장치(4110)의 개략도를 도시한다. 사용자(41)가 먼저 모델 을 하드웨어 아날로그 신경망(ANN)(4112)(폐쇄형이 존재한다면 기울기 포함)에 컴파일한다. 그런 다음 기울기 출력은 운동량 적분기 장치(4120)에 피드되고, 그러면 이 장치의 출력은 위치 적분기 장치(4130)에 피드된다. 운동량 적분기 장치(4120)는 도 45에 도시된 바와 같이 운동량을 나타내는 전압을 출력하는 d개의 아날로그 적분기로 구성된 장치이다. 위치 적분기 장치(4130)는 또한 d개의 아날로그 적분기로 구성되며 위치 변수들을 나타낸다. 위치에 해당하는 전압 벡터 는 아핀 층에 피드될 수 있으며, 아핀 층은 전압 벡터에 M -1을 곱한다. M이 임의로 조밀하다면, 그 역산은 O (d 3) 단계들을 소요할 수 있다. 행렬 인버터 블록(4140)은 도면에 도시된 바와 아핀 층이며, 여기서 행렬 A의 원소들은 M -1의 원소들이다. Figure 45 illustrates a schematic diagram of a Maxwell daemon device (4110) for extracting samples from a distribution represented by a neural network. The user (41) first compiles into a hardware analog neural network (ANN) (4112) (including gradients if closed form exists). Then, the gradient output is fed to a momentum integrator unit (4120), and the output of this unit is then fed to a position integrator unit (4130). The momentum integrator unit (4120) is a unit composed of d analog integrators that output voltages representing momentum as illustrated in FIG. 45. The position integrator unit (4130) is also composed of d analog integrators and represents position variables. A voltage vector corresponding to the position can be fed to an affine layer, which multiplies the voltage vector by M -1 . If M is arbitrarily dense, the inversion can take O ( d 3 ) steps. The matrix inverter block (4140) is an affine layer as shown in the diagram, where the elements of matrix A are elements of M -1 .

14.7.1 기울기 계산14.7.1 Slope calculation

아날로그 방식으로 기울기를 계산하는 것은 어렵다. 함수의 기울기를 추정하는 더 간단한 방법은 유한 차분을 수행하는 것이다. 이는 기울기 계산에 잡음을 도입할 수 있다. HMC의 경우, 메트로폴리스-헤이스팅스(Metropolis-Hastings) 단계가 있으므로, 이 잡음은 성능을 저하시키지 않는데, 이는 아래에서 확률적 기울기 HMC에 관해 논의되는 바와 같이 비상관된 잡음의 또 다른 근원이 될 것이기 때문이다. 구체적으로, 유한 차분 기울기는 평균과 분산 V가 0인 가우시안 잡음이 추가된 다음과 같은 정확한 기울기로서 쓸 수 있다: Computing the gradient in an analog way is difficult. A simpler way to estimate the gradient of a function is to perform finite differences. This can introduce noise into the gradient computation. In the case of HMC, since there is a Metropolis-Hastings step, this noise does not degrade performance, as it would be another source of uncorrelated noise, as discussed below for stochastic gradient HMC. Specifically, the finite difference gradient can be written as the exact gradient with added Gaussian noise of zero mean and variance V :

이와 같이 기울기는 동역학에서 오류를 유발할 수 있다. 이들 오류는 하드웨어로부터 나오는 잡음에 더해지는 잡음의 추가적인 근원으로 간주될 수 있다. In this way, slopes can introduce errors in the dynamics. These errors can be considered as an additional source of noise added to the noise coming from the hardware.

15 정밀도 행렬을 통한 15 Through the precision matrix 가우시안Gaussian 샘플링용 하드웨어Hardware for sampling

도 45에 묘사된 장치는 가우시안 샘플링을 수행하도록 약간 수정될 수 있다. 한 가지 차이점은 기울기 계산기가 전압 를 피드하며, 이는 , 즉 다변량 가우시안 분포의 음의 기울기에 해당한다는 것이다. 베이지안 회귀와 같은 일부 예시적인 애플리케이션에서, 정밀도 행렬이라고 알려진 행렬 Σ-1 = Q가 직접 제공되는데, 이것이 프로세스에 참여하기 때문이다. 실제로 다변량 가우시안은 일반적으로 평균과 정밀도 행렬에 의해 정의될 수 있다. The device depicted in Fig. 45 can be slightly modified to perform Gaussian sampling. One difference is that the slope calculator uses voltage , which feeds , that is, the negative slope of the multivariate Gaussian distribution. In some exemplary applications, such as Bayesian regression, the matrix Σ -1 = Q , known as the precision matrix, is provided directly, because it participates in the process. In fact, the multivariate Gaussian can be generally defined by the mean and the precision matrix.

도 46은 주어진 평균 및 정밀도 행렬을 이용하여 다변량 가우시안을 샘플링하는 대체 장치를 도시한다. 기울기 계산기는 저항들이 행렬 Q의 원소들에 해당하는 저항층(4210)에 의해 대체될 수 있다. 이를 실현하기 위해 저항층의 각 출력 포트에 연산 증폭기를 추가하여서 값이 사라지지 않도록 하는 것이 가능하다. 그러면 음의 기울기 에 해당하는 전압은 병렬 적분기들에 피드되어, 운동량 적분기 장치(4120)를 형성할 수 있으며, 이 장치 출력은 운동량에 해당한다. 위와 같이 다음이 성립하며Fig. 46 illustrates an alternative arrangement for sampling a multivariate Gaussian using a given mean and precision matrix. The slope calculator can be replaced by a resistive layer (4210) whose resistors correspond to the elements of the matrix Q. To achieve this, it is possible to add an operational amplifier to each output port of the resistive layer so that the value does not disappear. Then, the negative slope The voltage corresponding to can be fed to the parallel integrators to form a momentum integrator device (4120), the output of which corresponds to the momentum. As above, the following is established:

and

이는 섹션 14.7에서 정의된 양들을 가진다. 앞에서와 같이, 운동량 적분기 장치(4120)와 위치 적분기 장치(4130) 둘 다에 대해 출력들은 1/RC 항에 의해 다시 스케일 조정되어야 한다. 이들 장치는 완전히 병렬이며; 이들은 결합되지 않는다. 만약 즉 기울기 계산기(4210), 운동량 적분기 장치(4120), 위치 적분기 장치(4130)의 동작들이 아날로그 방식이고 그것들 사이에 레이턴시가 없다면, 해밀턴 방정식들 각각의 적분은(위에서 설명한 존슨-나이퀴스트(Johnson-Nyquist) 잡음과 같은 잡음원까지) 정확해야 한다. 이러한 접근법의 장점은 인덕터가 필요 없기 때문에 확장성이 있다는 것이다. 이는 위에서 개시된 결합된 LC 공진기 장치의 경우와 같은 연결 제약에 의해 제한되지 않다. 실제로, 이 하드웨어는 전체-대-전체 결합 없이 고밀도 공분산 또는 정밀 행렬을 처리할 수 있다. This has the quantities defined in Section 14.7. As before, the outputs for both the momentum integrator unit (4120) and the position integrator unit (4130) must be rescaled by the 1/ RC term. These units are completely parallel; they are not coupled. If, i.e., the operations of the gradient calculator (4210), the momentum integrator unit (4120) and the position integrator unit (4130) are analog and there is no latency between them, then the integration of each of the Hamiltonian equations should be accurate (up to noise sources such as the Johnson-Nyquist noise described above). The advantage of this approach is that it is scalable since no inductors are required. It is not limited by the coupling constraints as in the case of the coupled LC resonator unit disclosed above. In fact, this hardware can handle dense covariance or precision matrices without all-to-all coupling.

16 16 비가우시안Non-Gaussian 분포 샘플링을 위한 For distribution sampling 다체Multi-body 결합 접근법Combined approach

16.1 동기 및 개요16.1 Motivation and Overview

16.1.1 16.1.1 2체2 bodies 결합을 넘어서기Beyond the Union

이전 섹션은 맥스웰 데몬(MD) 채용에 기반하여 가우시안 분포를 넘어서는 한 가지 방법을 설명하였다. 이 접근법은 단위 셀들 간의 직접 결합이 위에서 논의된 용량성 결합과 같은 2체 결합이라고 가정했다. The previous section described one way to go beyond the Gaussian distribution based on the adoption of Maxwell's Demon (MD). This approach assumed that the direct coupling between unit cells is a two-body coupling, like the capacitive coupling discussed above.

이 섹션에서, 단위 셀들 간의 직접 결합을 변경하는 것을 수반하는 가우시안 분포를 넘어서는 대안적인 접근법을 설명한다. 구체적으로, 이 접근법은 단위 셀들 간의 직접 결합을 3체 또는 더 일반적으로 n체와 같은 다체 결합이 되도록 설계 구현한다. In this section, we describe an alternative approach beyond Gaussian distributions that involves changing the direct coupling between unit cells. Specifically, this approach designs and implements the direct coupling between unit cells to be a multi-body coupling, such as a 3-body or, more generally, an n- body coupling.

이 접근법은 퍼텐셜 에너지 함수 U(x)에서 n체 항들을 발생시키고, 이는 결국 확률 분포 p(x)에서 더 높은 차수의 큐뮬런트들(이를테면 섹션 13.4.3에서 논의된 k 3 또는 k 4)로 이어진다. 다체 결합을 도입하는 것과 고차 큐뮬런트들을 분포 p(x)에 도입하는 것 사이에는, 섹션 13.4.3에서 논의된 바와 같이, 수학적 연관성이 있다. This approach gives rise to n- body terms in the potential energy function U ( x ), which in turn leads to higher-order cumulants in the probability distribution p ( x ), for example k 3 or k 4 , as discussed in Section 13.4.3. There is a mathematical connection between introducing many-body coupling and introducing higher-order cumulants into the distribution p ( x ), as discussed in Section 13.4.3.

3체 결합들을 구성하기 위해, (용량성 결합과 연관된 두 개의 포트 대신) 세 개의 포트를 가진 전기 소자를 사용한다. 더 일반적으로, 어떤 정수 n > 2에 대한 n체 결합들을 구성하기 위해, n개의 포트를 가진 전기 소자들을 사용한다. n개의 서로 다른 단위 셀(즉, HMC 하드웨어로부터의 n개의 서로 다른 LC 오실레이터)과 연관된 전압들은 결합을 담당하는 전기 소자의 n개의 포트에 피드된다. 이 n포트 소자를 결합 소자라고 한다. To construct 3-body couplings, we use electrical components with three ports (instead of the two ports associated with capacitive coupling). More generally, to construct n -body couplings for some integer n > 2, we use electrical components with n ports. The voltages associated with n different unit cells (i.e., n different LC oscillators from the HMC hardware) are fed to n ports of the electrical component responsible for the coupling. This n- port component is called the coupling element.

아래에서 n포트 결합 소자를 구성하는 데 사용될 수 있는 특정 물리적 회로 소자들에 대해 자세히 설명한다. 예를 들어, 트랜지스터 네트워크들 또는 바리캡들(버랙터들이라고도 알려짐)의 네트워크들은 아래에서 자세히 설명되는 바와 같이 이 목적으로 채용될 수 있다. Below we detail specific physical circuit elements that may be used to construct an n- port coupling device. For example, networks of transistors or networks of varicaps (also known as varactors) may be employed for this purpose, as detailed below.

n체 결합 접근법은 맥스웰 데몬 접근법과는 독립적으로 또는 함께 사용될 수 있다. 또한, 이 방식은 이전 섹션들에서 설명한 2체 용량성 결합과는 독립적으로 또는 함께 사용될 수 있다. This n- body coupling approach can be used independently or in conjunction with the Maxwell demon approach. Also, this approach can be used independently or in conjunction with the two-body capacitive coupling described in the previous sections.

단위 셀들 간의 직접 결합을 변경하면, 아래에서 자세히 설명하는 바와 같이, 디지털 방식으로 시뮬레이션하기는 어렵다는 이점이 있다. Changing the direct coupling between unit cells has the advantage that it is difficult to simulate digitally, as detailed below.

16.1.2 효과적인 16.1.2 Effective 다체Multi-body 결합의 디지털 시뮬레이션Digital simulation of bonding

원칙적으로 다체 결합은 표준 디지털 컴퓨터로 시뮬레이션하기 어려울 수 있다. 이를 이해하는 한 가지 방법은 일반적인 k차 결합이 d k 개의 요소를 갖는 k차 텐서에 의해 수학적으로 표현된다는 것이다. 그런고로 주어진 시점에서 결합을 계산하는 것은 d k 개의 곱셈 연산자를 수반할 수 있다. 예를 들어, 3차 결합은 디지털 컴퓨터가 계산할 수 있는 d 3개의 연산을 수반할 것이다. 따라서 이와 같은 다체 결합은 디지털 컴퓨터가 시뮬레이션하기 어려울 수 있다. In principle, many-body couplings can be difficult to simulate on a standard digital computer. One way to understand this is that a typical k- th order coupling is mathematically represented by a k -th order tensor with dk elements. Therefore, computing the coupling at a given point in time may involve dk multiplication operators. For example, a cubic coupling would involve d3 operations that a digital computer can compute. Therefore, many - body couplings like this can be difficult to simulate on a digital computer.

그러나 디지털 장치가 이러한 결합을 효율적으로 시뮬레이션할 수 있는 상황이 있다. 즉, 일련의 2체 결합들에 의해 다체 결합이 생성되는 경우를 고려한다. 이 경우 다체 결합은 진정한 것이 아니라 유효한(effective) 것이며, 이는 많은 다체를 소수의 2체 결합에 의해 효율적으로 표현할 수 있다는 뜻이다. (반면, 진정한 다체 결합은 소수의 2체 결합으로서 효율적으로 표현될 수 없는 결합을 말한다.)However, there are situations where digital devices can efficiently simulate such couplings. That is, consider the case where a many-body coupling is generated by a series of two-body couplings. In this case, the many-body coupling is not real but effective, meaning that many many-body couplings can be efficiently represented by a small number of two-body couplings. (In contrast, a true many-body coupling is a coupling that cannot be efficiently represented by a small number of two-body couplings.)

섹션 14에서 설명된 맥스웰 데몬 접근법은, 진정한 다체 결합이 아니라, 유효한 다체 결합의 경우에 크게 해당한다. 한 가지 예외는 섹션 14.6.3에서 설명된 접근법이며, 이는 실제로 진정한 것들인 고차 결합들을 생성하기 위해 트랜지스터들을 수반한다. The Maxwell Demon approach described in Section 14 is largely applicable to the case of valid many-body couplings, but not true many-body couplings. One exception is the approach described in Section 14.6.3, which involves transistors to create higher-order couplings that are actually true.

만약 이 예외를 무시하고 대신 섹션 14.6.2의 아날로그 아핀 변환을 고려하면, 디지털 컴퓨터가 d 2로서 스케일 조정되는 복잡도로 아날로그 맥스웰 데몬을 시뮬레이션할 수 있을 것으로 기대하는데, 아핀 변환의 행렬-벡터 곱셈이 d 2 연산을 수반하기 때문이다. 이 d 2복잡도는 아날로그 맥스웰 데몬이 비선형 회로 소자를 통해 다체 결합들을 생성하더라도 유지된다. 이는 이 버전의 아날로그 맥스웰 데몬이, 진정한 다체 결합이 아니라, 유효한 다체 결합을 수반하기 때문이다. If we ignore this exception and instead consider the analog affine transformations of Section 14.6.2, we expect that a digital computer will be able to simulate the analog Maxwell's demon with a complexity that scales as d 2 , since the matrix-vector multiplication of the affine transformation involves d 2 operations. This d 2 complexity is maintained even if the analog Maxwell's demon generates many-body couplings via nonlinear circuit elements, since this version of the analog Maxwell's demon involves valid many-body couplings, not true many-body couplings.

디지털 방식으로 시뮬레이션하기 어려운 아날로그 시스템을 설계하는 것을 목표로 할 때, 유효한 다체 결합이 아니라, 진정한 다체 결합을 사용하는 것이 도움이 된다. 여기서 가령 "디지털 방식으로 시뮬레이션하기 어렵다"고 할 때, 이는 디지털 컴퓨터를 채용하는 것의 복잡도가 d 2보다 큰 스케일링(예컨대, d 3 스케일링)을 수반하는 경우를 의미한다. When aiming to design analog systems that are difficult to simulate digitally, it is helpful to use true many-body coupling, rather than valid many-body coupling. Here, when we say "difficult to simulate digitally", we mean that the complexity of employing a digital computer scales by more than d 2 (e.g., d 3 scaling).

16.1.3 진정한 16.1.3 True 다체Multi-body 결합Combine

진정한 다체 결합이 무엇을 의미하는지를 간략하게 설명한다. 진정한 다체 결합은 관련된 회로 소자들의 다체 결합으로 볼 수 있다. 이는 소수체 결합(예컨대, 2체 결합)을 갖는 회로 소자들로 구성되는 다체 결합과 대조된다. Let us briefly explain what we mean by true many-body coupling. True many-body coupling can be viewed as a many-body coupling of the relevant circuit elements. This is in contrast to many-body coupling, which consists of circuit elements with few-body coupling (e.g., two-body coupling).

계산적 관점에서, 진정한 다체 결합을 다체 결합을 구축하는 것이 추가적인 계산 자원을 수반하지 않는 경우라고 생각할 수 있다. 예를 들어, 여러 개의 2체 결합을 보조 시스템과 결합하여 하나의 3체 결합을 생성할 수 있지만, 이는 추가 자원(예컨대, 보조 시스템)을 사용하는 것을 수반하며 그래서 진정한 3체 결합으로서 간주되지 않다. 그 반면에, 추가 보조 시스템 없이 단일 트랜지스터만으로, 진정한 3체 결합으로 간주되는 3체 결합을 생성하는 것이 가능하다. From a computational point of view, a true many-body coupling can be thought of as a case where constructing a many-body coupling does not entail additional computational resources. For example, one can combine several two-body couplings with auxiliary systems to form a three-body coupling, but this entails using additional resources (e.g., auxiliary systems) and is therefore not considered a true three-body coupling. On the other hand, it is possible to construct a three-body coupling with only a single transistor and without additional auxiliary systems, which is considered a true three-body coupling.

16.1.4 16.1.4 용량성Capacitance 대 저항성 High resistance 다체Multi-body 결합Combine

위에서 언급된 바와 같이, 다체 결합 소자를 만들려면 많은 입력 및/또는 출력 포트를 가진 회로 소자를 채용해야 한다. As mentioned above, creating a multi-body coupling element requires employing circuit elements with many input and/or output ports.

한 가지 목표는 샘플들을 추출할 확률 분포 P(x)를 설계 구현하는 것이다. 이는 퍼텐셜 에너지 함수U(x)를 설계 구현하는 것에 해당하는데, 라는 관계가 있기 때문이다. One goal is to design and implement a probability distribution P ( x ) from which to draw samples. This corresponds to designing and implementing a potential energy function U ( x ), Because there is a relationship called .

물리적 회로 소자의 관점에서 퍼텐셜 에너지는 회로의 용량성 소자와 연관되는데, 커패시터가 에너지를 저장할 수 있기 때문이다. 한편, 회로의 저항 소자는 감쇠 또는 마찰과 연관되며, 이는 기술적으로 퍼텐셜 에너지 함수에 직접적으로 기여하지 않다. From the perspective of physical circuit elements, potential energy is associated with capacitive elements in the circuit, since capacitors can store energy. On the other hand, resistive elements in the circuit are associated with damping or friction, which technically do not directly contribute to the potential energy function.

따라서 P(x)를 설계 구현하기 위해, 저항 소자보다 용량성 소자에 더 관심이 있다. 순수하게 저항성인 회로 소자는 확률 분포 P(x)를 설계 구현하는 데 그다지 유용하지 않다. Therefore, for designing and implementing P ( x ), we are more interested in capacitive elements than resistive elements. Purely resistive circuit elements are not very useful for designing and implementing probability distributions P ( x ).

그런고로 n포트 소자들을 원하는 것 외에도, 그들 소자에 약간의 커패시턴스가 있기를 원한다. 특히, 해당 커패시턴스 값이 전압 제어되기를, 즉 소자의 다른 입력 포트들에 의해 제어되기를 원한다. 이러한 의미에서, 본질적으로 전압 제어 커패시터로서 역할을 하는 n포트 소자에 관심이 있다. Therefore, in addition to wanting n- port devices, we also want them to have some capacitance. In particular, we want that capacitance value to be voltage controlled, i.e., controlled by the other input ports of the device. In this sense, we are interested in n- port devices that essentially act as voltage-controlled capacitors.

16.1.5 전압 제어 커패시터 역할을 하는 소자16.1.5 Elements that act as voltage control capacitors

전압 제어 커패시터를 구성하는 데는 다양한 접근법이 채용될 수 있다. There are several approaches that can be taken to construct a voltage controlled capacitor.

트랜지스터는 게이트 전압에 의해 어느 정도 영향을 받을 수 있는 커패시턴스를 가지고 있다. 따라서 트랜지스터는 전압 제어 커패시터를 위한 한 가지 옵션이다. 트랜지스터의 세 단자 중 어느 것도 접지되지 않고 그 결과 칩 내부 공간을 너무 많이 차지하지 않도록 하는 전략을 고려해야 한다. 다행히도 완전 공핍형 실리콘 온 인슐레이터(Fully Depleted Silicon on Insulator, FDSOI)에 기반한 트랜지스터 기술은 이 경우 칩 내부 공간을 작게 유지할 수 있는 방법을 제공한다. Transistors have capacitance that can be affected to some extent by the gate voltage. Therefore, transistors are one option for voltage-controlled capacitors. A strategy must be considered to ensure that none of the three terminals of the transistor are grounded and consequently do not take up too much space inside the chip. Fortunately, transistor technology based on Fully Depleted Silicon on Insulator (FDSOI) provides a way to keep the space inside the chip small in this case.

바리캡들(버랙터들이라고도 알려짐)은 또 다른 옵션을 제공한다. 각 바리캡이 2포트 소자이지만, 도 19에 예시된 바와 같이 두 개의 바리캡을 백투백(back-to-back) 구성으로 서로 반대 방향으로 배치할 수 있다. 두 바리캡 사이에 전압선을 삽입함으로써, 시스템의 전체 커패시턴스를 조정할 수 있다. 도 19에 도시된 소자는 총 3개의 포트를 가진 전압 제어 커패시터로서 역할을 한다. 따라서 이는 본원의 목적을 위한 원하는 특성을 갖추고 있다. 이를 3포트 바리캡 소자라고 한다. Varicaps (also known as varactors) provide another option. Although each varicap is a two-port device, two varicaps can be placed in a back-to-back configuration facing each other, as illustrated in Fig. 19. By inserting a voltage line between the two varicaps, the overall capacitance of the system can be adjusted. The device illustrated in Fig. 19 acts as a voltage-controlled capacitor with a total of three ports. It thus has the desired characteristics for the purposes of this application. It is referred to as a three-port varicap device.

또 다른 전략은 도 18에 도시된 스위칭 커패시터 뱅크를 사용하는 것이다. 외부 전압 신호가 이 커패시터 뱅크의 커패시턴스를 제어하고 그런고로 이는 전압 제어 커패시터라고 볼 수 있다. 이 접근법의 한 가지 단점은 도 18의 회로 장치를 실시간으로 켜고 끄는 과정이 필요하기 때문에 HMC 공정 중 에너지 손실(즉, 감쇠)이 발생할 수 있다는 것이다. Another strategy is to use a switched capacitor bank, as shown in Fig. 18. An external voltage signal controls the capacitance of this capacitor bank, and it can therefore be viewed as a voltage-controlled capacitor. One drawback of this approach is that the circuit devices of Fig. 18 need to be turned on and off in real time, which may result in energy loss (i.e., attenuation) during the HMC process.

트랜지스터, 3포트 바리캡 소자, 및 스위칭 커패시터 뱅크는 모두 전압 제어 커패시터라고 볼 수 있다. 이들 각 전압 제어 커패시터 각각은 고차 결합의 구성 블록으로서 역할을 할 수 있다. 즉, 이들 3포트 소자의 세트들을 연쇄 연결(chaining)함으로써 n포트 소자를 구성할 수 있다. 이들 n포트 소자들은 그러면 n체 결합을 설계 구현하는 것을 가능하게 한다. Transistors, 3-port varicap elements, and switching capacitor banks can all be viewed as voltage-controlled capacitors. Each of these voltage-controlled capacitors can act as a building block of higher-order coupling. That is, by chaining sets of these 3-port elements, an n -port element can be formed. These n- port elements then enable the design and implementation of an n- body coupling.

16.1.6 결합에 조정성 또는 스위치 추가16.1.6 Adding Tunability or Switches to a Bond

3체 또는 n체 결합에 조정성을 추가하면 하드웨어 장치가 n체 항들을 가지는 매우 다양한 확률 분포를 표현하는 것을 허용할 수 있다. Adding tunability to 3-body or n -body combinations would allow hardware devices to represent a wide variety of probability distributions with n -body terms.

n체 결합기에 조정성을 추가하는 것이 어려울 수 있지만, 더 간단한 접근법은 결합기에 스위치들을 추가하는 것이다. 스위치들은 n체 결합을 끄거나 켠다. 사용자는 이들 스위치의 방향을 선택함으로써 확률 분포를 지정할 수 있다. 이는 비교적 구현하기 쉬운 거친 세밀도의 조정성(coarse-grained degree of tunability)을 제공한다.Adding tunability to an n- body combiner can be challenging, but a simpler approach is to add switches to the combiner. The switches turn the n- body combiner on or off. The user can specify the probability distribution by choosing the direction of these switches. This provides a coarse-grained degree of tunability that is relatively easy to implement.

16.16. 2 세2 years old 개의 Dog's 결합된Combined 단위 셀unit cell

도 47은 전압 제어 커패시터에 의해 매개되는 3체 결합의 개략도를 도시한다. Figure 47 illustrates a schematic diagram of a three-body coupling mediated by a voltage-controlled capacitor.

여기서 세 개의 단위 셀 각각에서 (접지를 기준으로) 각 커패시터와 연관된 전압을 추출한다. 이들 세 전압은 3체 결합기의 세 포트에 입력으로 피드된다. 예를 들어, 3체 결합기가 트랜지스터이면, 한 전압은 트랜지스터의 게이트에 피드되며, 한 전압은 소스에 피드되고, 한 전압은 드레인에 피드된다. 3체 결합기를 전압 제어 커패시터(VCC)라고 쓰며, 이 VCC에 대해 다양한 물리적 구현예가 가능하다고 가정한다(위에서 논의된 바와 같이). Here, we extract the voltages associated with each capacitor (with respect to ground) from each of the three unit cells. These three voltages are fed as inputs to the three ports of the three-body coupler. For example, if the three-body coupler is a transistor, one voltage is fed to the gate of the transistor, one voltage is fed to the source, and one voltage is fed to the drain. We denote the three-body coupler as a voltage-controlled capacitor (VCC), and assume that there are various physical implementations of this VCC (as discussed above).

다음 하위 섹션에서 이 결합이 샘플링되는 확률 분포에 어떻게 영향을 미치는지를 분석한다. In the following subsections, we analyze how this combination affects the probability distribution being sampled.

16.2.1 세 개의 결합 셀의 수학적 설명16.2.1 Mathematical description of three combined cells

용량성 결합된 두 개의 단위 셀의 경우, 퍼텐셜 에너지에 대한 기여분은 U = V 1 V 2 C 12의 형태를 갖는다. 이제 C 12가 세 번째 단위 셀의 전압 V 3의 함수라고 가정하며, 세 번째 단위 셀은 도 47에서 묘사된 경우이다. 그러면 퍼텐셜 에너지에 대한 기여분은 U = V 1 V 2 C 12(V 3)이며 여기서 C 12(V 3)는 전압 제어 커패시터의 물리적 성질에 의해 결정되는 함수이다.For two capacitively coupled unit cells, the contribution to the potential energy has the form U = V 1 V 2 C 12 . Now assume that C 12 is a function of the voltage V 3 of the third unit cell, which is the case depicted in Fig. 47. Then the contribution to the potential energy is U = V 1 V 2 C 12 ( V 3 ), where C 12 ( V 3 ) is a function determined by the physical properties of the voltage-controlled capacitor.

예를 들어, 이것이 종종 작은 전압 범위에서 참인 선형 함수라고 가정한다. 이 경우, 이다. 그러면 퍼텐셜 에너지에 대한 기여분은 다음과 같다.For example, suppose that this is a linear function that is often true over a small voltage range. In this case, Then, the contribution to potential energy is:

따라서 이 경우 퍼텐셜 에너지에서 두 가지 항을 얻는다: (1) C123에 비례하는 3체 항, 및 (2) 에 비례하는 2체 항.So in this case we get two terms in the potential energy: (1) a three-body term proportional to C 123 , and (2) A two-body term proportional to .

섹션 13.4.3에서, 퍼텐셜 에너지의 3체 항들과 대응하는 확률 분포 P(x)에서의 3차 큐뮬런트들(k 3로 표시됨) 간의 수학적 연결을 확립하였다. 따라서 식 (98)은 3차 큐뮬런트를 갖는 비가우시안인 확률 분포 P(x)를 생성한다. 그런고로 3체 결합 접근법을 사용하여 확률 분포 P(x)를 비가우시안인 것으로 설계 구현할 수 있다. In Section 13.4.3, we established a mathematical connection between the three-body terms in the potential energy and the third-order cumulants (denoted by k 3 ) in the corresponding probability distribution P ( x ). Thus, equation (98) generates a probability distribution P ( x ) that is non-Gaussian with a third-order cumulant. Therefore, we can design and implement the probability distribution P ( x ) to be non-Gaussian using the three-body coupling approach.

16.3 네 개 이상의 단위 셀 결합16.3 Combining four or more unit cells

도 48은 4개의 단위 셀이 4체 결합기를 이용하여 결합될 수 있는 방법에 대한 회로도를 도시한다. 세 번째 단위 셀과 네 번째 단위 셀의 전압들인 V 3V 4는 전압 증배기에 피드되고, 전압 증배기 출력은 V = V 3 V 4의 곱이다. 전압 증배기는 아래에 자세히 설명되는 바와 같이 아날로그 또는 디지털일 수 있다. 그러면 이 전압V는 전압 제어 커패시터의 게이트에 인가되며 이를 통해 단위 셀 1과 2 사이에 커패시턴스 C 12(V 3 V 4)가 발생한다. Figure 48 illustrates a schematic of how four unit cells can be combined using a four-body combiner. The voltages of the third and fourth unit cells, V 3 and V 4 , are fed to a voltage multiplier, the output of which is the product of V = V 3 V 4 . The voltage multiplier may be analog or digital, as described in detail below. This voltage V is then applied to the gate of a voltage-controlled capacitor, which induces a capacitance C 12 ( V 3 V 4 ) between unit cells 1 and 2.

C 12(V 3 V 4)는 복잡한 함수가 될 수 있지만, 이것이 형태의 어떤 영역에 대한 선형 함수라고 가정한다. 이 경우, 다음 형태의 퍼텐셜 에너지에 대한 기여분을 얻는다: C 12 ( V 3 V 4 ) can be a complex function, but this Assuming that it is a linear function over some domain of the form, in this case we obtain a contribution to the potential energy of the form:

따라서, 이 구현예를 통해 4체 결합과 2체 결합 둘 다를 얻는다. Thus, through this implementation we obtain both four-body bonding and two-body bonding.

섹션 13.4.3에서, 퍼텐셜 에너지의 4체 항들과 대응하는 확률 분포 P(x)에서의 4차 큐뮬런트들(k 4로 표시됨) 사이의 수학적 연결을 확립했다. 그런고로 이 접근법을 사용하여 4차 큐뮬런트를 갖는 비가우시안인 확률 분포 P(x)를 얻는다. In Section 13.4.3, we established a mathematical connection between the four-body terms in the potential energy and the fourth-order cumulants (denoted by k 4 ) in the corresponding probability distribution P ( x ). Hence, using this approach, we obtain a non-Gaussian probability distribution P ( x ) with a fourth-order cumulant.

도 48에 도시된 접근법은 5개 이상의 셀(n > 4)을 결합하도록 직접적인 방식으로 확장될 수 있다. 이는 전압 증배기에 추가 입력을 피드하여서, n-2개 전압이 함께 곱하여져 n체 결합기의 전압 제어 커패시터 게이트에 궁극적으로 인가되는 전압을 얻는 과정을 수반한다. 퍼텐셜 에너지의 n체 결합들과 확률 분포 P(x)의 n차 큐뮬런트들 간의 수학적 연관성으로 인해, 결과적인 분포는 비가우시안 분포이며 n차 큐뮬런트(다른 가능한 저차 큐뮬런트들을 포함)를 가진다.The approach illustrated in Fig. 48 can be straightforwardly extended to combine more than five cells ( n > 4). This involves feeding an additional input to the voltage multiplier, such that the n -2 voltages are multiplied together to obtain the voltage ultimately applied to the voltage-controlled capacitor gate of the n- body coupler. Due to the mathematical connection between n- body combinations of potential energy and n -th order cumulants of the probability distribution P ( x ), the resulting distribution is non-Gaussian and has an n- th order cumulant (including other possible lower order cumulants).

16.4 16.4 다체Multi-body 결합에 대한 아날로그 대 디지털-아날로그 접근법Analog vs. Digital-Analog Approach to Coupling

16.4.1 완전 아날로그 접근법16.4.1 Fully Analog Approach

원칙적으로 도 47 및 도 48에 도시된 부품들은 아날로그 소자들일 수 있는데, 전압 제어 커패시터들 및 전압 증배기들 양쪽 모두가 아날로그 부품들로 구성될 수 있기 때문이다. 이는 디지털 장치와의 통신을 수반하지 않기 때문에 레이턴시가 짧다는 장점이 있다. 더욱이, 이는 더 큰 속도 향상으로 이어질 수 있는데, 전압들을 곱하는 것이(아날로그 장치에서는 그렇지 않지만) 디지털 장치에서는 약간의 계산 오버헤드를 발생하기 때문이다. In principle, the components shown in Figs. 47 and 48 can be analog components, since both the voltage control capacitors and the voltage multipliers can be constructed from analog components. This has the advantage of low latency, since no communication with a digital device is involved. Furthermore, this can lead to greater speedups, since multiplying voltages incurs some computational overhead in a digital device (but not in an analog device).

그러나 완전 아날로그 접근법은 2체 결합 사례보다 회로 소자들이 더 많다. 예를 들어, 3체 결합 사례에서 이들 회로 소자는 세 번째 단위 셀을 두 개의 다른 단위 셀의 커패시터의 입력에 배선하는 것과 연관된 인프라스트럭처를 포함한다. 4체 결합 사례에서 전압 증배기와 연관된 인프라스트럭처도 있다. 그런고로 완전 아날로그 접근법은 회로 복잡도를 증가시킬 수 있다. However, the fully analog approach has more circuit elements than the two-body coupling case. For example, in the three-body coupling case, these circuit elements include the infrastructure associated with wiring the third unit cell to the inputs of the capacitors of the two other unit cells. In the four-body coupling case, there is also infrastructure associated with the voltage multiplier. Therefore, the fully analog approach can increase the circuit complexity.

16.4.2 디지털-아날로그 접근법16.4.2 Digital-to-Analog Approach

다체 결합에 대한 편리한 접근법은 2체 결합을 이용하는 HMC 하드웨어를 구현하기 위해 이미 마련되어 있는 기존 인프라스트럭처를 사용하는 것이다. 즉, 섹션 8은 2체 사례에서 전압 제어 커패시터를 사용하는 것을 설명하는데, 여기서 디지털 하드웨어는 커패시턴스 값을 설정하기 위해 사용된다. A convenient approach to multibody coupling is to use existing infrastructure that is already in place to implement HMC hardware that exploits two-body coupling. That is, Section 8 describes the use of voltage-controlled capacitors in the two-body case, where digital hardware is used to set the capacitance value.

3체 결합의 경우, 전압 측정값 V 3는 세 번째 단위 셀에서 가져와지고 디지털 하드웨어에 입력으로서 전송될 수 있으며, 디지털 하드웨어는 V 3에 비례하는 전압을 출력하고 이 전압을 단위 셀 1과 2를 연결하는 커패시터에 인가한다. 그런고로 디지털 하드웨어는 단위 셀 1과 2 사이의 커패시터와 단위 셀 3 사이의 중개자로서 역할을 한다. In the case of a 3-body combination, the voltage measurement V 3 can be taken from the third unit cell and sent as an input to the digital hardware, which outputs a voltage proportional to V 3 and applies this voltage to the capacitor connecting unit cells 1 and 2. Thus, the digital hardware acts as an intermediary between the capacitor between unit cells 1 and 2 and unit cell 3.

4체 결합의 경우, 디지털 하드웨어가 전압 V 3V 4의 곱을 계산한다는 점을 제외하면, 동일한 접근법을 취할 수 있다. 디지털 하드웨어는 V 3 V 4에 비례하는 전압을 출력하고 이 전압을 단위 셀 1과 2를 연결하는 커패시터에 인가한다. For the four-body combination, the same approach can be taken, except that the digital hardware computes the product of the voltages V 3 and V 4 . The digital hardware outputs a voltage proportional to V 3 V 4 and applies this voltage to the capacitor connecting unit cells 1 and 2.

이번에도, 이 접근법의 한 가지 이점은 2체 결합을 이용하여 HMC를 구현하기 위해 이미 마련되어 있는 인프라를 활용한다는 것이다. Again, one advantage of this approach is that it leverages infrastructure that already exists to implement HMC using two-body coupling.

16.5 로컬 연결 전략16.5 Local Connection Strategy

원칙적으로 하드웨어는 완전한 연결성(글로벌 연결성)을 허용하도록 설계될 수 있다. 연결 수는 이 경우에 급격히 증가하는데, n체 결합이 총 연결 수에 대해 d n 스케일링을 초래하기 때문이다. 하드웨어 복잡도와 속도 향상 사이에는 고려해야 할 상충 관계가 있으며, 연결 수가 많을수록 속도 향상 가능성이 더 커지지만 하드웨어는 더 복잡해진다. In principle, hardware can be designed to allow full connectivity (global connectivity). The number of connections increases rapidly in this case, since n- body coupling leads to d n scaling with respect to the total number of connections. There is a tradeoff to be considered between hardware complexity and speedup, with more connections potentially leading to greater speedup, but also more complex hardware.

이 상충 관계로 인해 로컬 연결성을 고려하는 것이 바람직할 수 있다. 로컬 연결에 대한 한 가지 접근법은 2체 결합에 사용되는 기존 인프라스트럭처를 활용하는 것이다. 즉, 다체 결합에 디지털-아날로그 접근법을 채용하고(바로 위에서 논의됨), 2체 결합을 위해 이미 마련되어 있는 어떤 연결 구조든지 이를 n체 결합을 위한 구조로서 동일하게 사용할 수 있다. 이 경우, n체 결합의 연결 구조는 2체 결합의 연결 구조와 일치한다. 그래서 2체 결합이 로컬이라면, n체 결합도 로컬이다. This tradeoff may make it desirable to consider local connectivity. One approach to local connectivity is to leverage the existing infrastructure used for two-body coupling. That is, we can adopt a digital-to-analog approach to many-body coupling (discussed immediately above), and use whatever interconnect structure is already in place for two-body coupling as the interconnect structure for n- body coupling. In this case, the interconnect structure of the n -body coupling will be identical to that of the two-body coupling. So if the two-body coupling is local, then the n- body coupling is also local.

대안적인 접근법은 2체의 연결 구조를 활용하지 않고 n체 연결 구조를 처음부터 설계하는 것이다. 여기서 도 49 및 도 50에 도시된 바와 같이, 3체 결합의 특수한 경우에 대해 이 접근법에 대한 몇 가지 전략을 제시한다. 도 49는 3체 결합을 정사각형 격자에 맞추는 방법을 보여주고, 도 50은 3체 결합을 육각형 격자에 맞추는 방법을 보여준다. An alternative approach is to design an n- body connection structure from scratch without utilizing a two-body connection structure. Here, we present several strategies for this approach for the special case of a three-body connection, as illustrated in Figures 49 and 50. Figure 49 shows how to fit a three-body connection into a square lattice, and Figure 50 shows how to fit a three-body connection into a hexagonal lattice.

17 속도 향상 분석17 Speed Improvement Analysis

17.1 디지털 HMC의 17.1 Digital HMC’s 런타임Runtime 분석 analyze

HMC 프로세스의 계산 복잡도에 대한 분석은 Handbook of Markov Chain Monte Carlo, 2.11 (2011)에서의 Neal 등의 "MCMC using Hamiltonian dynamics, "에서 발견될 수 있으며, 이는 다목적으로 전문이 본 개시에 참조에 의해 원용된다. 언급된 바와 같이, 시스템은 다음과 같이 해밀턴 방정식들을 통합하여 HMC를 수행한다: An analysis of the computational complexity of the HMC process can be found in Neal et al. , "MCMC using Hamiltonian dynamics," in Handbook of Markov Chain Monte Carlo , 2.11 (2011), which is hereby incorporated by reference in its entirety for all purposes. As noted, the system performs HMC by integrating the Hamiltonian equations as follows:

이것들은 벡터 미분 방정식들이며, 그런고로 d차원 벡터들을 이용하여 풀어야 할 d개 방정식이 있다.These are vector differential equations, and therefore and There are d equations to solve using d- dimensional vectors.

수치적으로 일반적인 적분 방법은 개구리도약(leapfrog) 적분기로, 이는 위치 및 운동량에 대한 업데이트들을 다음과 같이 제공한다: A numerically common integration method is the leapfrog integrator, which provides updates to position and momentum as follows:

최적의 경우 이러한 방정식들을 통합하는 수치적 복잡도는 O(dn t)로 주어지며 n t 은 시간 단계 수이다. 그러나 수치 적분을 수행하기 위해 각 방정식의 우변을 계산하는 것은 더 많은 비용이 들 수 있다. 실제로, 로그 확률을 계산하는 것은 샘플링되는 확률 분포의 형태에 따라 달라진다. 질량 행렬 M은 일반적인 경우 d × d 행렬이며, 그런고로 역행렬 계산 비용은 d 3개 단계로 스케일 조정된다. 그러나 대부분의 구현예에서 M은 대각 행렬인 것으로 간주되고 그 비용이 d로 줄어든다. In the optimal case, the numerical complexity of integrating these equations is given by O ( dn t ), where n t is the number of time steps. However, computing the right-hand side of each equation to perform numerical integration can be more expensive. In practice, computing the log-probability depends on the shape of the probability distribution being sampled. The mass matrix M is in the general case d × d matrix, and therefore the cost of computing the inverse matrix scales by d 3 steps. However, in most implementations, M is considered to be a diagonal matrix, and the cost is reduced by d .

특정 이론에 얽매이지 않고 수치 적분 오차를 충분히 낮게 유지하기 위해, 수치 적분에 사용되는 시간 단계 크기 d 1/4로서 스케일 조정되어야 한다. 따라서 로그 확률의 기울기가 효율적으로 얻어지고 질량 행렬 M이 대각 행렬이고 그런고로 그 역행렬이 d 단계들로 계산된다고 가정함으로써 d 5/4의 수치적 스케일링에 도달한다. (실제로 확률 분포가 신경망에 의해 표현된다면, 기울기를 구하는 복잡도는 모델의 파라미터 수와 입력 크기에 따라 다항식적으로 증가할 것이다.) In order to keep the numerical integration error sufficiently low without being tied to a specific theory, the time step size used for numerical integration should be scaled as d 1/4 . Thus, the gradient of the log probability is obtained efficiently, and we reach a numerical scaling of d 5/4 by assuming that the mass matrix M is diagonal and therefore its inverse is computed in d steps. (In fact, if the probability distribution were represented by a neural network, the complexity of finding the gradient would grow polynomially with the number of parameters in the model and the size of the input.)

이러한 의미에서 d 5/4 스케일링은 HMC의 디지털 구현을 위한 최적의 스케일링이다. M의 희소성 구조가 공지되지 않은 경우들에서, O(d 3) 단계들에 비용이 드는 콜레스키 인수분해와 같은 조밀 행렬 역행렬 계산이 사용될 수 있다. 다음 섹션들에서 본 발명의 하드웨어를 사용하여 얻을 수 있는 구체적인 속도 향상을 살펴본다. In this sense, the d 5/4 scaling is the optimal scaling for digital implementation of HMC. In cases where the sparsity structure of M is not known, dense matrix inverse computations such as Cholesky factorization, which costs O ( d 3 ) steps, can be used. In the following sections, we examine the specific speedup that can be achieved using the hardware of the present invention.

17.2 아날로그 HMC 17.2 Analog HMC 런타임Runtime

일반적인 사례에서, 아날로그 시스템에서 미분 방정식을 구현하는 것으로부터 얻는 속도 향상은 다음 두 가지 주요 영역에서 비롯된다: (i) 방정식들을 이산화할 필요가 없고 그런고로 단계 크기가 필요 없으며, 이는 단계 크기에서 발생하는 수치적 오류가 사라짐을 의미한다. (전기적 하드웨어에서, 열 잡음 및 샷 잡음(shot noise)과 같이 성능에 영향을 미칠 수 있는 추가적인 잡음원이 있을 것이다.) (ii) 미분 방정식을 수치적으로 풀기 위해, 이를테면 개구리도약 적분 방식을 이용하여 업데이트의 항들을 계산한다. 아날로그에서, 시스템은 자연스럽게 미분 방정식을 따른다. 그런고로 행렬 곱셈과 역행렬 계산을 수행할 필요가 없어 연산 횟수가 크게 줄어든다. In general cases, the speedup obtained from implementing differential equations in an analog system comes from two main areas: (i) there is no need to discretize the equations and therefore no step size, which means that the numerical error introduced by the step size disappears. (In electrical hardware, there may be additional sources of noise that can affect performance, such as thermal and shot noise.) (ii) the differential equations are solved numerically, for example using frog-hop integration to compute the update terms. In analog, the system naturally follows the differential equations, so there is no need to perform matrix multiplications and inversions, which greatly reduces the number of operations.

추가적인 미묘한 점은 기울기 계산이다. 확률 분포의 형태에 의존하여, 이는 아날로그 HMC 장치에 의해 얻어지는 속도 향상에 영향을 미칠 수 있다. 이는 위의 섹션 14.7에서 자세히 설명한다. An additional subtlety is the gradient calculation. Depending on the shape of the probability distribution, this can affect the speedup achieved by analog HMC devices. This is discussed in detail in Section 14.7 above.

이상적인 경우, d차원 객체에 대해 아날로그 SDE 솔버를 구현하기 위한 디지털 연산 수는O(1)이다. 그러나 예를 들면 입력들을 설정하고 출력을 측정하기 위해 아날로그 솔버와 디지털 방식으로 통신해야 한다. 충분히 작은 데이터(수십 메가바이트 정도임)의 경우, 데이터는 아날로그 시스템에 O(1) 단계들로 로드할 수 있다. 그러나 데이터 크기가 증가함에 따라 차원 수 d에 대한 선형 스케일링이 나타난다. 그러므로 아날로그 솔버의 최상의 시나리오 스케일링은 O(1)이라고 생각한다. In the ideal case, the number of digital operations to implement an analog SDE solver for a d- dimensional object is O (1). However, one must communicate digitally with the analog solver, for example, to set inputs and measure outputs. For sufficiently small data (tens of megabytes), the data can be loaded into the analog system in O (1) steps. However, as the data size increases, there is a linear scaling with the dimensionality d . Therefore, we believe that the best-case scaling for an analog solver is O (1).

17.3 17.3 가우시안Gaussian 샘플링 속도 향상Increased sampling rate

샘플링되는 확률 분포가 위에서 제시된 바와 같이 다변량 가우시안이라면, 기울기의 형태는 분석적으로 계산될 수 있다. 확률 분포는 다음과 같이 정의된다는 것을 상기한다: If the probability distribution being sampled is multivariate Gaussian as suggested above, the form of the slope can be computed analytically. Recall that the probability distribution is defined as follows:

로그 확률의 기울기는 다음과 같이 아핀 형태로 표현될 수 있다: The slope of the log odds can be expressed in affine form as follows:

그러므로 기울기 계산은 벡터-행렬 곱셈을 수행하는 것과 같으며, 여기서 관련 행렬은 공분산 행렬의 역행렬이다. 이는 가우시안 분포에 대한 디지털 HMC의 실행 시간이 O(d 3)임을 나타낸다. Therefore, computing the gradient is equivalent to performing a vector-matrix multiplication, where the relevant matrix is the inverse of the covariance matrix. This shows that the running time of digital HMC for Gaussian distribution is O ( d3 ).

그러나 분포가 다변량 가우시안이라면, 콜레스키(Cholesky) 샘플링으로 알려진 더 효율적인 샘플링 방법이 있다. 콜레스키 샘플링의 요령은 확률 변수들을 로서 파라미터화하는 것이며(확률 변수 가 평균이 0임을 상기함), 단 이다. 공분산 행렬은 다음과 같이 쓸 수 있으며However, if the distribution is multivariate Gaussian, there is a more efficient sampling method known as Cholesky sampling. The trick with Cholesky sampling is to It is parameterized as (random variable) (recall that the mean is 0), but The covariance matrix can be written as follows:

여기서 콜레스키 분해는 마지막 항으로서 식별된다. 그러므로 에서 직접 랜덤으로 샘플링할 수 있고(u i 는 독립적이기 때문임) 이 샘플링 후 콜레스키 인수 L을 곱함으로써 부터 샘플링할 수 있다. 그러므로 콜레스키 샘플링은 일반적인 경우 적어도 공분산 행렬의 전체 역행렬을 계산하는 것만큼 효율적이다. 이는 공분산 행렬의 구조에 따라 크게 달라진다. Here the Cholesky decomposition is identified as the last term. Therefore, can be sampled directly at random from (since u i are independent) and then multiplied by the Cholesky factor L after sampling. can be sampled from. Therefore, Cholesky sampling is generally at least as efficient as computing the full inverse of the covariance matrix. This depends greatly on the structure of the covariance matrix.

17.3.1 고밀도 공분산 행렬의 속도 향상17.3.1 Speedup of dense covariance matrices

고밀도 공분산 행렬의 경우, 콜레스키 분해는 O(d 3) 단계들로 수행된다. 가우시안 프로세스와 같은 많은 응용 분야에서 공분산 행렬은 여러 번 업데이트되고 다시 샘플링되며, 따라서 공분산 행렬의 구조가 변경된다. 이는 많은 응용 분야에서 공분산 행렬이 조밀하다고 가정함을 의미한다. 이 경우, 아날로그 시스템이 완전 연결에 가까운 경우, 즉 연결성 kd로서 스케일링되는 경우 O(d 3)의 속도 향상을 얻을 수 있다. 그 경우가 아니라면, 커패시턴스 행렬이 공분산 행렬과 일치하도록 커패시턴스 값들을 업데이트할 때, 제한된 연결성 때문에 공분산 행렬의 대부분의 값들이 억제되며, 그런고로 HMC 제안의 수용률이 불리하게 스케일 조정될 수 있다. 공분산 행렬이 조밀하지만 가장 큰 요소와 가장 작은 요소의 차이가 많은 자릿수인 경우, 조밀한 공분산 행렬은 전처리 단계에 의해 희소해지게 만들 수 있다. 이 단계는 O(d 2) 연산들을 수행해야 하며, 희소 행렬과 잠재적 밴드형 행렬들을 얻을 수 있다. 이 단계는 디지털 방식뿐만 아니라 아날로그 방식에 대해서도 수행될 수 있으며, 병목 현상이 될 수 있다. 그런고로 연결성 k∼O (1)의 경우, 가우시안 샘플링에 아날로그 HMC를 사용해도 속도 향상을 얻을 수 없다. For dense covariance matrices, Cholesky decomposition is performed in O ( d3 ) steps. In many applications , such as Gaussian processes, the covariance matrix is updated and resampled many times, thus changing the structure of the covariance matrix. This means that in many applications , the covariance matrix is assumed to be dense. In this case, a speedup of O ( d3 ) can be achieved if the analog system is close to fully connected, i.e., the connectivity k scales as d . Otherwise, when updating the capacitance values so that the capacitance matrix matches the covariance matrix, most of the values in the covariance matrix are suppressed due to the limited connectivity, and thus the acceptance rate of the HMC proposal may be scaled unfavorably. If the covariance matrix is dense but the difference between the largest and smallest elements is many orders of magnitude, the dense covariance matrix can be sparse by a preprocessing step. This step requires O ( d2 ) operations, and can obtain sparse matrices and latent band matrices. This step can be performed not only in digital mode but also in analog mode, and can be a bottleneck. Therefore, for the case of connectivity k∼O (1), using analog HMC for Gaussian sampling does not yield any speedup.

17.3.2 대각 및 희소 공분산 행렬의 속도 향상17.3.2 Speedup for diagonal and sparse covariance matrices

만약 공분산 행렬이 대각 행렬이거나, 또는 동등하게 확률 변수들 가 상관 관계가 없다면, 역행렬 계산의 비용은 단순히 O(d)인데, 공분산 행렬이 d 차원 벡터와 동등하기 때문이다. 이 분포로부터 샘플들을 추출하는 것은 d 독립 가우시안 분포들로부터 샘플들을 추출하는 것과 동일하고 그러므로 비용은 O(d)이다. 그러므로 커패시턴스 행렬이 대각 행렬(그래서 셀들은 결합해제됨)인 아날로그 하드웨어를 사용함으로써 O(d)의 속도 향상을 기대한다. If the covariance matrix is diagonal, or equivalently the random variables If are uncorrelated, the cost of computing the inverse is simply O ( d ), since the covariance matrix is equivalent to a d -dimensional vector. Drawing samples from this distribution is equivalent to drawing samples from d independent Gaussian distributions, and therefore costs O ( d ). Therefore, we expect a speedup of O ( d ) by using analog hardware where the capacitance matrix is diagonal (so the cells are decoupled).

공분산 행렬이 희소 행렬이면, 가장 효율적인 전략은 희소 행렬을 밴드형 행렬로 변환하는 것이며, 밴드형 행렬은 주 대각선과 0이 아닌 k개 중앙 대각선들을 가진다(k = 1이면, 그 행렬은 삼중 대각 행렬이다). 희소 행렬의 0이 아닌 n nz 개 요소들을 정렬함으로써, 컷힐-맥키 프로세스를 사용하여 선형 런타임에서 밴드형 행렬을 얻을 수 있다. If the covariance matrix is sparse, the most efficient strategy is to convert the sparse matrix into a banded matrix, which has a main diagonal and k nonzero central diagonals (if k = 1, the matrix is tridiagonal). By sorting the n nz nonzero elements of the sparse matrix, the banded matrix can be obtained in linear runtime using the Cuthill-McKee process.

이는 희소 행렬들이 이미 밴드형 행렬들인 특수한 경우로 이어지며, 이 밴드형 행렬의 주 대각선과 k개 중앙 대각선은 모두 0이 아니다(k = 1인 경우 행렬은 삼중대각 행렬이다). 이 경우, 콜레스키 인수분해는 O(k 2 d) 단계들로 수행될 수 있다. 콜레스키 분해는 행렬의 밴드 구조를 보존하며, 그런고로 콜레스키 샘플링에서 사용되는 최종 행렬 벡터 곱은 O(kd)이다. HMC 아날로그 장치의 연결성으로 인해, 밴드형인 공분산 행렬들은 구현하기에 가장 자연스러운 것들이다. 그러므로 이 경우 O(k 2 d)의 아날로그 HMC에 의해 주어지는 속도 향상을 기대한다.This leads to the special case that sparse matrices are already banded matrices, whose main diagonal and the k central diagonals are all non-zero (for k = 1 the matrix is tridiagonal). In this case, Cholesky factorization can be done in O ( k 2 d ) steps. The Cholesky factorization preserves the band structure of the matrix, and therefore the final matrix-vector product used in Cholesky sampling is O ( k d ). Due to the interconnectivity of HMC analog devices, banded covariance matrices are the most natural ones to implement. Hence, in this case we expect a speedup given by analog HMC of O ( k 2 d ).

17.4 고차 상관관계 17.4 Higher order correlations 텐서들을The tensors 갖는 분포에 대한 속도 향상 Speedup for distributions with 텐서Tensor

이제 비자명한 고차 큐뮬런트들(2차 이상)을 갖는 섭동 분포들의 맥락에서 잠재적인 속도 향상을 고려하며; 이를 위해, 식 (78)에서 도입된 그람-샤를리에 A 급수를 통해 표현된 d차원 분포들에 초점을 맞춘다. 이러한 분포의 로그를 취하면, 퍼텐셜 에너지 함수는 d개 변수들의 다항식이다. 섭동 전개에 포함된 모든 k차 큐뮬런트는 퍼텐셜 에너지 함수에 k차의 동차 다항식을 도입한다. 이 다항식의 계수들은 k차 텐서를 통해 표현되며; 이와 같이, 가장 높은 비자명한 큐뮬런트가 차수 K라면, 퍼텐셜 에너지 함수는 주도 차수(leading order) K의 다항식이다. We now consider potential speedups in the context of perturbation distributions with nontrivial higher-order cumulants (order 2 and higher); for this purpose, we focus on d-dimensional distributions expressed in terms of the Gram-Charlier A series introduced in (78). Taking the logarithm of such a distribution, the potential energy function is a polynomial of d variables. Every k-th order cumulant involved in the perturbation expansion introduces a homogeneous polynomial of order k into the potential energy function. The coefficients of this polynomial are expressed in terms of a k-th order tensor; thus, if the highest nontrivial cumulant is of order K, then the potential energy function is a polynomial of leading order K.

고차 큐뮬런트들로 인해 발생하는 잠재적 속도 향상은 이들 큐뮬런트가 고차 결합 또는 동등하게는 고차 텐서 상호 작용에 의해 도입된다는 사실에서 비롯될 것으로 예상된다. 이들 고차 텐서를 수반하는 계산들은 HMC에 대한 로그 확률의 기울기를 계산하는 데 사용될 수 있다. The potential speedup due to higher-order cumulants is expected to come from the fact that these cumulants are introduced by higher-order couplings or, equivalently, by higher-order tensor interactions. Computations involving these higher-order tensors can be used to compute the gradient of the log probability for HMC.

아날로그 하드웨어에서 일반적인 k차 큐뮬런트는 k차 텐서로 표현되는 k차 결합에 의해 도입된다. 그러므로 로그 확률의 기울기를 디지털 방식으로 계산하기 위해 연산자 수는 O(d k )로서 스케일 조정된다. 대조적으로, 아날로그 하드웨어에서 이들 상호 작용에 의해 도입된 동역학은 O(1)에서 자연스럽게 발생할 것이다. 이는 O(d k )의 잠재적 속도 향상이 발생한다. 이 분석은, 위에서 설명된 바와 같이, 진정한 다체 결합이 있는 경우에 적용된다. In analog hardware, a typical k- th order cumulant is introduced by a k-th order coupling, represented as a k - th order tensor. Therefore, to compute the gradient of the log probability digitally, the number of operators scales as O ( dk ). In contrast, in analog hardware, the dynamics introduced by these interactions will naturally occur in O (1). This gives a potential speedup of O ( dk ). This analysis applies to the case where there are genuine many-body couplings, as explained above.

다체 결합이 2체 결합들을 연쇄 연결함으로써 도입된 경우, 이들 동역학을 디지털 방식으로 시뮬레이션하는 동작들은 O(d 2)와 같이 진행된다. 다시 한번, 아날로그 사례에서, 물리적 동역학은 O(1)에서 실현될 수 있으며, 이는 예상된 O(d 2) 속도 향상으로 이어진다. When multibody coupling is introduced by chaining two-body couplings, the operations to digitally simulate these dynamics proceed in O ( d2 ). Again, in the analog case, the physical dynamics can be realized in O (1), leading to the expected O ( d2 ) speedup.

17.4.1 신경망에 의해 표현된 분포에 대한 속도 향상 17.4.1 Speedup for distributions represented by neural networks

섹션 10에서 논의된 이 접근법에서 특정 수의 속도 향상이 발생한다:This approach, discussed in Section 10, yields a number of speedups:

d 1/4 속도 향상은, 디지털 HMC에서 행해지는 바와 같이, 시간을 이산화할 필요가 없기 때문에 가능하며, 차원에 따라 시간 단계 수를 조정하게 된다. The d 1/4 speedup is possible because there is no need to discretize time as is done in digital HMC, and the number of time steps is adjusted according to the dimensionality.

조밀 신경망들에 대한 기울기 계산은(층당 뉴런 수 m이 입력 차원 d를 이용하여 스케일 조정된다면) 최대 O(d 3) 단계들까지 비용이 들 수 있으며, 여기서 유한 차분에 의해 아날로그 방식으로 수행된다. 여기서 메트로폴리스-헤이스팅 단계 덕분에 유한 차분으로 인해 도입된 오류는 다른 응용 분야에서만큼 해롭지 않다. Gradient computation for dense neural networks can cost up to O ( d3 ) steps (if the number of neurons per layer m is scaled with the input dimension d ), and is performed in an analogous way by finite differences. Here, thanks to the Metropolis-Hasting step, the error introduced by finite differences is not as detrimental as in other applications.

마지막으로, 수용/거부 단계 계산과 데이터 업로드/다운로드는 모두 아날로그 방식으로 수행될 수 있으며, 섹션 16.2에서 논의된 바와 같이 다수의 연산 O(d)를 억제할 수 있다. Finally, both the accept/reject step computations and the data upload/download can be performed in an analog fashion, avoiding the large number of operations O ( d ) as discussed in Section 16.2.

그러므로, 전체적으로, 신경망에 의해 표현된 확률 분포를 갖는 아날로그 HMC의 경우 d 13/4의 속도 향상을 기대한다. Therefore, overall, we expect a speedup of d 13/4 for analog HMC with probability distributions represented by neural networks.

18 하드웨어에서 대체 몬테카를로 프로세스 실행18 Running an Alternative Monte Carlo Process on Hardware

18.1 감쇠를 이용한 하드웨어의 현실적인 분석18.1 Realistic analysis of hardware using damping

지금까지 제시한 HMC 샘플링을 위한 프로토콜은 보존적이라고 가정되는 아날로그 회로 동역학의 궤적들을 이용하며; 이들 궤적은 목표 확률 분포로부터 샘플들을 생성하는 계산 프로토콜 내에서 차용된다. 이제 물리적 회로들에 대한 보다 현실적인 분석을 제공할 것이고, 실제 회로 동역학이 의도된 해밀토니안 동역학으로부터 크게 벗어날 때 이용될 수 있는 대체 프로세스들을 제시한다. The protocols for HMC sampling presented so far exploit trajectories of analog circuit dynamics that are assumed to be conservative; these trajectories are then borrowed from a computational protocol that generates samples from a target probability distribution. We now provide a more realistic analysis of physical circuits, and present alternative processes that can be used when the actual circuit dynamics deviate significantly from the intended Hamiltonian dynamics.

1차원 가우시안 샘플링에 사용되는 도 3의 LC 오실레이터 셀을 고려한다. 이 회로의 실제 동역학에 대한 첫 번째 근사로서, 커패시터 및 인덕터 둘 다에 저항기가 직렬로 연결된다. 이들 저항기가 저항 Rc 및 RL을 가지면, 회로는 유효 저항 R = R C + R L 인 직렬 RLC 회로처럼 동작할 것이다. 또한, 전압 신호 V(t)가 회로에 인가되고 단 V(0) = 0이라고 가정한다. Consider the LC oscillator cell of Fig. 3 used for one-dimensional Gaussian sampling. As a first approximation to the actual dynamics of this circuit, resistors are connected in series with both the capacitor and the inductor. If these resistors have resistances R c and R L , the circuit will behave as a series RLC circuit with effective resistance R = R C + R L . Also, assume that a voltage signal V ( t ) is applied to the circuit and that only V (0) = 0.

커패시터 C 상의 전하 q가 시스템의 위치 좌표로서 역할을 하는 한편, 인덕터를 통과하는 자속 LI가 켤레 운동량 좌표가 될 것이다. The charge q on the capacitor C will serve as the position coordinate of the system, while the magnetic flux LI through the inductor will be the conjugate momentum coordinate.

회로의 운동량 LI(t)의 시간 미분은 다음과 같은 미분 방정식에 의해 지정된다: The time derivative of the momentum LI ( t ) of the circuit is given by the following differential equation:

시간 t까지의 의 적분은 이 시점에 커패시터에 저장된 전하 q(t)와 같다. 이와 같이 ODE는 다음과 같이 다시 쓸 수 있다: Until time t The integral of is equal to the charge q ( t ) stored in the capacitor at this point. Thus, the ODE can be rewritten as:

(108)의 적분과 커패시터 상의 전하 사이의 이 관계로부터, 다음과 같이 q(t)의 시간 미분이 I(t)임을 알 수 있다:From this relationship between the integral of (108) and the charge on the capacitor, we can see that the time derivative of q ( t ) is I ( t ), as follows:

결합된 동역학 방정식 (109) 및 (110)을 정리하면, 다음에 도달한다: By rearranging the coupled dynamic equations (109) and (110), we arrive at:

운동량 p = LI을 라벨 표시하고 점 표기법을 사용하면, 상기한 결합된 방정식은 다음과 같이 축약된다: Labeling the momentum p = LI and using dot notation, the above combined equations are reduced to:

용어-Rp는 운동량에서 선형적인 소산력을 나타내며, 이 소산력은 보존계에는 존재하지 않는다. Terminology- Rp represents a linear dissipative force in momentum, which does not exist in conservative systems.

이제 전압원 V(t)의 특성에 대해 자세히 설명할 것이다. 이 전압원 신호가 사용자에 의해 제공된 결정론적 신호일 수 있지만, 기저 잡음 처리를 통해 시스템에 적용되는 확률적 전압 신호들에 집중한다. RLC 셀 동역학에 대한 현실적인 잡음 모델에 대한 첫 번째 근사로서, V(t)는 존슨 열 잡음으로부터 유래하며; 이 잡음은 특정 온도 T에서 유지되는 저항 R을 갖는 유효 저항기를 통해 거시적 전자 수집의 열적 교반으로 인해 발생한다. We now elaborate on the characteristics of the voltage source V ( t ). Although this voltage source signal can be a deterministic signal provided by the user, we focus on the stochastic voltage signals applied to the system through baseline noise treatment. As a first approximation to a realistic noise model for the RLC cell dynamics, V ( t ) comes from Johnson thermal noise; this noise is caused by thermal agitation of the macroscopic electron collection through an effective resistor with resistance R maintained at a certain temperature T.

존슨 잡음은 1차원 브라운 운동 W(t)와 확산 상수 D를 이용하여 적절하게 모델링될 수 있다. 즉, 약간의 표기법 남용을 통해 이다. 이를 방정식 (113)에 도입하는 경우, RLC 동역학이 다음과 같이 결합된 확률적 미분 방정식(SDE)에 의해 모델링된다는 것을 알 수 있다: Johnson noise can be appropriately modeled using the one-dimensional Brownian motion W ( t ) and the diffusion constant D , i.e., with a little abuse of notation. When we introduce this into equation (113), we see that the RLC dynamics is modeled by a coupled stochastic differential equation (SDE) as follows:

남은 것은 확산 상수 D의 유도이며; 이를 위해, 변동 소산 정리를 적용한다. 회로 시스템이 추종하는 변동 소산 정리에 따르면, 존슨 잡음의 확산 상수 D는 소산력의 계수 R(이는 바로 유효 저항임), 인덕턴스 L, 및 저항기 온도와 관련된다. 실제로 D는 다음과 같이 주어지며: All that remains is to derive the diffusion constant D; for this, we apply the variational dissipation theorem. According to the variational dissipation theorem, which the circuit system follows, the diffusion constant D of the Johnson noise is related to the coefficient of dissipation R (which is the effective resistance), the inductance L , and the temperature of the resistor. In fact, D is given by:

여기서 k는 볼츠만 상수이다. 이 관계를 통해 우리는 마침내 저감쇠된(underdamped) 랑주뱅 SDE로서 주어진 회로의 사실적인 동적 묘사에 도달한다; Here k is the Boltzmann constant. With this relation we finally arrive at a realistic dynamic description of the circuit given as an underdamped Langevin SDE;

그런고로 회로 동역학은, 위에서 가정된 바와 같이, 결정론적 프로세스가 아니라 확률적 프로세스이다. 더욱이, 확률적 동역학은 평형으로 수렴된다. 회로가 시간 t = 0에서 임의의 위치 q 0 및 임의의 운동량 p 0로 초기화된다고 가정하며; 평형으로 수렴함으로써, 이는 이 초기화 가 SDE(118)의 정상 분포(stationary distribution) π(q, p)에 따라 분포될 것임을 의미한다. 이 분포는 다음과 같이 풀 수 있다: Therefore, the circuit dynamics is a stochastic process, not a deterministic process, as assumed above. Moreover, stochastic dynamics converge to equilibrium. Suppose that the circuit is initialized at time t = 0 with an arbitrary position q 0 and an arbitrary momentum p 0 ; by converging to equilibrium, this initialization This means that it will be distributed according to the stationary distribution π( q , p ) of SDE(118). This distribution can be solved as follows:

운동량 좌표 p에 대해 주변화(marginalization)하면, 위치 좌표(커패시터 상의 전하)의 평형 분포는 볼츠만 분포로서 주어진다:When marginalizing with respect to the momentum coordinate p , the equilibrium distribution of the position coordinate (charge on the capacitor) is given by the Boltzmann distribution:

RLC 시스템의 볼츠만 분포는 평균이 0이고 분산이 kTC인 단변량 가우시안 분포이며; 동적 궤적이 평형으로 수렴하도록 허용한다면, 회로의 위치 좌표(커패시터 상의 전하)를 반복적으로 측정하는 것은 이 단변량 분포로부터 샘플들을 추출하는 것과 같다. The Boltzmann distribution of an RLC system is a univariate Gaussian distribution with zero mean and kTC variance; if the dynamical trajectory is allowed to converge to equilibrium, repeated measurements of the position coordinates of the circuit (charge on the capacitor) are equivalent to sampling from this univariate distribution.

이제 위에서 사용된 확률적 회로 동역학을 사용하여 임의의 다변량 가우시안 분포로부터 샘플들을 추출하는 프로토콜을 제시한다. We now present a protocol to extract samples from an arbitrary multivariate Gaussian distribution using the stochastic circuit dynamics used above.

18.2 18.2 단변량Univariate 가우시안Gaussian 샘플링 프로토콜Sampling Protocol

RLC 시스템은 위치 및 운동량의 초기값들에 관계없이 평형으로 수렴한다는 점을 상기한다. 시스템의 평형은 위상 공간에서 정상 분포 π(q, p)에 의해 특성화된다. 이 평형 상태에서 RLC 회로를 준비하려고 하며, 이는 회로를 충분히 오랜 시간 동안 열탕과 접촉시키는 것과 같다. 회로의 평형 상태가 준비되는 경우, 회로의 위치 q 및 운동량 p(각각 커패시터 상의 전하 및 인덕터를 통과하는 자속)의 반복된 측정들은 π(q, p)에 따라 분포된다. 위치만을 측정하는 것은 시스템의 볼츠만 분포로부터 운동량 및 샘플에 대해 효과적으로 주변화하며, 이는 분산 kTC를 갖는 평균이 0인 가우시안 분포이다. 커패시턴스 C의 값을 조정하면 샘플들을 추출하는 볼츠만 분포의 분산을 변경한다; 임의의 σ² > 0에 대해 를 설정하면, 샘플링된 분포는 분산 σ 2을 가질 것이다. 평형 상태의 시스템이 외부에서 영향을 받지 않는 한 평형 상태를 유지하므로, 회로의 위치(커패시터의 전하)의 반복된 측정을 통해 볼츠만 분포로부터 무한히 많은 샘플들을 추출할 수 있다. Recall that an RLC system converges to equilibrium regardless of the initial values of the positions and momentums. The equilibrium of the system is characterized by a stationary distribution π ( q , p ) in phase space. We try to prepare the RLC circuit in this equilibrium state, which is equivalent to placing the circuit in contact with a hot water bath for a sufficiently long time. When the circuit is in equilibrium, repeated measurements of the position q and momentum p (the charge on the capacitor and the flux through the inductor, respectively) of the circuit are distributed according to π ( q , p ). Measuring only the position effectively marginalizes the momentum and samples from the Boltzmann distribution of the system, which is a zero-mean Gaussian distribution with variance kTC. Adjusting the value of the capacitance C changes the variance of the Boltzmann distribution from which the samples are drawn; for any σ² > 0. If we set , the sampled distribution will have variance σ 2 . Since a system in equilibrium will remain in equilibrium unless it is affected by an external source, we can extract an infinite number of samples from the Boltzmann distribution by repeated measurements of the positions of the circuit (charges on the capacitors).

샘플링된 볼츠만 분포의 분산을 조정할 수 있지만, 이 분포의 평균은 0으로 유지된다. 로 설정한다면, 각 위치 샘플에 고정된 평균값 μ를 더함으로써 단변량 정규 분포 로부터 샘플들을 추출할 수 있으며; 이는 RLC 회로에 μ 값의 정전압 바이어스를 적용함으로써 아날로그 방식으로 구현될 수 있지만, 디지털 방식으로도 수행될 수 있다. 이를 통해 임의의 단변량 분포들로부터 샘플들을 추출하는 프로토콜을 가질 수 있다. The variance of a sampled Boltzmann distribution can be adjusted, but the mean of this distribution remains zero. If set to , the univariate normal distribution is achieved by adding a fixed mean μ to each location sample. can extract samples from; this can be implemented in analog fashion by applying a constant voltage bias of μ to the RLC circuit, but can also be done digitally. This allows us to have a protocol for extracting samples from arbitrary univariate distributions.

18.3 다변량 18.3 Multivariate 가우시안Gaussian 샘플링 확장Sampling Extension

18.1에서 제공된 현실적인 분석이 하나의 RLC 셀에 대해 수행되었지만, 유사한 분석이 용량성 결합된 RLC 셀 네트워크에 대해서도 이어진다. N개의 RLC 셀이 결합 용량성 브리지들을 통해 쌍으로 결합된다고 가정하면, 시스템은 N차원 위치 벡터 와 N차원 운동량 벡터 에 의해 지정될 수 있다. 그러면 행렬 CL을 각각 섹션 3의 무손실 결합된 오실레이터의 커패시턴스 및 인덕턴스 행렬들로서 정의한다(즉, 저항기들이 없는 결합 LC 회로에서 행한 것과 유사하다). Although the realistic analysis presented in 18.1 was performed for a single RLC cell, a similar analysis is followed for a network of capacitively coupled RLC cells. Assuming that N RLC cells are coupled in pairs via capacitive bridges, the system has an N-dimensional position vector and N-dimensional momentum vector can be specified by . Then, we define matrices C and L as the capacitance and inductance matrices of the lossless coupled oscillator of Section 3, respectively (i.e., similar to what was done in the coupled LC circuit without resistors).

단일 단위 셀의 좌표 (q, p)가 2차원 위상 공간에서 저감쇠된 랑주뱅 동역학을 따르는 것처럼, 좌표계 는 2N차원 위상 공간에서 저감쇠된 랑주뱅 동역학을 따른다. 동역학이 다음과 같은 결합된 확률적 미분 방정식으로 주어진다고 가정하며: As the coordinates ( q , p ) of a single unit cell follow the underdamped Langevin dynamics in two-dimensional phase space, the coordinate system follows the underdamped Langevin dynamics in a 2N- dimensional phase space. We assume that the dynamics are given by the following coupled stochastic differential equations:

여기서 R은 네트워크의 저항들에 따라 달라지는 드래그 행렬(drag matrix)이고 D는 N차원 브라운 운동 W(t)를 곱한 확산 행렬이다. 단일 셀의 경우 마찰 계수가 확산 상수와 관련되는 것처럼, 결합된 경우에 드래그 행렬은 확산 행렬과 관련된다. 이는 변동-소산이 계속 적용 가능하기 때문이다. Here, R is a drag matrix that depends on the resistances of the network, and D is a diffusion matrix multiplied by the N-dimensional Brownian motion W ( t ). Just as the friction coefficient is related to the diffusion constant in the case of a single cell, the drag matrix in the coupled case is related to the diffusion matrix, since the variation-dissipation is still applicable.

다행히도, 결합된 RLC 네트워크의 동역학이 평형에 수렴한다는 것을 알기 위해 명시적인 형태의 드래그 행렬 및 확산 행렬을 알 필요는 없다. 단일 셀의 평형 분포(120)가 마찰 상수 및 확산 상수에 의존하지 않는 것처럼, 동역학(122)의 평형 분포는 드래그 또는 확산 행렬들에 의존하지 않다. RLC 네트워크의 각 저항기가 온도 T로 유지된다면, 위상 공간에 대한 평형 분포는 다음과 같이 정의된다: Fortunately, one does not need to know the explicit form of the drag and diffusion matrices to know that the dynamics of the coupled RLC network converges to equilibrium. Just as the equilibrium distribution (120) of a single cell does not depend on the friction and diffusion constants, the equilibrium distribution of the dynamics (122) does not depend on the drag or diffusion matrices. If each resistor in the RLC network is maintained at temperature T, the equilibrium distribution over the phase space is defined as:

운동량 좌표에 대해 주변화한다면, N차원 위치 공간에 대한 결과적인 볼츠만 분포는 다음과 같이 주어진다: If we marginalize in the momentum coordinate, the resulting Boltzmann distribution over the N-dimensional position space is given by:

이 분포는 평균이 0이고 공분산 행렬이 인 다변량 가우시안 분포이다. 이와 같이 평형 RLC 네트워크들의 위치 벡터 를 반복적으로 샘플링하는 것은 다변량 정규 분포 로부터 샘플들을 추출하는 것과 같다.This distribution has a mean of 0 and a covariance matrix of is a multivariate Gaussian distribution. The position vectors of equilibrium RLC networks are Repeated sampling of the multivariate normal distribution It is like extracting samples from .

그러면 임의의 다변량 가우시안 분포로부터 샘플들을 추출하는 프로토콜은 섹션 18.2의 프로토콜과 유사하게 수행될 수 있으며, 여기서 단일 커패시터를 조정하는 대신 커패시턴스 행렬 C의 값을 조정한다. 커패시턴스 행렬이 C= (1/kT)∑가 되도록 설정되면 샘플링된 볼츠만 분포는 평균이 0이고 공분산이 ∑일 것이다. 단변량 프로토콜과 마찬가지로, 동역학 전체에서 i 셀들 각각에 일정 전압 바이어스 μ i 를 적용함으로써 샘플링된 분포의 평균을 벡터 로 변경한다. 전압 바이어스가 없는 샘플을 추출하고 그 샘플에 벡터 를 디지털 방식으로 더하는 것도 동일한 효과를 낼 것이다. 이와 같이 결합된 RLC 네트워크의 확률적 동역학은 임의의 다변량 가우시안 분포로부터 샘플들을 추출하는 데 사용될 수 있다.Then, the protocol for sampling from an arbitrary multivariate Gaussian distribution can be performed similarly to the protocol of Section 18.2, but instead of adjusting a single capacitor, we adjust the value of the capacitance matrix C . If the capacitance matrix is set to C = (1/ kT )∑ , then the sampled Boltzmann distribution will have zero mean and covariance ∑ . As with the univariate protocol, by applying a constant voltage bias μ i to each of the i cells throughout the dynamics, we can obtain the mean of the sampled distribution as a vector Change to . Extract a sample without voltage bias and vectorize it to that sample. Adding them digitally would have the same effect. The probabilistic dynamics of such a combined RLC network can be used to sample from any multivariate Gaussian distribution.

18.4 확률적 기울기 18.4 Probabilistic Gradient 해밀토니안Hamiltonian 몬테카를로Monte Carlo

HMC 프로토콜에 사용된 단일 셀 오실레이터 셀에 대한 현실적인 분석을 제시하였으며, 이 회로 동역학이 해밀토니안 동역학과는 대조적으로 저감쇠된 랑주뱅 동역학을 겪는다는 것을 보였다. 디지털 방식으로 시뮬레이션된 저감쇠된 랑주뱅 동역학을 이용하는 프로세스를 제시한다. 비슷한 샘플링 프로토콜이 섹션 18.1에 제시된 저감쇠된 회로 동역학을 사용하여 수행될 수 있다. We present a realistic analysis of the single-cell oscillator cell used in the HMC protocol and show that the circuit dynamics undergo underdamped Langevin dynamics, in contrast to the Hamiltonian dynamics. We present a process that exploits the underdamped Langevin dynamics, digitally simulated. A similar sampling protocol can be performed using the underdamped circuit dynamics presented in Section 18.1.

HMC는 시스템의 해밀토니안 동역학을 디지털 방식으로 시뮬레이션하기 위해 퍼텐셜 에너지 함수의 기울기를 직접 계산하거나 접근하는 것을 수반한다. 아날로그 하드웨어의 경우 사용자가 확률 분포 p(x)를 나타내는 디지털 또는 아날로그 신경망을 가지는지 여부에 따라 정확한 기울기에 대한 액세스도 제한될 수 있다. HMC involves directly computing or accessing the gradient of the potential energy function to digitally simulate the Hamiltonian dynamics of the system. For analog hardware, access to the exact gradient may also be limited, depending on whether the user has a digital or analog neural network representing the probability distribution p ( x ).

확률적 기울기 HMC(SGHMC)는 이러한 과제를 해결하고 HMC의 확장성을 개선한다. SGHMC는 전체 데이터 세트보다 적은 데이터로 수행될 수 있는 확률적 기울기 계산의 사용을 도입하였다. 그러나 그 결과 도입된 동역학은 더 이상 원하는 분포에 의해 유도된 역학이 아니다. 그러므로 확률적 기울기에 의해 주입된 잡음의 효과를 상쇄하는 추가적인 마찰 항목이 포함된다. Stochastic gradient HMC (SGHMC) addresses these challenges and improves the scalability of HMC. SGHMC introduces the use of stochastic gradient computation, which can be performed with less than the full data set. However, the resulting dynamics are no longer those induced by the desired distribution. Therefore, an additional friction term is included to counteract the effects of noise injected by the stochastic gradient.

명시적으로 SGHMC에서 기울기는 전체 데이터 세트 의 미니뱃치를 사용하여 계산되어서, 이다. 데이터 포인트들 는 균일하게 샘플링되고 다음을 계산하는 데 사용된다:Explicitly in SGHMC the slope is the entire data set It is calculated using mini-batches, are data points is uniformly sampled and used to compute:

의 관찰이 독립적이라고 가정하면 중심 극한 정리를 적용하여 Assuming that the observations are independent, we apply the central limit theorem

다음 표현에 도달할 수 있으며: We can reach the following expression:

여기서 V는 확률적 경사 근사에서 나오는 확률적 경사 잡음의 공분산이다. 위에서 언급된 바와 같이, 이 용어의 등장을 막기 위해 마찰 항을 포함할 수 있다. 이는 마찰을 포함하는 SGHMC를 정의하는 다음과 같은 동역학 방정식으로 이어지며: Here, V is the covariance of the stochastic gradient noise from the stochastic gradient approximation. As mentioned above, we can include a friction term to prevent the appearance of this term. This leads to the following dynamic equations defining the SGHMC including friction:

여기서 M은 질량 행렬 ,는 확산 행렬, 는 힘 그리고 는 위너 과정(Wiener process)이다. 마찰 항의 포함으로 인해 확률적 잡음의 영향은 감소된다. 이는 목표 확률 분포 에 해당하는 긴 시간에 얻어진 의 정상 분포로 이어진다. Here, M is the mass matrix, is the diffusion matrix, is the power and is a Wiener process. The influence of stochastic noise is reduced due to the inclusion of friction terms. This is the target probability distribution Obtained over a long period of time corresponding to leads to a normal distribution.

18.4.1 18.4.1 SGHMC에At SGHMC 대한 접근법The Korean Approach

전체 훈련 세트가 아닌 훈련 데이터의 미니뱃치로부터 사후 확률 분포를 학습하는 가우시안 과정 회귀를 수행하는 것을 고려한다 이 미니뱃치형 사후 확률 분포의 로그를 실제 오실레이터 회로의 퍼텐셜 에너지 함수에 매핑하면, 실제 퍼텐셜 에너지 함수의 잡음 있는 버전을 얻을 수 있다. 오실레이터 회로의 퍼텐셜 에너지 함수가 역 커패시턴스 행렬 C -1에 의해 정의된 2차 형태이므로, 잡음은 이 행렬을 결정하는 커패시턴스 값들의 모형지정오류(misspecification)로 나타날 것이다. 학습 세트의 크기가 클 때, 중심 극한 정리는 임의의 하나의 커패시턴스 값의 잘못된 지정이 실제 값을 중심으로 대략 가우시안 분포된다는 점을 시사한다. Consider performing Gaussian process regression, which learns the posterior probability distribution from mini-batches of training data rather than the entire training set. If we map the log of this mini-batch posterior probability distribution to the potential energy function of the actual oscillator circuit, we obtain a noisy version of the actual potential energy function. Since the potential energy function of the oscillator circuit is a quadratic function defined by the inverse capacitance matrix C -1 , the noise will appear as a misspecification of the capacitance values that determine this matrix. When the training set size is large, the central limit theorem suggests that the misspecification of any single capacitance value will be approximately Gaussianly distributed around the actual value.

이 모형지정오류 잡음의 영향을 약화하고 실제 목표 분포로 수렴하기 위해, 디지털 SGHMC에서 행한 바와 같이 실제 오실레이터 회로의 마찰(저항)은 잡음 프로파일과 일치하도록 조정될 수 없다. 마찰을 조정할 수는 있지만, 변동-소산 관계는 마찰 조정이 시스템의 열 잡음을 비례적으로 조정할 것이라고 말하며; 이는 디지털 동역학에서 반드시 참이진 않지만, 회로 동역학에서 불가피할 수 있다. 따라서 물리적 오실레이터의 마찰 항목은 열 잡음의 영향과 모형지정오류 잡음의 영향을 감쇠시켜야 하지만, 열 잡음으로부터의 기여분들만을 감쇠시킬 수 있다. To attenuate the effects of this modeling error noise and converge to the actual target distribution, the friction (resistance) of the physical oscillator circuit cannot be adjusted to match the noise profile, as is done in digital SGHMC. The friction can be adjusted, but the fluctuation-dissipation relation states that adjusting the friction will proportionally adjust the thermal noise of the system; this is not necessarily true for digital dynamics, but may be inevitable for circuit dynamics. Therefore, the friction term of the physical oscillator should attenuate the effects of both thermal noise and modeling error noise, but can only attenuate the contributions from thermal noise.

이 문제를 피하기 위해, 마찰/저항이 높은 상황에서 작업할 수 있다. 이런 일이 일어나면, 모형지정오류 잡음에 의해 유도된 변동에 비해 훨씬 더 큰 열 변동을 가질 것이다. 이와 같이 열 잡음 및 모형지정오류 잡음 둘 다를 기술하는 잡음 프로필은 주로 열 잡음이기 때문에 마찰 항목에 따른 변동 소산을 대략적으로 충족한다. 이 관계가 대략적으로 충족되면 평형에 도달된다. 퍼텐셜의 잡음 부분이 잡음 항에 흡수되었기 때문에 볼츠만 분포는 진정한 비미니뱃치 퍼텐셜의 음의 지수, 즉 진정한 사후 확률 분포이다. 그러면 고저항 한계에서 섹션 18.3에 정의된 프로토콜을 사용하여 진짜 다변량 사후 확률을 샘플링한다. To avoid this problem, one can work in a high friction/resistance regime. When this happens, the thermal fluctuations will be much larger than the fluctuations induced by the model-mismatch noise. In this way, the noise profile describing both the thermal noise and the model-mismatch noise approximately satisfies the fluctuation dissipation with respect to the friction term, since the thermal noise is predominantly thermal. When this relation is approximately satisfied, equilibrium is reached. Since the noise part of the potential has been absorbed by the noise term, the Boltzmann distribution is the negative exponent of the true nonminibatch potential, i.e., the true posterior probability distribution. Then, in the high-resistance limit, the true multivariate posterior probability is sampled using the protocol defined in Section 18.3.

19 19 랑주뱅Langevin 몬테카를로를 위한 하드웨어Hardware for Monte Carlo

HMC의 변형에서는 개구리도약 단계 수가 L = 1로 설정된다. 이는 랑주뱅 몬테카를로라고 알려져 있고 다음에 의해 정의되며In a variation of HMC, the number of frog-jump steps is set to L = 1. This is known as Langevin Monte Carlo and is defined by

여기서 는 고정 시간 단계이고 이다. 이는 다음과 같은 확률적 미분 방정식의 이산화이며Here is a fixed time step It is a discretization of the following stochastic differential equation:

여기서 W는 표준 브라운 운동이다. t→∞인 한계에서, x는 정상 분포에 접근하며, 이는 p(x)에 의해 정의된 분포와 정확히 같다. 이는 분포 로부터 샘플들을 추출하는 매우 단순한 방법이며: 기울기를 사용할 수 있다. 실제로 이 아이디어는 잡음 조건부 점수 네트워크(Noise Conditional Score Network)라고 알려진 확산 모델들의 구성요소에 동기를 주었는데, 이들 네트워크가 데이터의 기본 밀도 함수의 기울기를 학습하는 것만으로 간단히 생성형 모델링을 수행할 수 있기 때문이다. 사실상, 랑주뱅 동역학은 가 고차원 벡터 공간(예컨대, 심층 신경망의 파라미터들)에 있는 응용 분야에서 점점 더 인기를 얻고 있다. Here W is the standard Brownian motion. In the limit as t→∞, x approaches a normal distribution, which is exactly the same as the distribution defined by p ( x ). This is the distribution A very simple way to extract samples from: we can use the gradient. In fact, this idea motivated a component of diffusion models known as Noise Conditional Score Networks, because these networks can perform generative modeling simply by learning the gradient of the underlying density function of the data. In fact, Langevin dynamics are increasingly popular in applications involving high-dimensional vector spaces (e.g., parameters of deep neural networks).

19.1 19.1 LMCLMC 하드웨어의 단위 셀Unit cell of hardware

LMC 하드웨어의 단위 셀(즉, 구성 블록)은 도 51에 도시되어 있다. A unit cell (i.e., a building block) of the LMC hardware is illustrated in Figure 51.

이는 HMC에 사용되는 단위 셀과 다른데, 이는 인덕터 없이도 작동할 수 있기 때문이다. 인덕터들이(예컨대, 칩에서 상당한 공간을 차지하여) 칩 상에 구현하기 어렵기 때문에, 인덕터들 사용하지 않는 것이 LMC 하드웨어의 유용한 특징이다. This is different from the unit cell used in HMC, because it can operate without inductors. This is a useful feature of LMC hardware, as inductors are difficult to implement on chip (e.g., they take up a significant amount of space on the chip).

한편, LMC의 단위 셀은 확률적 잡음원을 갖는다. 이는 전압 출력이 가우시안 백색 잡음인 전압원에 해당한다. 이 목적을 위해 다음의 가능한 방법들과 같이 확률적 잡음원을 구현하는 다양한 방법이 있다: Meanwhile, the unit cell of LMC has a stochastic noise source. This corresponds to a voltage source whose voltage output is Gaussian white noise. For this purpose, there are various ways to implement the stochastic noise source, such as the following possible methods:

1. 저항기로부터의 아날로그 열 잡음(존슨-나이퀴스트 잡음으로도 알려짐). 1. Analog thermal noise from resistors (also known as Johnson-Nyquist noise).

2. 제너 다이오드와 같은 다이오드로부터의 아날로그 샷 잡음. 2. Analog shot noise from diodes such as Zener diodes.

3. 아날로그 필터링을 이용한 현장 프로그래밍가능 게이트 어레이(FPGA)로부터 발생된 디지털 의사 랜덤 잡음.3. Digital pseudo-random noise generated from field-programmable gate arrays (FPGAs) using analog filtering.

이들 가능한 잡음원들 각각은 도 51에 도시된 δv 전압원을 생성할 수 있다. 아날로그 열 잡음 및 아날로그 샷 잡음 둘 다는 증폭기를 사용하여 증폭되어 연관된 전압 변동의 크기를 증가시킬 수 있다. Each of these possible noise sources is shown in Fig. 51 as δv A voltage source can be generated. Both analog thermal noise and analog shot noise can be amplified using amplifiers to increase the magnitude of the associated voltage fluctuations.

각 단위 셀은 또한 정전압원을 포함할 수 있다(단, 이 전압원은 도 51에 명시적으로 도시되어 있지 않다). 이는 확률 분포 p(x)와 연관된 평균 벡터 μμ = 0 값에서 벗어나게 하는 데 유용할 수 있다. Each unit cell may also include a voltage source (although this voltage source is not explicitly shown in Fig. 51). This may be useful to shift the mean vector μ associated with the probability distribution p ( x ) away from the value μ = 0 .

19.2 19.2 LMCLMC 하드웨어를 위한 단위 셀들 결합Combining unit cells for hardware

단위 셀들을 결합하기 위한 두 가지 대안을 고려한다. 한 가지 접근법은 도 52a에 도시된 바와 같이 저항성 브리지를 사용하는 것이다. 또 다른 접근법은 도 52b에 도시된 바와 같이 용량성 브리지를 사용하는 것이다. We consider two alternatives for joining the unit cells. One approach is to use a resistive bridge, as shown in Fig. 52a. Another approach is to use a capacitive bridge, as shown in Fig. 52b.

저항성 결합의 경우 두 결합된 셀의 전압 벡터 v에 대한 운동 방정식들은 다음과 같으며: For resistive coupling, the equations of motion for the voltage vector v of the two coupled cells are:

여기서Here

여기서 자체 저항 행렬 R, 커패시턴스 행렬 C, 및 컨덕턴스 행렬 J를 소개하였다. Here, the self-resistance matrix R , the capacitance matrix C , and the conductance matrix J are introduced.

용량성 결합의 경우 운동 방정식은 다음과 같으며: For capacitive coupling, the equation of motion is:

여기서 커패시턴스 행렬은 다음과 같다Here the capacitance matrix is as follows:

19.3 샘플 수용 또는 거부19.3 Acceptance or rejection of samples

HMC 사례와 유사하게, LMC 프로세스에 메트로폴리스-헤이스팅스(MH) 단계를 추가할 수 있다. 이는 다음 단계들을 수반한다: Similar to the HMC case, a Metropolis-Hastings (MH) step can be added to the LMC process. This involves the following steps:

LMC 하드웨어의 단위 셀들에 있는 커패시터들 각각의 양단의 전압들을 측정한다. Measure the voltages across each capacitor in the unit cells of the LMC hardware.

이 전압 벡터 v를 디지털 프로세서에 피드한다. This voltage vector v is fed to the digital processor.

디지털 프로세서 상에서 이 전압 벡터와 연관된 에너지를 정량화한다. Quantifies the energy associated with this voltage vector on a digital processor.

이 에너지 값에 기반하여, 이 샘플에 MH 프로세스의 수용/거부 단계를 적용한다. Based on this energy value, the acceptance/rejection step of the MH process is applied to this sample.

이는(MH 조건을 통해) 디지털 프로세서를 샘플 품질의 판단자로서 사용하여 제안된 샘플을 수용하거나 거부할 수 있다. This allows the digital processor to be used as a judge of sample quality (via the MH condition) to accept or reject a proposed sample.

19.4 19.4 LMCLMC 하드웨어를 이용한 Using hardware 가우시안Gaussian 분포 샘플링Distribution sampling

가우시안 분포의 경우 확률 분포의 로그의 기울기는 아핀 함수에 의해 주어진다. 구체적으로 이는 다음에 의해 주어지며: For Gaussian distributions, the slope of the logarithm of the probability distribution is given by an affine function. Specifically, it is given by:

여기서 μ는 평균 벡터이고 ∑는 공분산 행렬이다. Here, μ is the mean vector and ∑ is the covariance matrix.

이 공식을 사용하여 가우시안의 특수한 경우를 위한 식 (131)은 다음과 같이 다시 쓸 수 있다: Using this formula, equation (131) for the special case of Gaussian can be rewritten as:

이 방정식을 식 (132) 및 (133)과 비교할 수 있으며, 이 식들은 각각 저항성 결합 및 용량성 결합을 갖는 LMC 하드웨어에 대한 미분 방정식들이다. 실제로, 식 (135)은 이들 방정식과 유사한 형태를 갖는다. 구체적으로, 이들 방정식을 사용하여 분포 파라미터들과 회로 파라미터들 간의 관계를 구할 수 있다. 즉, 다음과 같은 관계를 저항성 결합의 경우의This equation can be compared with equations (132) and (133), which are differential equations for LMC hardware with resistive coupling and capacitive coupling, respectively. In fact, equation (135) has a similar form to these equations. Specifically, these equations can be used to obtain the relationship between the distribution parameters and the circuit parameters. That is, the following relationship can be obtained for the case of resistive coupling:

와, 용량성 결합의 경우의 Wow, in the case of capacitive coupling

로 확립할 수 있다. 이들 관계는 사용자가 분포 파라미터들을 LMC 하드웨어의 회로 파라미터들로 변환하는 것을 허용한다. 저항성 결합의 경우, 아래와 같은 정확한 관계를 제공한다. can be established. These relations allow the user to convert the distribution parameters into circuit parameters of the LMC hardware. For resistive coupling, the following precise relations are provided:

식 (132) 및 (133)은 평균 벡터가 0이고 μ = 0라고 가정한다. 그러나 LMC 하드웨어의 각 단위 셀에 정전압원들을 추가함으로써 0이 아닌 μ를 허용할 수 있다. Equations (132) and (133) assume that the mean vector is zero and μ = 0. However, non-zero μ can be allowed by adding voltage sources to each unit cell of the LMC hardware.

19.4.1 공분산 행렬을 저항성 결합으로 인코딩19.4.1 Encoding the covariance matrix with resistive coupling

저항성 결합의 특수한 경우에 대해, 이제 공분산 행렬을 결합으로 인코딩하는 방법에 대한 분석을 제공한다. For the special case of resistive coupling, we now provide an analysis of how to encode the covariance matrix as a coupling.

추가적인 튜닝 유연성을 위해 도 53에 도시된 바와 같이, 각 단위 셀과는 병렬로 저항 분지를 추가한다. For additional tuning flexibility, a resistor branch is added in parallel with each unit cell, as shown in Figure 53.

이제 도 53의 회로를 분석한다. 전압 벡터 를 고려하며, 여기서 는 i번째 커패시터 양단의 전압이다. v에 대한 다음의 미분 방정식을 얻으며, Now let's analyze the circuit of Fig. 53. Voltage vector Taking into account, here is the voltage across the i-th capacitor. The following differential equation for v is obtained,

여기서Here

R = RI 및 C = CI가 항등행렬 I에 비례하는 특수한 경우를 고려하고 벡터 w를 가 되도록 정의한다. 그러면 식 (138)의 동역학을 다음과 같이 다시 쓸 수 있으며: Consider the special case where R = RI and C = CI are proportional to the identity matrix I, and consider the vector w. is defined to be . Then, the dynamics of equation (138) can be rewritten as follows:

여기서 dw = wdt. 이 방정식을 식 (135)와 비교할 때 다음을 알 수 있다: Here dw = wdt. Comparing this equation with equation (135), we see that:

따라서 위 방정식을 사용하여 공분산 행렬 을 J 행렬로 인코딩할 수 있다. So, using the above equation, we can find the covariance matrix can be encoded as a J matrix.

이는 전기 회로의 파라미터들에 공분산 행렬을 저장하는 방법에 대한 레시피를 제공한다. This provides a recipe for how to store the covariance matrix in the parameters of an electrical circuit.

위의 분석은 두 개의 단위 셀을 d개 단위 셀로 일반화된다. 이는 본질적으로 J 행렬을 행렬 원소들을 위한 다음 공식으로 일반화하는 것을 수반한다: The above analysis generalizes from two unit cells to d unit cells. This essentially entails generalizing the J matrix to the following formula for the matrix elements:

19.5 19.5 LMCLMC 하드웨어를 이용한 Using hardware 비가우시안Non-Gaussian 분포 샘플링Distribution sampling

섹션 14 및 16에서 논의된 가우시안 샘플링을 넘어서 HMC를 위해 개발된 기술은 LMC에도 적용된다.Beyond Gaussian sampling discussed in Sections 14 and 16, techniques developed for HMC are also applicable to LMC.

19.5.1 맥스웰 데몬 접근법19.5.1 Maxwell Demon Approach

섹션 14에서 논의되었던 맥스웰 데몬 접근법은 비가우시안 분포로부터 샘플들을 추출하는 것을 허용하기 위해 LMC 하드웨어에 적용될 수 있다. The Maxwell demon approach discussed in Section 14 can be applied to LMC hardware to allow sampling from non-Gaussian distributions.

구체적으로, 맥스웰 데몬은 LMC 하드웨어의 단위 셀에 작용하는 전압 제어 전압원으로 볼 수 있다. HMC 단위 셀을 LMC 단위 셀로 교체하는 것을 전제로, 예를 들어 도 36, 도 38 및 도 42에서의 예에 대해 도시된 것과 동일한 회로 구조를 사용할 수 있다. (이는, 위에서 논의된 바와 같이, 인덕터를 제거하고 단위 셀에 확률적 잡음원을 추가하는 것을 수반한다.) Specifically, the Maxwell Demon can be viewed as a voltage-controlled voltage source acting on the unit cell of the LMC hardware. The same circuit structure as illustrated for the examples in Figs. 36, 38, and 42 can be used, for example, assuming that the HMC unit cell is replaced by an LMC unit cell. (This involves removing the inductor and adding a stochastic noise source to the unit cell, as discussed above.)

19.5.2 19.5.2 다체Multi-body 결합 접근법Combined approach

섹션 16에서 논의되었던 다체 결합 접근법은 비가우시안 분포를 샘플링하는 것을 허용하기 위해 LMC 하드웨어에도 적용될 수 있다. The multibody coupling approach discussed in Section 16 can also be applied to LMC hardware to allow sampling non-Gaussian distributions.

구체적으로, 단위 셀들 사이의 결합 소자로서 전압 제어 커패시터(VCC) 또는 전압 제어 저항기(VCR) 중 어느 하나를 사용할 수 있다. HMC 단위 셀을 LMC 단위 셀로 교체하면, HMC용 섹션 16에서의 논의는 LMC 하드웨어에 직접 적용될 수 있다. 이는 전압 제어 커패시터들을 사용하여 3체 결합, 4체 결합, 또는 n체 결합을 설계 구현하는 방법에 대한 논의를 포함한다. 또한, 섹션 16에서 다체 결합에 아날로그 방법 또는 디지털-아날로그 방법 중 어느 하나를 사용하는 것에 대한 논의는 LMC 하드웨어에 관계가 있다. Specifically, either a voltage-controlled capacitor (VCC) or a voltage-controlled resistor (VCR) can be used as the coupling element between the unit cells. If the HMC unit cell is replaced with an LMC unit cell, the discussion in Section 16 for HMC can be directly applied to the LMC hardware. This includes a discussion on how to design and implement 3-body coupling, 4-body coupling, or n-body coupling using voltage-controlled capacitors. Also, the discussion in Section 16 on using either an analog approach or a digital-to-analog approach for multi-body coupling is relevant to the LMC hardware.

19.6 19.6 적분기에In the integrator 기반한Based on 대체 Alternative LMCLMC 하드웨어Hardware

여기서 LMC 하드웨어에 대한 대체 장치가 다음과 같이 사용할 수 있다. 구체적으로, 이 대체 장치는, 도 54에 도시된 바와 같이, 단위 셀들 대신 적분기들을 채용한다. An alternative device to the LMC hardware may be used here, as follows. Specifically, this alternative device employs integrators instead of unit cells, as illustrated in Fig. 54.

도 54의 LMC용 아날로그 장치는 섹션 14.7에서 설명된 바와 같은 신경망에 의해 파라미터화된 것을 포함하여 임의의 확률 분포를 샘플링하는 데 사용될 수 있다. 그렇게 하기 위해, 사용자는 확률의 표현을 하드웨어로 컴파일해야 한다. 신경망의 경우, 이는 네트워크를 아날로그 하드웨어로 컴파일한 다음 기울기를 계산하는 것과 같다. 대안적으로, 기울기를 추정하는 공식이 있다면, 이를 아날로그로 컴파일할 수 있고 맥스웰 데몬은, 입력 가 피드된다면, 로그 확률의 기울기를 출력할 것이다.The analog device for the LMC of Fig. 54 can be used to sample any probability distribution, including those parameterized by neural networks as described in Section 14.7. To do so, the user must compile a representation of the probabilities into hardware. In the case of neural networks, this would be equivalent to compiling the network into analog hardware and then computing the gradient. Alternatively, if one has a formula for estimating the gradient, one can compile this into analog and the Maxwell daemon can then compute the gradient using the input If fed, it will output the slope of the log probability.

20 잡음 주입으로 유효 온도 상승20 Effective temperature increase with noise injection

가우시안 샘플링 장치의 실현 가능성에 관한 한 가지 의문은 감쇠(현실적인 전기 부품들에 의해 야기됨)가 열 잡음에 비해 너무 커서 측정된 전압이 매우 작아질 수 있는지 여부이다. 측정된 값들이 항상 증폭될 수 있지만, 아날로그 증폭기를 추가하는 것이 장치의 복잡도가 증가시킬 것이고 디지털 후처리에 의해 달성된 큰 증폭이 정밀도의 저하를 야기할 우려가 있다. 이 문제를 극복하기 위한 물리적 동기부여 방법은 간단히 장치의 작동 온도를 높여 증폭이 불필요할 정도로 열 변동이 커지기까지 장치의 동작 온도를 증가시키는 것이며; 이 접근법은, 예를 들어, 원하는 온도에 도달하는 데 걸리는 시간과 추가적인 에너지 비용 등 자체적인 문제가 있다. One question regarding the feasibility of a Gaussian sampling device is whether the attenuation (caused by realistic electrical components) is so large compared to the thermal noise that the measured voltages are very small. The measured values can always be amplified, but adding an analog amplifier would increase the complexity of the device, and there is a concern that the large amplification achieved by digital postprocessing would cause a loss of precision. A physically motivated way to overcome this problem is to simply increase the operating temperature of the device until the thermal fluctuations become so large that amplification is unnecessary; this approach has its own problems, such as the time it takes to reach the desired temperature and the additional energy costs.

잡음 주입을 통해 장치의 유효 온도를 높이는 것은 디지털 의사랜덤 수 생성기(예를 들어 FPGA에서 생성)를 이용하여 백색 잡음을 생성하고 각 셀에 독립적으로 잡음을 추가함으로써 행해질 수 있다. 핵심 질문은, 특히 각 셀에서 상관관계가 없는 잡음을 주입한다면, 이 접근법이 물리적 온도를 높이는 것과 동일한 효과를 가지는지 여부이다. Increasing the effective temperature of the device through noise injection can be done by generating white noise using a digital pseudorandom number generator (e.g. generated by an FPGA) and adding the noise to each cell independently. The key question is whether this approach has the same effect as increasing the physical temperature, especially if uncorrelated noise is injected into each cell.

도 55는 두 개의 단위 셀에 대한 잡음 주입이 있는 회로도를 도시한다. 비상관 잡음 주입을 가정하면, 회로 방정식은 다음과 같은 형태를 취하며Figure 55 shows a circuit diagram with noise injection into two unit cells. Assuming uncorrelated noise injection, the circuit equations take the following form:

여기서 이고 는 맥스웰 행렬이다. 주입된 잡음 진폭은 파라미터 κ0에 의해 제어되며, 이 파라미터는, 단위가 작동하려면 전하2·시간-1의 차원을 가져야 하지만, 지금은 차원을 모호하게 남겨둔다. Here And is a Maxwell matrix. The injected noise amplitude is controlled by the parameter κ 0 , which must have the dimension of charge 2 time −1 for the unit to work, but we leave the dimensionality ambiguous for now.

실제로 각 셀에서 상관되지 않은 노이즈를 사용하여 유효 온도는 증가될 수 있다. 이는 이 문서의 이전 섹션들에서 논의된 회로들을 사용하여 추가 증폭기들 또는 온도 제어 없이 샘플을 얻을 수 있다는 것을 의미한다. 각 셀에서 동일한 진폭을 갖는 비상관된 백색 잡음 주입을 가정한다면, 전압 및 전류에 대한 결과적인 공분산 행렬들은 다음과 같으며In fact, the effective temperature can be increased by using uncorrelated noise in each cell. This means that the circuits discussed in the previous sections of this paper can be used to obtain samples without additional amplifiers or temperature control. Assuming uncorrelated white noise injection with the same amplitude in each cell, the resulting covariance matrices for voltage and current are

여기서 는 맥스웰 커패시턴스 행렬, L은 인덕턴스 행렬, R은 저항 행렬(이는 단위 행렬에 비례함)이고, κ0는 주입된 잡음 진폭에 따라 스케일 조정되고 유효 온도를 결정하는 숫자이다. Here is the Maxwell capacitance matrix, L is the inductance matrix, R is the resistance matrix (which is proportional to the identity matrix), and κ0 is a number that is scaled by the injected noise amplitude and determines the effective temperature.

이 수식체계에서 맥스웰 커패시턴스 행렬은 공분산 행렬 자체가 아닌 공분산 행렬의 역행렬을 인코딩하며, 그래서 공분산 행렬이 아닌 정밀도 행렬이 지정되는 응용 분야에 가장 적합하다. 그러나 예를 들어 수치적으로 역행렬이 가능한 공분산 행렬이 주어지는 경우들에 이 방법을 사용하는 것이 여전히 가능하다. 커패시턴스 행렬을 공분산 행렬에 직접 스케일 조정하도록 시도함에 있어서 몇 가지 미묘한 차이가 있지만, 여기서 커패시턴스 행렬이 정밀도 행렬에 따라 스케일 조정되는 경우를 다룬다. In this notation, the Maxwell capacitance matrix encodes the inverse of the covariance matrix, not the covariance matrix itself, and is therefore best suited for applications where the precision matrix, rather than the covariance matrix, is specified. However, it is still possible to use this approach in cases where a numerically invertible covariance matrix is given, for example. There are some subtleties in trying to scale the capacitance matrix directly to the covariance matrix, but here we consider the case where the capacitance matrix is scaled by the precision matrix.

21 선형 대수 기본요소를 풀기 위한 열역학 시스템21 Thermodynamic systems for solving linear algebraic primitives

여기서 위에 설명된 동일한 열역학 하드웨어가 선형 대수의 주요 기본요소들을 가속화하는 데에도 사용될 수 있음을 보여준다. 조화 오실레이터 시스템들의 수학이 아핀(즉, 선형)이라는 사실을 이용하고, 그런고로 선형 대수적 기본요소들을 이러한 시스템들에 매핑할 수 있다. 결합된 조화 오실레이터들의 열 평형 분포로부터 샘플들을 추출함으로써 다양한 선형 대수 문제를 풀 수 있음을 보여준다. 구체적으로 다음의 선형 대수 기본요소들에 대한 열역학 알고리즘(thermodynamic algorithm)들을 개발한다: (i) 선형 시스템 Ax = b풀기, (ii) 역행렬 A-1 추정, (iii) A∑+∑AT = I 형태의 리아프노프(Lyapunov) 방정식 풀기 및 (iv) 대칭적 양의 정부호 행렬 A의 행렬식 추정. 열역학 하드웨어에서 구현되면, 이들 방법은 디지털 알고리즘들에 비해 문제 크기에 따라 유리하게 스케일 조정함을 보여준다. Here we show that the same thermodynamic hardware described above can also be used to accelerate key primitives of linear algebra. We exploit the fact that the mathematics of harmonic oscillator systems is affine (i.e., linear), and thus linear algebraic primitives can be mapped onto such systems. We show that a variety of linear algebraic problems can be solved by sampling from the thermal equilibrium distribution of coupled harmonic oscillators. Specifically, we develop thermodynamic algorithms for the following linear algebraic primitives: (i) solving the linear system Ax = b, (ii) estimating the inverse A -1 , (iii) solving Lyapunov equations of the form A∑+∑A T = I, and (iv) estimating the determinant of a symmetric positive definite matrix A. When implemented on thermodynamic hardware, these methods are shown to scale favorably with problem size compared to digital algorithms.

21.1 선형 방정식 시스템 풀기21.1 Solving linear equation systems

유명한 선형 시스템 문제는 다음이 되도록 를 찾는 것인데The famous linear system problem is as follows: I'm looking for

다만 가역 행렬 과 0이 아닌 이 주어졌다. 일반성을 잃지 않고 방정식 (145)의 행렬 A가 대칭적이고 양의 정부호(SPD)라고 가정할 수 있다. 이를 확인하기 위해 A가 SPD가 아니라고 가정한다. 그러면 A' = ATA 및 b' = ATb로 정의하고 다음과 같이 방정식을 풀 수 있다Just an invertible matrix and not 0 This is given. Without loss of generality, we can assume that the matrix A in equation (145) is symmetric and positive definite (SPD). To check this, assume that A is not SPD. Then, we define A' = A T A and b' = A T b and solve the equation as follows.

가역 행렬의 전치행렬은 가역 행렬이며, 이는 A'이 가역 행렬이고 b'은 0이 아니며, 그래서 식 (146)은 비특이 선형계이다. 행렬 A'는 구성상 SPD이며, 그래서 대칭 선형 시스템을 풀 수 있는 방법이 이용 가능하다면 방정식 (146)을 충족하는 x'는 찾을 수 있다. 그러면, 식 (146)의 양변에서 (AT)-1을 좌측에 곱하면 Ax' = b가 얻어지며, 이는 x'이 원래 선형 시스템에 대한 해임을 의미한다. 이는 전체 런타임에 영향을 미칠 수 있지만, 디지털 방법들에 비해 점근적 스케일링 개선을 여전히 허용한다(이런 방식으로 일반적인 시스템으로부터 SPD 시스템을 구성하면 조건수(condition number)가 제곱되는 결과가 나오며, 이는 성능에 영향을 미친다). 그러므로 다음에서 A는 SPD라고 가정한다. The transpose of an invertible matrix is invertible, which means that A' is invertible and b' is nonzero, so equation (146) is a nonsingular linear system. The matrix A' is SPD by construction, so if a method is available to solve a symmetric linear system, then x' satisfying equation (146) can be found. Then, multiplying both sides of equation (146) by (A T ) -1 gives Ax' = b , which means that x' is a solution to the original linear system. This may impact the overall runtime, but still allows for an asymptotic scaling improvement over digital methods (constructing an SPD system from a general system in this way results in the condition number being squared, which impacts performance). Therefore, in the following, we assume A is SPD.

이제 이 문제를 열역학과 연결한다. 고전 물리학에 의해 설명되는 d 자유도를 갖는 거시적 장치를 고려한다. 장치는 퍼텐셜 에너지 함수를 가진다고 가정한다:Now we connect this problem to thermodynamics. Consider a macroscopic device with d degrees of freedom, as described by classical physics. The device is assumed to have a potential energy function:

여기서 . 이는 조화 오실레이터 시스템을 통해 물리적으로 실현될 수 있는 2차 퍼텐셜이며, 오실레이터들 간의 결합은 행렬 A에 의해 결정되고, b 벡터는 각 개별 오실레이터에 작용하는 일정한 힘을 나타낸다. Here . This is a second-order potential that can be physically realized through a harmonic oscillator system, where the coupling between the oscillators is determined by the matrix A, and the b vector represents a constant force acting on each individual oscillator.

이 장치가 역온도가 β=1/kBT인 환경과 열 평형에 도달하는 것을 허용한다고 가정한다. 열 평형에서 볼츠만 분포는 오실레이터들이 주어진 공간 좌표를 가질 확률을 다음과 같이 기술한다: . V(x)가 2차 형태이기 때문에, p(x)는 다변량 가우시안 분포에 해당한다. 따라서 열 평형에서 공간 좌표 x는 다음과 같은 가우시안 확률 변수이다.We assume that the device is allowed to reach thermal equilibrium with the environment at reciprocal temperature β = 1/k B T . In thermal equilibrium, the Boltzmann distribution describes the probability that the oscillators will have given spatial coordinates as follows: . Since V(x) is quadratic, p(x) corresponds to a multivariate Gaussian distribution. Therefore, in thermal equilibrium, the spatial coordinate x is a Gaussian random variable as follows.

V(x)의 유일한 최솟값은 Ax - b = 0에서 발생하며, 이는 p(x)의 유일한 최댓값에도 해당한다. 가우시안 분포의 경우, p(x)의 최댓값은 첫 번째 모멘트 〈x〉이다. 따라서 열 평형에서 첫 번째 모멘트는 다음과 같이 선형 방정식 시스템의 해이다: The unique minimum of V(x) occurs at Ax - b = 0, which also corresponds to the unique maximum of p(x). For the Gaussian distribution, the maximum of p(x) is at the first moment 〈x〉. Therefore, in thermal equilibrium, the first moment is the solution of the linear system of equations:

이 분석으로부터, 선형 시스템을 풀기 위한 열역학 프로토콜을 구성할 수 있으며, 이 구성은 도 56에 묘사되어 있다. 즉, 이 프로토콜은 식 (147)의 퍼텐셜을 실현하는 것을 수반하며, 시스템이 평형에 도달할 때까지 기다린 다음, x를 샘플링하여 분포의 평균 를 추정한다. 이 평균은 시간 평균을 사용하여 근사될 수 있으며, 다음과 같이 정의되며From this analysis, a thermodynamic protocol can be constructed to solve the linear system, which is depicted in Figure 56. Namely, the protocol involves realizing the potential of equation (147), waiting until the system reaches equilibrium, and then sampling x to find the mean of the distribution. is estimated. This average can be approximated using the time average, which is defined as follows:

여기서 t0는 평형을 허용할 만큼 충분히 커야 하고 는 평균이 원하는 정밀도로 수렴할 만큼 충분히 커야 한다. 이 시간 평균의 평균에의 최종적인 수렴은 에르고딕 가설의 핵심 내용이며, 이는 매우 일반적인 열역학 시스템에서 종종 가정된다. 평균은 샘플들의 시퀀스의 평균으로서 근사될 수 있다. 그러나 적분 접근법은 (예를 들어, 적분기 회로를 사용하여) 완전히 아날로그 방식으로 편리하게 구현될 수 있으며, 이는 프로토콜이 끝날 때까지 장치로부터 데이터를 전송할 필요를 없게 한다. Here t 0 must be large enough to allow equilibrium, should be large enough for the mean to converge to the desired precision. This eventual convergence of the time average to the mean is a key feature of the ergodic hypothesis, which is often assumed in very general thermodynamic systems. The mean can be approximated as the average of a sequence of samples. However, the integration approach can be conveniently implemented in a completely analog way (e.g., using an integrator circuit), which eliminates the need to transmit data from the device until the end of the protocol.

전체 프로토콜은 다음과 같이 요약될 수 있다. The overall protocol can be summarized as follows:

1. 선형 시스템 Ax = b가 주어지면, 장치의 퍼텐셜은 다음과 같으며1. Given a linear system Ax = b, the potential of the device is as follows:

이때 시간은 t = 0이다.At this time, time t = 0.

2. 평형 허용오차 파라미터들 를 선택하고 다음과 같이 평형 시간을 선택하며2. Balance tolerance parameters Select and choose the equilibrium time as follows:

여기서 는 시스템의 물리적 특성들로부터 계산되며, 식 (155) 또는 (152)으로 계산된다. 시스템이 t = t0까지 동역학 하에서 진화하도록 허용하여, δμ 및 를 보장한다. Here is computed from the physical properties of the system and is calculated by Eq. (155) or (152). The system is allowed to evolve under dynamics until t = t 0 . δμ and It guarantees.

3. 오차 허용 파라미터 δx와 성공 확률 Pδ를 선택하고 다음과 같이 적분 시간을 선택하며3. Select the error tolerance parameter δx and the success probability Pδ, and select the integration time as follows:

여기서 는 시스템의 물리적 특성으로부터 계산하며, 식 (155) 또는 (152)로 계산한다. 아날로그 적분기를 사용하여 다음과 같이 시간 평균을 측정하며Here is calculated from the physical characteristics of the system and is calculated by Equation (155) or (152). The time average is measured using an analog integrator as follows:

이는 최소 의 확률로 을 충족한다.This is at least With a probability of satisfies.

위 프로토콜을 구현하기 위하여 의 원하는 값들은 확인되어야 하며, 이는 평형 및 에르고딕성에 대한 보다 정량적인 설명을 수반한다. 이러한 설명을 얻기 위해 시스템의 미시적 동역학의 모델이 도입될 수 있다. 고려 중인 시스템이 열탕과 접촉하는 조화 오실레이터로 구성됨을 고려하면, 감쇠(즉, 열탕과의 에너지 교환)와 확률적 열 잡음을 허용하는 것이 자연스럽고, 이 열 잡음은 변동-소산 정리로 인한 감쇠를 항상 동반한다. 랑주뱅 방정식은 이들 효과를 설명하며, 특히 과감쇠된 랑주뱅(overdamped Langevin, ODL) 방정식과 저감쇠된 랑주뱅(underdamped Langevin, UDL) 방정식들이라는 두 가지 일반적인 공식을 고려한다. To implement the above protocol and The desired values of have to be identified, which entails a more quantitative description of the equilibrium and ergodicity. To obtain this description, a model of the microscopic dynamics of the system can be introduced. Considering that the system under consideration consists of a harmonic oscillator in contact with a bath, it is natural to allow for damping (i.e., energy exchange with the bath) and stochastic thermal noise, which is always accompanied by damping due to the fluctuation-dissipation theorem. The Langevin equations account for these effects, and in particular, two general formulations are considered: the overdamped Langevin (ODL) equations and the underdamped Langevin (UDL) equations.

과감쇠된 경우, 위 프로토콜에서 사용될 수 있는 다음 공식들에 도달한다: In the overdamped case, we arrive at the following formulas which can be used in the above protocol:

저감쇠의 경우, 파라미터들에 대해 다음과 같은 다소 다른 공식들을 도출한다: For the case of low damping, we derive somewhat different formulas for the parameters:

21.1.1 하드웨어 구현21.1.1 Hardware Implementation

여기서 과감쇠된 랑주뱅 프로세스에 매핑되고 위에서 설명된 열역학적 선형 시스템 알고리즘을 구현하는 데 사용될 수 있는 d개의 결합된 RC 셀로 구성된 전자 장치를 설명한다. Here we describe an electronic device consisting of d coupled RC cells that can be mapped to an overdamped Langevin process and used to implement the thermodynamic linear system algorithm described above.

이 하드웨어 구현예에 대한 한 가지 잠재적인 접근법은 RC 단위 셀들과 셀들 간의 저항성 결합을 채용하는 도 17에 도시된 구성 블록들을 사용하는 것이다. 각 셀의 커패시터의 양단 전압 v = (v1, v2, ..., vd)에 대한 운동 방정식은 다음과 같으며: One potential approach to this hardware implementation is to use the building blocks illustrated in Fig. 17, which employ RC unit cells and resistive coupling between the cells. The equations of motion for the voltage across the capacitors of each cell, v = (v1, v2, ..., vd), are:

여기서 C = diag(C1, C2, ... , Cd), R=diag(R1, R2, ..., Rd), w는 비상관 브라운 운동이고 J의 원소들은 다음에 의해 주어진다Here, C = diag(C1, C2, ... , Cd), R = diag(R1, R2, ..., Rd), w is uncorrelated Brownian motion, and the elements of J are given by

그런고로 두 개의 셀 내 저항기들이 있어, R 행렬과는 독립적으로 J 행렬의 대각 원소들에 대한 자유도가 허용되고 각 셀을 결합하는 저항기가 하나 존재한다. R, C가 대각 행렬들이므로 과, γ = 1/RC를 설정할 수 있다. x = v로 표시하고 를 선택함으로써, 다음으로 이어지며: Therefore, there are two resistors within the cell, allowing degrees of freedom for the diagonal elements of the J matrix independently of the R matrix, and there is one resistor that couples each cell. Since R and C are diagonal matrices, And, we can set γ = 1/RC. Let x = v. By selecting , you will be taken to:

이는 잡음의 평균이 γb이고 분산이 2γ/β인 경우 선형 시스템 솔버의 과감쇠된 동역학으로 축소된다. 이를 하드웨어로 구현하기 위해 셀 내 및 셀 외 저항기들의 값들은 A 행렬에 기반하여 계산되어야 하며, 그러므로 이는 초기화 시 O(d2) 연산들의 비용이 발생한다는 것에 주의한다. 전기 하드웨어의 경우, 유효 온도는 존슨-나이퀴스트 잡음에 로서 관련되며, Δf는 시스템의 밴드폭이다. 1MHz의 밴드폭의 경우, T = 300K에 대해 를 얻는다. This reduces to the overdamped dynamics of the linear system solver when the noise has a mean of γb and a variance of 2γ/β. Note that to implement this in hardware, the values of the intra- and extra-cell resistors must be computed based on the A matrix, which therefore incurs a cost of O(d2) operations at initialization. For electrical hardware, the effective temperature is given by the Johnson-Nyquist noise. , and Δf is the bandwidth of the system. For a bandwidth of 1 MHz, for T = 300 K, Get .

21.2 행렬의 역행렬 추정21.2 Estimating the inverse of a matrix

이전 섹션의 결과들은 x의 평균을 추정하는 것에 의존하고 평형 상태에서 x의 변동을 이용하지 않다. 평형 분포의 2차 모멘트들을 사용함으로써, 선형 시스템을 푸는 것 이상을 할 수 있다. 예를 들어, 대칭적 양의 정부호 행렬 A의 역행렬을 구하는 것이 가능하다. 언급된 바와 같이, x의 정상 분포는 이며, 이는 A의 역행렬이 x의 공분산 행렬을 구함으로써 얻을 수 있다는 것을 의미한다. 이는 아날로그 곱셈기들과, 적분기들의 조합을 사용하여 완전히 아날로그 방식으로 달성될 수 있다. 이 프로토콜에 대해 b = 0을 설정함으로써, 을 보장하며, 그래서 정적 공분산 행렬은 정의에 의해 다음과 같다The results in the previous section rely on estimating the mean of x and do not exploit the variation of x around equilibrium. By using the second moments of the equilibrium distribution, it is possible to do more than solve linear systems. For example, it is possible to find the inverse of a symmetric positive definite matrix A. As mentioned, the normal distribution of x is , which means that the inverse matrix of A can be obtained by finding the covariance matrix of x. This can be achieved in a completely analog manner using a combination of analog multipliers and integrators. By setting b = 0 for this protocol, , and so the static covariance matrix is by definition as follows:

이를 추정하기 위해 시스템이 평형에 도달한 후 시간 평균을 다시 수행한다.To estimate this, time averaging is performed again after the system reaches equilibrium.

아날로그 구성요소는 각 쌍 (i, j)에 대해 곱 xi(t)xj(t)을 구할 수 있어, d2개의 아날로그 곱셈기 구성요소들이 필요하다. 이들 곱 각각은 아날로그 적분기 구성요소에 입력되며, 이 구성요소는 다음과 같이 시간 평균 공분산 행렬의 한 원소를 계산한다.The analog component computes the product x i (t) x j (t) for each pair (i, j), requiring d2 analog multiplier components. Each of these products is fed into an analog integrator component, which computes one element of the time-averaged covariance matrix as follows.

평형 시간이 선형 시스템 프로토콜과 동일하지만, 적분 시간은 서로 다른데, 왜냐하면 일반적으로 공분산 행렬이 평균보다 수렴이 느리기 때문이다. 이제 ODL 동역학을 가정하여 다음과 같이 역추정 프로토콜의 자세한 설명을 제공한다. Although the equilibrium time is the same as the linear system protocol, the integration time is different, because the covariance matrix generally converges more slowly than the mean. Now, assuming ODL dynamics, we give a detailed description of the backestimation protocol as follows.

1. 양의 정부호 행렬 A가 주어지면, 장치의 퍼텐셜을 시간 t = 0에서1. Given a positive definite matrix A, the potential of the device at time t = 0

로 설정한다. Set to .

2. 평형 허용오차 파라미터 를 선택하고, 평형 시간을 구한다. 2. Balance tolerance parameters Select and find the equilibrium time.

시스템이 t = t0까지 동역학 하에서 진화하도록 허용하여, 을 보장한다.Allow the system to evolve under dynamics until t = t 0 , and It guarantees.

3. 오차 허용 파라미터 δ와 성공 확률 Pδ을 선택하고 다음과 같이 적분 시간을 구하며3. Select the error tolerance parameter δ and the success probability P δ and obtain the integration time as follows:

아날로그 곱셈기들 및 적분기들을 사용하여 다음과 같이 시간 평균들을 측정하며Using analog multipliers and integrators, we measure time averages as follows:

이는 적어도 Pδ의 확률로 를 충족한다. This is at least with probability P δ . satisfies.

21.3 21.3 리아프노프Lyapunov 방정식 풀기Solving equations

이 섹션은 잡음 항의 공분산 행렬이 임의의 대칭적 양의 정부호 행렬인 것으로 선택될 수 있도록 하는 제어가능 잡음원을 갖는 장치에 관한 것이다. 퍼텐셜에 선형 bTx 항을 포함하지 않고, 그러므로 다음과 같은 과감쇠된 랑주뱅 방정식을 얻으며This section concerns a device having a controllable noise source such that the covariance matrix of the noise term can be chosen to be an arbitrarily symmetric positive definite matrix. We do not include a linear b T x term in the potential, and therefore obtain the following overdamped Langevin equations:

여기서 R은 대칭적이고 양의 정부호이다. 이 경우 정상 분포는 평균 0과 공분산 행렬 ∑S를 가지며, 이는 다음과 같은 리아프노프 방정식의 해이다.Here R is symmetric and positive definite. In this case, the normal distribution has mean zero and covariance matrix ∑ S , which is a solution to the following Lyapunov equation.

1. 두 개의 대칭적 양의 정부호 행렬 A 및 R이 주어지면, 장치의 퍼텐셜을 다음으로 설정하고1. Given two symmetric positive definite matrices A and R, set the potential of the device as

과감쇠된 랑주뱅 방정식의 잡음 항을 시간 t = 0에서 로 설정한다. 즉, 시스템은 식 (167)의 동역학 하에서 진화한다. The noise term of the overdamped Langevin equation at time t = 0 is set to . That is, the system evolves under the dynamics of equation (167).

2. 평형 허용오차 파라미터들 을 선택하고 다음과 같이 평형 시간을 구한다.2. Balance tolerance parameters Select and find the equilibrium time as follows.

시스템이 t = t0까지 식 (167)의 동역학 하에 진화하는 것을 허용하여, 를 보장된다. Allow the system to evolve under the dynamics of equation (167) until t = t 0 , and is guaranteed.

3. 오차 허용 파라미터 δ와 성공 확률 Pδ을 선택하고 다음과 같이 적분 시간을 구하며3. Select the error tolerance parameter δ and the success probability P δ and obtain the integration time as follows:

아날로그 곱셈기들 및 적분기들을 사용하여 다음과 같이 시간 평균들을 측정하며Using analog multipliers and integrators, we measure time averages as follows:

이는 최소 Pδ의 확률로 를 충족한다. This is with a probability of at least P δ satisfies.

21.4 행렬의 행렬식 추정21.4 Estimating the determinant of a matrix

공분산 행렬의 행렬식은 다변량 정규 분포의 정규화 인자에 나타나며, 이 분포의 밀도 함수는 다음과 같다.The determinant of the covariance matrix appears in the normalization factor of the multivariate normal distribution, and the density function of this distribution is as follows.

가우시안 분포를 생성할 수 있는 하드웨어는 행렬의 행렬식을 추정할 수 있는데, 왜냐하면 이 문제가 확률적 열역학의 응용인 자유 에너지 차이 추정과 동등하기 때문이다. 퍼텐셜 V1 및 V2의 평형 상태들 간의 자유 에너지 차이는 다음과 같다.Hardware that can generate Gaussian distributions can estimate the determinant of a matrix, because this problem is equivalent to estimating free energy differences, an application of probabilistic thermodynamics. The free energy difference between the equilibrium states of potentials V 1 and V 2 is:

퍼텐셜들이 V1(x) = xTA1x 및 V2(x) = xTA2x인 2차 퍼텐셜이라고 가정한다. 그러면 각 적분은 다음과 같이 가우시안 정규화 인자의 역수로 단순화되며, Assume that the potentials are second-order potentials with V 1 (x) = x T A 1 x and V 2 (x) = x T A 2 x . Then each integral simplifies to the inverse of the Gaussian normalization factor,

그래서so

이는 행렬 A1의 행렬식이 평형 상태들의 자유 에너지들과 퍼텐셜 V1 및 V2를 비교(여기서 A2는 알려진 행렬식을 가짐)한 다음, 다음을 계산함으로써 구해질 수 있다는 것을 시사한다.This suggests that the determinant of matrix A 1 can be found by comparing the free energies and potentials V 1 and V 2 of the equilibrium states (where A 2 has a known determinant), and then calculating

다행히도, 퍼텐셜 V(x)가 V1로부터 V2로 변할 때 시스템 상에서 행해지는 일을 측정할 수 있다고 가정하면, 자유 에너지 차이 ΔF는 구해질 수 있다. 자르진스키(Jarzynski) 등식에 따르면, 초기 퍼텐셜과 최종 퍼텐셜의(평형) 상태들 사이의 자유 에너지 차이는 다음과 같으며Fortunately, assuming that we can measure the work done on the system as the potential V(x) changes from V 1 to V 2 , the free energy difference ΔF can be found. According to Jarzynski's equation, the free energy difference between the initial and final potential (equilibrium) states is

여기서 은 시간 t = 0과 시간 사이에 시스템의 모든 가능한 궤적들에 대한, 각각의 확률을 가중된 평균을 나타낸다. 이는 다음에 의해 근사될 수 있다.Here is at time t = 0 and time In between, represents the weighted average of the probabilities of all possible trajectories of the system. This can be approximated by

표 1: 선형 대수 알고리즘들의 점근적 복잡도 비교. 여기서 d는 행렬 차원, k는 조건수, 그리고 은 오차이다. 열역학 알고리즘(TA)들의 경우, 복잡도는 동적 영역, 즉 동역학이 과감쇠되는지 또는 저감쇠되는지 여부에 따라 달라진다. 디지털 SOTA 사례에 대해, 대칭적 양의 정부호 선형 시스템, 역행렬, 리아프노프 방정식, 및 행렬 행렬식 문제들의 복잡도는 각각 켤레 기울기법, 고속 행렬 곱셈/역행렬, 바텔스-스튜어트(Bartels-Stewart) 알고리즘, 콜레스키 분해에 기반한 알고리즘들에 대한 것들이다. 은 행렬 곱셈 상수를 나타낸다. Table 1: Comparison of asymptotic complexity of linear algebra algorithms, where d is the matrix dimension, k is the condition number, and is the error. For thermodynamic algorithms (TA), the complexity depends on the dynamic regime, i.e., whether the dynamics are overdamped or underdamped. For the digital SOTA case, the complexities of symmetric positive definite linear systems, inverse matrices, Lyapunov equations, and matrix-determinant problems are those for conjugate gradient methods, fast matrix multiplication/inversion, Bartels-Stewart algorithm, and Cholesky decomposition-based algorithms, respectively. represents the matrix multiplication constant.

N회 반복된 시도들에 대한 평균은 다음과 같다. The average over N repeated attempts is as follows:

요약하자면, A1의 행렬식은 다음에 의해 근사된다.In summary, the determinant of A 1 is approximated by

실제로는 계산 오버플로를 피하기 위해 로그 행렬식에 관심이 있을 수 있다. 이는 다음이 된다.In practice, we might be interested in the log determinant to avoid computational overflow. This would be:

로그 행렬식을 오차 δ행렬식내에서 적어도 Pδ의 확률로 추정하기 위하여, 대기 시간은 다음과 같다.To estimate the log determinant within the error δ determinant with a probability of at least P δ , the waiting time is:

21.5 21.5 런타임Runtime 분석 analyze

표는 조밀 대칭적 양의 정부호 행렬에 대한 최신 디지털 방법과 비교하여 얻은 다양한 결과를 요약한다. 이들 결과는 본 발명의 방법의 수렴을 보장하기 위해 적분기들 및 곱셈기들을 이용한 접근법들이 채용될 때 상관 시간, 번인 시간, 및 물리적 대기 시간에 대해 얻은 한계들에 기반한다.The table summarizes various results obtained by comparing with state-of-the-art digital methods for dense symmetric positive definite matrices. These results are based on bounds obtained on correlation time, burn-in time, and physical latency when approaches using integrators and multipliers are employed to ensure convergence of the present method.

22 결론22 Conclusion

다양한 본 발명 실시예가 본 개시에서 설명되고 예시되었지만, 본 기술분야의 통상의 기술자들은 본 개시에서 설명된 기능을 수행하고/하거나 결과들 및/또는 하나 이상의 이점을 얻기 위한 다양한 다른 수단 및/또는 구조를 쉽게 상상할 수 있으며, 이러한 변형들 및/또는 수정들 각각은 본 개시에서 설명된 본 발명 실시예들의 범위 내에 있는 것으로 간주된다. 보다 일반적으로, 당업자는 본 개시에서 설명된 모든 파라미터, 치수, 재료 및 구성이 예시적인 것이고, 실제 파라미터, 치수, 재료 및/또는 구성은 본 발명의 교시 내용이 사용되는 특정 응용 분야에 따라 달라질 수 있음을 쉽게 이해할 것이다. 본 기술분야의 통상의 기술자들은 본 개시에서 설명된 본 발명의 특정 구현예에 대한 많은 등가물을 일상적인 실험만으로 인식하거나 확인할 수 있을 것이다. 그러므로, 상기 실시예들이 단지 예시로서 제시된 것이며, 첨부된 청구항들 및 그 동등물의 범위 내에서, 본 발명의 실시예들이 구체적으로 기술되고 청구된 것과 다른 방식으로 실시될 수 있음은 이해되어야 한다. 본 개시의 발명적 실시예들은 본 개시에서 설명된 각각의 개별적인 특징, 시스템, 물품, 재료, 키트 및/또는 방법에 관한 것이다. 또한, 둘 이상의 이러한 특징, 시스템, 물품, 재료, 키트 및/또는 방법의 임의의 조합은, 이러한 특징, 시스템, 물품, 재료, 키트 및/또는 방법이 서로 모순되지 않는 한, 본 개시의 발명적 범위 내에 포함된다. While various embodiments of the present invention have been described and illustrated in the present disclosure, those skilled in the art will readily envision various other means and/or structures for performing the functions and/or obtaining the results and/or one or more of the advantages described herein, and each of such variations and/or modifications are considered to be within the scope of the embodiments of the present invention described herein. More generally, those skilled in the art will readily appreciate that all parameters, dimensions, materials, and configurations described in the present disclosure are exemplary and that the actual parameters, dimensions, materials, and/or configurations may vary depending upon the particular application for which the teachings of the present invention are used. Those skilled in the art will recognize, or be able to ascertain using no more than routine experimentation, many equivalents to the specific embodiments of the invention described herein. It is therefore to be understood that the foregoing embodiments are presented by way of example only and that, within the scope of the appended claims and their equivalents, embodiments of the present invention may be practiced otherwise than as specifically described and claimed. Inventive embodiments of the present disclosure relate to each individual feature, system, article, material, kit, and/or method described herein. Additionally, any combination of two or more of these features, systems, articles, materials, kits, and/or methods is included within the inventive scope of the present disclosure, so long as these features, systems, articles, materials, kits, and/or methods are not mutually inconsistent.

또한, 다양한 발명적 개념들은 예기 제공된 하나 이상의 방법으로서 실시될 수 있다. 방법의 일부로서 수행되는 액트(act)들은 임의의 적절한 방식으로 순서화될 수 있다. 따라서, 예시된 것과 다른 순서로 액트들이 수행되는 실시예들이 구성될 수 있으며, 이는 예시적인 실시예에서 순차적인 액트들로서 도시되어 있더라도 일부 액트들을 동시에 수행하는 것을 포함할 수 있다. Additionally, the various inventive concepts may be implemented as one or more of the methods provided herein. The acts performed as part of the methods may be sequenced in any suitable manner. Thus, embodiments may be constructed in which the acts are performed in a different order than illustrated, including performing some of the acts concurrently, even if they are depicted as sequential acts in the exemplary embodiments.

본 개시에서 정의되고 사용되는 모든 정의들은 사전적 정의, 참조로 포함된 문서 내의 정의, 및/또는 정의된 용어의 일반적인 의미를 통제하는 것으로 이해되어야 한다. All definitions defined and used in this disclosure should be understood to control over dictionary definitions, definitions in documents incorporated by reference, and/or the ordinary meaning of the defined term.

본 명세서 및 청구범위에서 사용되는 부정 관사 "a" 및 "an"의 사용에 해당하는 표현은, 달리 명확하게 표시되지 않는 한, "적어도 하나"를 의미하는 것으로 이해되어야 한다.The expressions corresponding to the use of the indefinite articles “a” and “an” as used in this specification and claims should be understood to mean “at least one,” unless otherwise expressly indicated.

본 명세서 및 청구범위에서 사용되는 "및/또는"이라는 문구는 그렇게 함께 연결된 구성요소들 중 "어느 하나 또는 둘 다", 즉 어떤 경우들에는 공접적으로(conjunctively) 존재하고 다른 경우에는 이접적으로(disjunctively) 존재하는 구성요소들을 의미하는 것으로 이해되어야 한다. "및/또는"와 함께 나열된 여러 구성요소는 동일한 방식으로, 즉, 그렇게 함께 연결된 구성요소들 중 "하나 이상"으로 해석되어야 한다. "및/또는" 절에 의해 구체적으로 식별된 구성요소들 외에, 구체적으로 식별된 구성요소와 관련되거나 관련되지 않은 다른 구성요소가 선택적으로 존재할 수 있다. 따라서, 비제한적인 예로서, "A 및/또는 B"에 대한 언급은, "포함하는"과 같은 개방형 언어와 연계하여 사용될 때, 한 구현예에서는 A만(선택적으로 B 외의 구성요소를 포함함)을 지칭할 수 있으며; 다른 구현예에서는 B만(선택적으로 A 외의 구성요소를 포함함)을 지칭할 수 있으며; 또 다른 구현예에서는 A 및 B 모두(선택적으로 다른 구성요소를 포함함)를 지칭할 수 있으며; 등등이다. The phrase "and/or" as used in this specification and claims should be understood to mean "either or both" of the elements so linked together, i.e., elements that are conjunctively present in some cases and disjunctively present in other cases. Multiple elements listed with "and/or" should be construed in the same manner, i.e., "one or more" of the elements so linked together. In addition to the elements specifically identified by the "and/or" clause, other elements may optionally be present, related or unrelated to the elements specifically identified. Thus, as a non-limiting example, reference to "A and/or B," when used in conjunction with open-ended language such as "comprising," may in one embodiment refer to A alone (optionally including elements other than B); in another embodiment refer to B alone (optionally including elements other than A); in another embodiment refer to both A and B (optionally including other elements); and so forth.

본 명세서 및 청구범위에서 사용되는 바와 같이, "또는"은 위에서 정의된 바와 같은 "및/또는"과 동일한 의미를 갖는 것으로 이해되어야 한다. 예를 들어, 목록에서 항목들을 구분할 때, "또는" 또는 "및/또는"은 다수의 구성요소 또는 구성요소 목록 중 하나 이상을 포함하거나, 선택적으로 목록에 없는 추가적인 항목을 포함하는 것으로 해석되어야 한다. "~중 하나만" 또는 "~중 정확히 하나만", 또는 청구항들에서 사용될 때, "~로 구성되는"과 같이 반대를 명확하게 지시하는 용어들만이 다수의 구성요소 또는 구성요소 목록 중 정확히 하나의 구성요소를 포함함을 의미한다. 일반적으로, 본 개시에서 사용되는 "또는"이란 용어는 "어느 하나", "~중 하나", "~중 하나만" 또는 "~중 정확히 하나만"과 같은 배타적 용어가 앞에 오는 경우에만 배타적 택일(즉, "둘 중 하나만이지만 둘 다 아님")을 나타내는 것으로 해석된다. "본질적으로 ~로 구성되는"은, 청구항들에서 사용될 때, 특허법 분야에서 사용되는 일반적인 의미를 갖는다. As used in this specification and claims, “or” should be understood to have the same meaning as “and/or” as defined above. For example, when separating items in a list, “or” or “and/or” should be interpreted to include more than one of a plurality of elements or a list of elements, or optionally, additional items not listed. Only terms that clearly indicate the opposite, such as “only one of,” “exactly one of,” or, when used in the claims, “consisting of,” mean the inclusion of exactly one element of a plurality of elements or a list of elements. In general, the term “or” as used herein is interpreted to indicate an exclusive alternative (i.e., “either one, but not both”) only when preceded by an exclusive term such as “either,” “one of,” “only one of,” or “exactly one of.” “Consisting essentially of,” when used in the claims, has its ordinary meaning in the patent law art.

본 명세서 및 청구범위에서 사용되는 "적어도 하나"라는 문구는 하나 이상의 구성요소의 목록을 참조할 때, 구성요소 목록에 있는 하나 이상의 구성요소로부터 선택된 적어도 하나의 구성요소를 의미하는 것으로 이해되어야 하지만, 구성요소 목록에 구체적으로 나열된 모든 구성요소를 반드시 적어도 하나 포함하는 것은 아니며, 구성요소 목록에 있는 구성요소들의 어떠한 조합들도 배제하지 않는다. 또한, 이 정의는 "적어도 하나"라는 문구가 지칭하는 구성요소 목록내에서 구체적으로 식별된 구성요소 외에, 구체적으로 식별된 구성요소와 관련되거나 관련되지 않은 구성요소가 선택적으로 존재할 수 있음을 허용한다. 따라서, 비제한적인 예로서, "A와 B 중 적어도 하나"(또는 동등하게 "A 또는 B 중 적어도 하나", 또는 동등하게 "A 및/또는 B 중 적어도 하나")는, 일 실시예에서, B가 존재하지 않고 A만 하나 이상을 선택적으로 포함하는 (그리고 선택적으로 B 외의 구성요소를 포함하는) 적어도 하나; 다른 실시예에서, A가 존재하지 않고 B만 하나 이상을 선택적으로 포함하는 (그리고 선택적으로 A 외의 구성요소를 포함하는) 적어도 하나; 또 다른 실시예에서, 선택적으로 하나 이상의 A를 포함하는 적어도 하나와 선택적으로 하나 이상의 B를 포함하는 적어도 하나(그리고 선택적으로 기타 구성요소들을 포함함); 등을 말한다. The phrase "at least one," as used in this specification and claims, when referring to a list of one or more elements, should be understood to mean at least one element selected from one or more of the elements in the list of elements, but does not necessarily include at least one of every element specifically listed in the list of elements, and does not exclude any combinations of elements in the list of elements. Furthermore, this definition allows that, in addition to the elements specifically identified in the list of elements to which the phrase "at least one" refers, there may optionally be elements, related or unrelated, to the elements specifically identified. Thus, as a non-limiting example, "at least one of A and B" (or, equivalently, "at least one of A or B," or, equivalently, "at least one of A and/or B") means, in one embodiment, at least one of A alone, optionally including one or more of A without B being present (and, optionally, including elements other than B); in another embodiment, at least one of B alone, optionally including one or more of A without A being present (and, optionally, including elements other than A); In another embodiment, at least one comprising optionally one or more As, and optionally one or more Bs (and optionally other components); etc.

청구항들에서, "포함하는(comprising)", "포함/구비하는(including)," "운반하는(carrying)", "갖는(having)", "함유하는(containing)", "수반하는(involving)", "유지하는(holding)", "구성되는(composed of)" 등과 같은 모든 연결문구(transitional phrase)들은 개방형, 즉 포함하지만 이에 국한되지 않는 것을 의미하는 것으로 이해되어야 한다. "구성되는(consisting of)" 및 "본질적으로 ~로 구성되는(consisting essentially of)" 연결문구들만이 각각 미국 특허청 특허 심사 절차 편람(United States Patent Office Manual of Patent Examining Procedures) §2111.03에 명시된 바와 같이 각각 폐쇄형 또는 반폐쇄형 연결문구이다. In the claims, all transitional phrases such as "comprising," "including," "carrying," "having," "containing," "involving," "holding," "composed of," and the like are to be understood as open-ended, meaning including but not limited to. Only the transitional phrases "consisting of" and "consisting essentially of" are closed or semi-closed transitional phrases, respectively, as specified in United States Patent Office Manual of Patent Examining Procedures §2111.03.

Claims (32)

다변량 분포를 샘플링하는 시스템에 있어서,
상기 다변량 분포를 샘플링하는 아날로그 전기 회로 네트워크로서, 상기 아날로그 전기 회로 네트워크의 각 아날로그 전기 회로가 적어도 하나의 조정가능 수동형 전기 부품을 포함하는, 상기 아날로그 전기 회로 네트워크; 및
상기 아날로그 전기 회로 네트워크에 동작 가능하게 결합되어, 상기 다변량 분포의 파라미터들에 따라 상기 조정가능 수동형 전기 부품을 조정하고 상기 아날로그 전기 회로 네트워크 내의 지점들에서 전압들을 샘플링하는 디지털 컨트롤러를 포함하는, 시스템.
In a system that samples a multivariate distribution,
An analog electrical circuit network for sampling the multivariate distribution, wherein each analog electrical circuit of the analog electrical circuit network includes at least one adjustable passive electrical component; and
A system comprising a digital controller operably coupled to said analog electrical circuit network, said digital controller adjusting said adjustable passive electrical component in accordance with parameters of said multivariate distribution and sampling voltages at points within said analog electrical circuit network.
제1항에 있어서, 상기 적어도 하나의 조정가능 수동형 전기 부품은 조정가능 커패시터 또는 조정가능 저항기 중 적어도 하나를 포함하는, 시스템. A system in accordance with claim 1, wherein the at least one adjustable passive electrical component comprises at least one of an adjustable capacitor or an adjustable resistor. 제1항에 있어서, 상기 적어도 하나의 조정가능 수동형 전기 부품은 조정가능 인덕터를 포함하는, 시스템. A system in accordance with claim 1, wherein the at least one adjustable passive electrical component comprises an adjustable inductor. 제1항에 있어서,
상기 아날로그 전기 회로 네트워크에 동작 가능하게 결합되어, 상기 다변량 분포를 수정하는 전압 제어 전압원을 더 포함하는, 시스템.
In the first paragraph,
A system further comprising a voltage-controlled voltage source operably coupled to said analog electrical circuit network, said voltage-controlled voltage source modifying said multivariate distribution.
제4항에 있어서, 상기 전압 제어 전압원은 인공 신경망을 채용하여 상기 전압 제어 전압원에의 입력 전압과 상기 전압 제어 전압원의 출력 전압을 관련짓는, 시스템. In the fourth paragraph, the voltage-controlled voltage source is a system that uses an artificial neural network to relate an input voltage to the voltage-controlled voltage source and an output voltage of the voltage-controlled voltage source. 제5항에 있어서, 상기 입력 전압은 상기 디지털 컨트롤러에 의해 샘플링된 전압들에 기반하고, 상기 전압 제어 전압원은 상기 아날로그 전기 회로 네트워크에 상기 출력 전압을 인가하여 상기 아날로그 전기 회로 네트워크 전체의 퍼텐셜 에너지 분포를 변경하도록 구성되는, 시스템. In the fifth paragraph, the input voltage is based on voltages sampled by the digital controller, and the voltage control voltage source is configured to apply the output voltage to the analog electric circuit network to change the potential energy distribution of the entire analog electric circuit network. 제1항에 있어서, 상기 다변량 분포는 적어도 3차의 0이 아닌 큐뮬런트(cumulant)를 가지고, 상기 시스템은,
상기 아날로그 전기 회로 네트워크의 적어도 3개의 아날로그 전기 회로에 동작 가능하게 결합되어, 상기 아날로그 전기 회로 네트워크 전체의 퍼텐셜 에너지 분포에서 k체 항 ― k는 3 이상의 정수임 ― 을 생성하는 멀티포트 소자를 더 포함하는, 시스템.
In the first aspect, the multivariate distribution has a non-zero cumulant of at least the third order, and the system,
A system further comprising a multiport element operably coupled to at least three analog electrical circuits of said analog electrical circuit network, said multiport element generating a k -field term in the potential energy distribution of said analog electrical circuit network as a whole, wherein k is an integer greater than or equal to 3.
제7항에 있어서, 상기 멀티포트 소자는 트랜지스터 또는 전압 제어 커패시터 중 적어도 하나를 포함하는, 시스템.A system in accordance with claim 7, wherein the multiport element comprises at least one of a transistor or a voltage-controlled capacitor. 제1항에 있어서, 각 아날로그 전기 회로는 확률적 잡음원을 더 포함하는, 시스템. A system in accordance with claim 1, wherein each analog electrical circuit further includes a probabilistic noise source. 제9항에 있어서, 상기 확률적 잡음원은 열 잡음원, 샷 잡음원 또는 디지털 의사 랜덤 잡음원 중 하나인, 시스템. A system in claim 9, wherein the probabilistic noise source is one of a thermal noise source, a shot noise source, or a digital pseudo-random noise source. 제1항에 있어서, 상기 아날로그 전기 회로 네트워크 내의 아날로그 전기 회로들은 용량성 및/또는 저항성 결합을 통해 서로 결합되는, 시스템. A system in accordance with claim 1, wherein the analog electrical circuits within the analog electrical circuit network are coupled to each other via capacitive and/or resistive coupling. 제1항에 있어서, 상기 시스템은 랑주뱅 몬테카를로 알고리즘 및/또는 메트로폴리스 조정 랑주뱅 알고리즘을 통해 상기 다변량 분포로부터 샘플들을 생성하도록 구성되는, 시스템. In the first aspect, the system is configured to generate samples from the multivariate distribution via a Langevin Monte Carlo algorithm and/or a Metropolis-adjusted Langevin algorithm. 제1항에 있어서, 상기 다변량 분포는 상기 아날로그 전기 회로 네트워크의 파라미터들 중 적어도 일부에 공분산 행렬이 인코딩된 가우시안 분포인, 시스템. A system in accordance with claim 1, wherein the multivariate distribution is a Gaussian distribution in which a covariance matrix is encoded in at least some of the parameters of the analog electrical circuit network. 다변량 분포를 샘플링하는 시스템에 있어서,
상기 다변량 분포에 매핑되는 총 에너지 함수에 의해 특성화되는 결합된 아날로그 단위 셀 네트워크로서, 상기 결합된 아날로그 단위 셀 네트워크의 각 결합된 아날로그 단위 셀이 디지털 조정가능 커패시터와 디지털 조정가능 전압원 및/또는 디지털 조정가능 전류원을 포함하는, 상기 결합된 아날로그 단위 셀 네트워크; 및
상기 결합된 아날로그 단위 셀 네트워크에 동작 가능하게 결합되는 디지털 컨트롤러를 포함하며, 상기 디지털 컨트롤러는,
상기 디지털 조정가능 커패시터들, 상기 디지털 조정가능 전압원들 및/또는 상기 디지털 조정가능 전류원들을 초기화하며;
상기 결합된 아날로그 단위 셀 네트워크의 노드들에서의 전압들 및 전류들을 반복적으로 판독하고 상기 디지털 조정가능 전압원들 및/또는 상기 디지털 조정가능 전류원들을 업데이트하며, 상기 전압들 및 상기 전류들은 상기 총 에너지 함수의 위치들 및 운동량들에 해당하며; 그리고
상기 전압들 및 상기 전류들을 상기 다변량 분포의 샘플들로 변환하는, 시스템.
In a system that samples a multivariate distribution,
A coupled analog unit cell network characterized by a total energy function mapped to the multivariate distribution, wherein each coupled analog unit cell of the coupled analog unit cell network comprises a digitally adjustable capacitor and a digitally adjustable voltage source and/or a digitally adjustable current source; and
A digital controller operably coupled to the above combined analog unit cell network, said digital controller comprising:
Initializing the digitally adjustable capacitors, the digitally adjustable voltage sources and/or the digitally adjustable current sources;
Iteratively reading voltages and currents at nodes of the coupled analog unit cell network and updating the digitally adjustable voltage sources and/or the digitally adjustable current sources, wherein the voltages and the currents correspond to positions and momentums of the total energy function; and
A system that converts the above voltages and the above currents into samples of the above multivariate distribution.
제14항에 있어서, 상기 총 에너지 함수는 해밀토니안이고, 상기 결합된 아날로그 단위 셀 네트워크는 해밀토니안 몬테카를로 프로토콜을 실행하는 데 사용되는 동역학을 갖는, 시스템. A system in accordance with claim 14, wherein the total energy function is Hamiltonian, and the coupled analog unit cell network has dynamics that are used to execute a Hamiltonian Monte Carlo protocol. 제14항에 있어서, 상기 결합된 아날로그 단위 셀 네트워크는 랑주뱅 몬테카를로 프로토콜을 실행하는 데 사용되는 동역학을 갖는, 시스템. In claim 14, the coupled analog unit cell network has dynamics used to execute the Langevin Monte Carlo protocol, the system. 제14항에 있어서, 상기 결합된 아날로그 단위 셀 네트워크는 상기 다변량 분포의 각 차원에 대해 하나의 아날로그 단위 셀을 포함하는, 시스템. A system in accordance with claim 14, wherein the coupled analog unit cell network comprises one analog unit cell for each dimension of the multivariate distribution. 제14항에 있어서, 상기 결합된 아날로그 단위 셀 네트워크의 각 아날로그 단위 셀은 디지털 조정가능 인덕터를 포함하는, 시스템. A system in accordance with claim 14, wherein each analog unit cell of the coupled analog unit cell network comprises a digitally adjustable inductor. 제14항에 있어서, 상기 결합된 아날로그 단위 셀 네트워크의 아날로그 단위 셀들은 서로 용량성 결합되는, 시스템. A system in accordance with claim 14, wherein the analog unit cells of the coupled analog unit cell network are capacitively coupled to each other. 제14항에 있어서, 상기 결합된 아날로그 단위 셀 네트워크의 아날로그 단위 셀들은 서로 저항성 결합되는, 시스템. A system in accordance with claim 14, wherein the analog unit cells of the coupled analog unit cell network are resistively coupled to each other. 제14항에 있어서, 상기 아날로그 단위 셀 네트워크의 아날로그 단위 셀들은 서로 유도성 결합되는, 시스템. A system in which the analog unit cells of the analog unit cell network in the 14th paragraph are inductively coupled to each other. 제14항에 있어서, 상기 다변량 분포는 다변량 가우시안 분포인, 시스템. A system in claim 14, wherein the multivariate distribution is a multivariate Gaussian distribution. 제14항에 있어서, 상기 다변량 분포는 2차보다 높은 0이 아닌 큐뮬런트를 갖는, 시스템. A system in claim 14, wherein the multivariate distribution has a non-zero cumulant higher than the second order. 다변량 분포를 샘플링하는 시스템에 있어서,
기울기 계산기;
상기 기울기 계산기에 동작 가능하게 결합되는 운동량 적분기 장치; 및
상기 운동량 적분기 장치에 동작 가능하게 결합되는 위치 적분기 장치를 포함하는, 시스템.
In a system that samples a multivariate distribution,
slope calculator;
a momentum integrator device operably coupled to said slope calculator; and
A system comprising a position integrator device operably coupled to said momentum integrator device.
제24항에 있어서, 상기 기울기 계산기는 아날로그 신경망을 포함하는, 시스템. In claim 24, the system wherein the slope calculator includes an analog neural network. 제24항에 있어서, 상기 기울기 계산기는 저항 회로 소자 네트워크를 포함하는, 시스템. In claim 24, the slope calculator is a system comprising a network of resistive circuit elements. 목표 확률 분포를 샘플링하는 열역학 시스템에 있어서,
랑주뱅 방정식 및/또는 해밀턴 운동 방정식들을 통해 진화하도록 구성되는 아날로그 동역학 시스템; 및
상기 아날로그 동역학 시스템에 동작 가능하게 결합되고, 상기 랑주뱅 방정식 및/또는 해밀턴 운동 방정식들의 각 시간 단계에서, 상기 아날로그 동역학 시스템으로부터 목표 확률 분포의 제안된 샘플을 수신하고 상기 제안된 샘플을 수용하거나 거부하도록 구성되는 디지털 컨트롤러를 포함하는, 열-동역학 시스템.
In a thermodynamic system that samples a target probability distribution,
An analog dynamical system configured to evolve through the Langevin equations and/or Hamiltonian equations of motion; and
A thermo-dynamic system comprising a digital controller operably coupled to said analog dynamical system and configured to receive, at each time step of said Langevin equations and/or Hamiltonian equations of motion, a proposed sample of a target probability distribution from said analog dynamical system and to accept or reject said proposed sample.
행렬의 역을 구하는 방법에 있어서,
아날로그 단위 셀 네트워크의 조정가능 회로 소자들의 각각의 값들에 행렬의 원소들을 업로드하는 단계;
상기 아날로그 단위 셀 네트워크가 열 평형에 도달하도록 허용하는 단계; 및
상기 아날로그 단위 셀 네트워크의 동역학 변수들에 기반하여 공분산 행렬을 계산하는 단계로서, 상기 공분산 행렬은 상기 행렬의 역행렬인, 상기 계산하는 단계를 포함하는, 방법.
In the method of finding the inverse of a matrix,
A step of uploading elements of a matrix to each value of the adjustable circuit elements of an analog unit cell network;
a step of allowing the above analog unit cell network to reach thermal equilibrium; and
A method comprising the step of calculating a covariance matrix based on dynamic variables of the analog unit cell network, wherein the covariance matrix is an inverse matrix of the matrix.
제28항에 있어서, 상기 공분산 행렬을 계산하는 단계는,
상기 아날로그 단위 셀 네트워크의 상기 동역학 변수들의 열 평형 분포에서 샘플들을 추출하는 단계; 및
상기 샘플들의 상기 공분산 행렬을 계산하는 단계를 포함하는, 방법.
In the 28th paragraph, the step of calculating the covariance matrix comprises:
A step of extracting samples from the thermal equilibrium distribution of the dynamic variables of the above analog unit cell network; and
A method comprising the step of calculating the covariance matrix of the above samples.
제28항에 있어서, 상기 공분산 행렬을 계산하는 단계는, 복수의 아날로그 적분기를 이용하여 시간 경과에 따라 상기 동역학 변수들을 적분하는 단계를 포함하는, 방법. A method according to claim 28, wherein the step of calculating the covariance matrix comprises the step of integrating the dynamic variables over time using a plurality of analog integrators. 행렬과 벡터에 의해 표현되는 선형 방정식 시스템을 푸는 방법에 있어서,
아날로그 단위 셀 네트워크의 조정가능 회로 소자들의 각각의 값들에 행렬의 원소들을 업로드하는 단계;
벡터의 요소들을 아날로그 단위 셀들의 각각의 전류원들이나 전압원들에 업로드하는 단계;
상기 아날로그 단위 셀 네트워크가 열 평형에 도달하도록 허용하는 단계; 및
상기 아날로그 단위 셀 네트워크의 동역학 변수들의 평균값들을 계산하는 단계로서, 상기 평균값들은 연립 선형 방정식의 해를 나타내는, 상기 계산하는 단계를 포함하는, 방법.
In a method for solving a system of linear equations expressed by matrices and vectors,
A step of uploading elements of a matrix to each value of the adjustable circuit elements of an analog unit cell network;
A step of uploading the elements of the vector to the respective current sources or voltage sources of the analog unit cells;
a step of allowing the above analog unit cell network to reach thermal equilibrium; and
A method comprising the step of calculating average values of dynamic variables of the analog unit cell network, wherein the average values represent solutions to simultaneous linear equations.
제31항에 있어서, 상기 평균값들을 계산하는 단계는 복수의 아날로그 적분기를 이용하여 시간 경과에 따라 상기 동역학 변수들을 적분하는 단계를 포함하는, 방법. A method according to claim 31, wherein the step of calculating the average values comprises the step of integrating the dynamic variables over time using a plurality of analog integrators.
KR1020257015307A 2022-10-14 2023-10-13 A thermodynamic computational system for sampling high-dimensional probability distributions Pending KR20250109682A (en)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US202263379561P 2022-10-14 2022-10-14
US63/379,561 2022-10-14
US202363492832P 2023-03-29 2023-03-29
US63/492,832 2023-03-29
US202363518545P 2023-08-09 2023-08-09
US63/518,545 2023-08-09
PCT/US2023/076759 WO2024081827A1 (en) 2022-10-14 2023-10-13 Thermodynamic computing system for sampling high-dimensional probability distributions

Publications (1)

Publication Number Publication Date
KR20250109682A true KR20250109682A (en) 2025-07-17

Family

ID=90670194

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020257015307A Pending KR20250109682A (en) 2022-10-14 2023-10-13 A thermodynamic computational system for sampling high-dimensional probability distributions

Country Status (3)

Country Link
EP (1) EP4602521A1 (en)
KR (1) KR20250109682A (en)
WO (1) WO2024081827A1 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN119509611B (en) * 2024-10-21 2025-09-09 中国大唐集团科技创新有限公司 Floating type offshore wind power multi-body coupling real-time monitoring system and method

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
MX9702434A (en) * 1991-03-07 1998-05-31 Masimo Corp Signal processing apparatus.
GB2451701B (en) * 2007-08-10 2012-04-11 Fujitsu Ltd Method, apparatus and computer program for molecular simulation
US9990580B2 (en) * 2015-03-13 2018-06-05 International Business Machines Corporation Neuromorphic synapses
WO2017105517A1 (en) * 2015-12-18 2017-06-22 Hewlett Packard Enterprise Development Lp Memristor crossbar arrays to activate processors
WO2019155064A1 (en) * 2018-02-09 2019-08-15 Deepmind Technologies Limited Data compression using jointly trained encoder, decoder, and prior neural networks
US20210049504A1 (en) * 2019-08-14 2021-02-18 Rain Neuromorphics Inc. Analog system using equilibrium propagation for learning
US11093794B1 (en) * 2020-02-13 2021-08-17 United States Of America As Represented By The Secretary Of The Navy Noise-driven coupled dynamic pattern recognition device for low power applications
US20220076130A1 (en) * 2020-08-31 2022-03-10 International Business Machines Corporation Deep surrogate langevin sampling for multi-objective constraint black box optimization with applications to optimal inverse design problems

Also Published As

Publication number Publication date
WO2024081827A1 (en) 2024-04-18
EP4602521A1 (en) 2025-08-20

Similar Documents

Publication Publication Date Title
Elsken et al. Efficient multi-objective neural architecture search via lamarckian evolution
Leenaerts et al. Piecewise linear modeling and analysis
Lin et al. Real-and imaginary-time evolution with compressed quantum circuits
Bohra et al. Learning activation functions in deep (spline) neural networks
CN108701263B (en) Devices for coupling qubits and methods for training quantum processors to solve machine learning inference problems
Manganaro et al. Cellular neural networks: chaos, complexity and VLSI processing
WO2020231795A1 (en) Frequency tunable qubit control strategy
Kossaifi et al. Multi-grid tensorized fourier neural operator for high-resolution pdes
Medvidović et al. Neural-network quantum states for many-body physics
Penkovsky et al. Efficient design of hardware-enabled reservoir computing in FPGAs
CN117043789A (en) Quantum generation countermeasure network with provable convergence
US20220358392A1 (en) Parallel cross entropy benchmarking
EP4627417A1 (en) Thermodynamic artificial intelligence for generative diffusion models and bayesian deep learning
KR20250109682A (en) A thermodynamic computational system for sampling high-dimensional probability distributions
JP7714799B2 (en) Performing property estimation using quantum gradient operations in quantum computing systems
Ledinauskas et al. Scalable imaginary time evolution with neural network quantum states
Baker Block Lanczos method for excited states on a quantum computer
Sentz et al. Reduced basis approximations of parameterized dynamical partial differential equations via neural networks
Livingston Continuous feedback on quantum superconducting circuits
Nutakki et al. Design principles of deep translationally-symmetric neural quantum states for frustrated magnets
Pezeshkpour Compact factorization of matrices using generalized round-rank
Elliott First passage time memory lifetimes for multistate, filter-based synapses
Smith Improving Near-term Quantum Algorithms with Techniques from Machine Learning
Madala et al. MNO: A Multi-modal Neural Operator for Parametric Nonlinear BVPs
Thompson et al. Thinking inside the box: Novel linear scaling algorithm for Coulomb potential evaluation

Legal Events

Date Code Title Description
PA0105 International application

St.27 status event code: A-0-1-A10-A15-nap-PA0105

P11-X000 Amendment of application requested

St.27 status event code: A-2-2-P10-P11-nap-X000

P13-X000 Application amended

St.27 status event code: A-2-2-P10-P13-nap-X000

PG1501 Laying open of application

St.27 status event code: A-1-1-Q10-Q12-nap-PG1501