JPH01131950A - 相互結合ネツトワークおよびそのためのクロスバスイツチ - Google Patents
相互結合ネツトワークおよびそのためのクロスバスイツチInfo
- Publication number
- JPH01131950A JPH01131950A JP62289323A JP28932387A JPH01131950A JP H01131950 A JPH01131950 A JP H01131950A JP 62289323 A JP62289323 A JP 62289323A JP 28932387 A JP28932387 A JP 28932387A JP H01131950 A JPH01131950 A JP H01131950A
- Authority
- JP
- Japan
- Prior art keywords
- processor
- crossbar switch
- dimension
- destination
- processors
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Multi Processors (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔産業上の利用分野〕
本発明は並列計算機の要素プロセッサの相互結合方式に
係り、特に高い結合能力が必要でありながらプロセッサ
台数が多くてフルクロスバスイッチでは全部を結合出来
ない場合に好適なスイッチ構成に関する。
係り、特に高い結合能力が必要でありながらプロセッサ
台数が多くてフルクロスバスイッチでは全部を結合出来
ない場合に好適なスイッチ構成に関する。
従来の装置は、各要素プロセッサを一本または数本のバ
スに結合する一般的な方法の他、特開昭58−1811
68に記載のように、格子状に配列された要素プロセッ
サの隣合うもの同士を結合する方式、特開昭59−10
9966に記載のように、全要素プロセッサを(フル)
クロスバスイッチで結合する方式、特開昭62−235
3に記載のように、全要素プロセッサを多段スイッチで
結合する方式、文献1に記載のように、超立方体結合を
取るもの等が代表的である。
スに結合する一般的な方法の他、特開昭58−1811
68に記載のように、格子状に配列された要素プロセッ
サの隣合うもの同士を結合する方式、特開昭59−10
9966に記載のように、全要素プロセッサを(フル)
クロスバスイッチで結合する方式、特開昭62−235
3に記載のように、全要素プロセッサを多段スイッチで
結合する方式、文献1に記載のように、超立方体結合を
取るもの等が代表的である。
文献1ニジ−・エル・サイン「ザ コスミックキューブ
」、コミュニケーションズ オブ ザエーシーエム、2
8巻、1号、22〜33頁、1985年(C,L、5a
itz ”The Co5m1c Cube”。
」、コミュニケーションズ オブ ザエーシーエム、2
8巻、1号、22〜33頁、1985年(C,L、5a
itz ”The Co5m1c Cube”。
com+nunicationN of theA
CM、vo1、 28. no、 1、 pp、
22−33.1985)〔発明が解決しようとする問
題点〕 上記従来技術のうち、バス結合方式はハードウェアの量
が少ないという利点があるが、結合されている要素プロ
セッサ台数が多いと、バスの競合により性能が低下する
という問題点があり、十数台が限度とされている6 格子状結合(メツシュ結合ともいう)は同じくハードウ
ェアの量が少なく、しがも多数の要素プロセッサを結合
できる反面、隣接プロセッサとしか交信出来ないためそ
の通信性能は扱う問題の性質に大きく依存する。近傍計
算に向く偏微分方程式の求解9画像処理等は良いが、有
限要素法や高速フーリエ変換(FFT)、論理/回路シ
ミュレーション等では通信のオーバヘッドが著しくなる
。
CM、vo1、 28. no、 1、 pp、
22−33.1985)〔発明が解決しようとする問
題点〕 上記従来技術のうち、バス結合方式はハードウェアの量
が少ないという利点があるが、結合されている要素プロ
セッサ台数が多いと、バスの競合により性能が低下する
という問題点があり、十数台が限度とされている6 格子状結合(メツシュ結合ともいう)は同じくハードウ
ェアの量が少なく、しがも多数の要素プロセッサを結合
できる反面、隣接プロセッサとしか交信出来ないためそ
の通信性能は扱う問題の性質に大きく依存する。近傍計
算に向く偏微分方程式の求解9画像処理等は良いが、有
限要素法や高速フーリエ変換(FFT)、論理/回路シ
ミュレーション等では通信のオーバヘッドが著しくなる
。
フルクロスバスイッチ結合はマトリックススイッチによ
り全ての要素プロセッサを完全結合するものである。そ
のため、性能的にはあらゆる結合の中で最高であるが、
ハードウェア量が要素プロセッサ台数2乗に比例するた
め、一般には数十台程度が結合限度とされている。
り全ての要素プロセッサを完全結合するものである。そ
のため、性能的にはあらゆる結合の中で最高であるが、
ハードウェア量が要素プロセッサ台数2乗に比例するた
め、一般には数十台程度が結合限度とされている。
多段スイッチはハードウェア量が要素プロセッサ台数を
LとするとL logz L程度に抑えられ、しかも完
全結合が可能であるため、多数の要素プロセッサを含む
超並列計算機向きの結合方式とされてきた。しかし、通
信路の長さ(中継段数)が約1ogz L程度となり転
送遅延が大きいこと、また多数の要素プロセッサが同じ
共有変換をアクセスしようとすると、複数のアクセスバ
スが途中の通信経路を奪いあいホットスポットコンテン
ションと呼ばれるネットワークの全面マヒ(マヒは全て
のアクセスに波及する)が生じること、ホットスポット
コンテンションに至らなくてもアクセス競合が大きく性
能が出ないこと1等の問題点が指摘されている。
LとするとL logz L程度に抑えられ、しかも完
全結合が可能であるため、多数の要素プロセッサを含む
超並列計算機向きの結合方式とされてきた。しかし、通
信路の長さ(中継段数)が約1ogz L程度となり転
送遅延が大きいこと、また多数の要素プロセッサが同じ
共有変換をアクセスしようとすると、複数のアクセスバ
スが途中の通信経路を奪いあいホットスポットコンテン
ションと呼ばれるネットワークの全面マヒ(マヒは全て
のアクセスに波及する)が生じること、ホットスポット
コンテンションに至らなくてもアクセス競合が大きく性
能が出ないこと1等の問題点が指摘されている。
超立方体結合(ハイパーキューブ)は、比較的効率の良
い通信が行える結合として知られているが、プログラム
上で通信相手を指定しなくてはならずプログラミングが
煩雑となる。これを避けるために、各要素プロセッサ対
応に自動中継機構を設けると、ハードウェア量が増大す
る。また、結線が交差するので実装が面倒であるという
問題がある。
い通信が行える結合として知られているが、プログラム
上で通信相手を指定しなくてはならずプログラミングが
煩雑となる。これを避けるために、各要素プロセッサ対
応に自動中継機構を設けると、ハードウェア量が増大す
る。また、結線が交差するので実装が面倒であるという
問題がある。
大規模な数値計算の並列処理においては、しばしば特定
のプロセッサ間通信バタンか現れることが知られている
。代表的なものとしては、格子結合、リング結合、バタ
フライ結合が挙げられる。
のプロセッサ間通信バタンか現れることが知られている
。代表的なものとしては、格子結合、リング結合、バタ
フライ結合が挙げられる。
従って、これら特定のパタンの通信が高速に処理できる
ならば、そのネットワークの有効性は大であるといえる
。上記の従来技術のうち、格子結合。
ならば、そのネットワークの有効性は大であるといえる
。上記の従来技術のうち、格子結合。
リング結合、バタフライ結合を自身の結合トポロジーと
して内包しており、中継動作を必要とせずにこれらのパ
タンで通信できるのは、フルクロスバスイッチと超立方
体結合だけである。バス結合。
して内包しており、中継動作を必要とせずにこれらのパ
タンで通信できるのは、フルクロスバスイッチと超立方
体結合だけである。バス結合。
格子結合、多段スイッチはいずれも、これら特定パタン
の通信全てを高速に処理することはできない、また、特
殊な例として、文献2には2台のプロセッサの結合を基
本とする2構成の超立方体結合を複数台のプロセッサの
結合を基本にした構成に拡張したSpanning B
us )lypercubaが紹介されているが、複数
台のプロセッサはバス結合されているため一時には2台
のプロセッサしか通信出来ず、上記結合トポロジーを内
包しているとはみなせない。
の通信全てを高速に処理することはできない、また、特
殊な例として、文献2には2台のプロセッサの結合を基
本とする2構成の超立方体結合を複数台のプロセッサの
結合を基本にした構成に拡張したSpanning B
us )lypercubaが紹介されているが、複数
台のプロセッサはバス結合されているため一時には2台
のプロセッサしか通信出来ず、上記結合トポロジーを内
包しているとはみなせない。
文献2:ダルマ・ピー・アグラワル他「エバリュエイテ
イング ザ パフォーマンス オブ マルチコンピュー
タ コンフィギユレーション」。
イング ザ パフォーマンス オブ マルチコンピュー
タ コンフィギユレーション」。
アイ・イー・イー・イーコンピュータ、メイ。
1986.28〜29頁、1986年
(Dharma P、 Agrawal e1、 a1
、’ Evaluating thePerforma
nce of Multicon+puter Con
figurationN”。
、’ Evaluating thePerforma
nce of Multicon+puter Con
figurationN”。
May 1986.pp、28−29,1986)以上
の譜問題のうち、バス結合における結合台数制約の問題
は、要素プロセッサ台数が多い場合には解決することが
出来ない。また、格子結合における扱う問題の性質によ
って性能が大幅に変わる点、多段スイッチのホットスポ
ットコンテンションの問題はいずれも基本的かつ本質的
な問題であり、現状では解決されていない。さらに。
の譜問題のうち、バス結合における結合台数制約の問題
は、要素プロセッサ台数が多い場合には解決することが
出来ない。また、格子結合における扱う問題の性質によ
って性能が大幅に変わる点、多段スイッチのホットスポ
ットコンテンションの問題はいずれも基本的かつ本質的
な問題であり、現状では解決されていない。さらに。
Spanning Bus Hypercubeと共に
、これらの結合は格子結合、リング結合、バタフライ結
合の全てを内包していないことに起因する主要応用問題
における性能低下の問題がある。
、これらの結合は格子結合、リング結合、バタフライ結
合の全てを内包していないことに起因する主要応用問題
における性能低下の問題がある。
このような原理的困難が無い残る二つのネットワーク:
(フル)クロスバスイッチ、超立方体結合の内、前者
はハードウェア量が多すぎて多数台の要素プロセッサを
結合出来ず、後者は多数台を結合できるが、プログラミ
ングと実装が大変であり、結合台数が増加すると性能も
低下する。また、超立方体結合では、直接結合していな
い2台の要素プロセッサ間で通信する場合には、別の要
素プロセッサに中継させる必要がある。このように情報
パケットを一旦ある要素プロセッサに取り込ませてから
別の要素プロセッサに転送していく通信の方法をストア
・アンド・フォワード方式というが、超立方体結合に限
らずストア・アンド・フォワード方式では、複数台の要
素プロセッサP1゜Pa、 Pa・・・がループ状に通
信経路を形成して、その上で中継動作を行なおうとする
と、PlはP2が送信動作を終了して受信可能になるま
で送信動作を終了出来ず、P2はP3が送信動作を終了
して受信可能になるまで送信動作を終了出来ず、・・・
というようにお互いに噛み合って動けなくなるデッドロ
ック状態に陥ることがあるという問題がある。
(フル)クロスバスイッチ、超立方体結合の内、前者
はハードウェア量が多すぎて多数台の要素プロセッサを
結合出来ず、後者は多数台を結合できるが、プログラミ
ングと実装が大変であり、結合台数が増加すると性能も
低下する。また、超立方体結合では、直接結合していな
い2台の要素プロセッサ間で通信する場合には、別の要
素プロセッサに中継させる必要がある。このように情報
パケットを一旦ある要素プロセッサに取り込ませてから
別の要素プロセッサに転送していく通信の方法をストア
・アンド・フォワード方式というが、超立方体結合に限
らずストア・アンド・フォワード方式では、複数台の要
素プロセッサP1゜Pa、 Pa・・・がループ状に通
信経路を形成して、その上で中継動作を行なおうとする
と、PlはP2が送信動作を終了して受信可能になるま
で送信動作を終了出来ず、P2はP3が送信動作を終了
して受信可能になるまで送信動作を終了出来ず、・・・
というようにお互いに噛み合って動けなくなるデッドロ
ック状態に陥ることがあるという問題がある。
性能は、−単位の送信情報が最終目的地に到達するまで
に通過する基本切替スイッチ(クロスポイント)の数で
、ハードウェア量は、ネットワークを構成するクロスポ
イントの総数で評価するが。
に通過する基本切替スイッチ(クロスポイント)の数で
、ハードウェア量は、ネットワークを構成するクロスポ
イントの総数で評価するが。
通常、ハードウェア量と性能はトレードオフ関係にあり
、クロスポイント総数を増せず一単位の送信情報の通過
するクロスポイント数は減少する。
、クロスポイント総数を増せず一単位の送信情報の通過
するクロスポイント数は減少する。
本発明は、上記の意味での原理的困難のない相互結合ネ
ットワークであり、かつ、ハードウェア量の上限値(技
術的・経済的)と要素プロセッサ台数が任意に与えられ
たとき、これらのプロセッサをフルクロスバスイッチに
近い高い結合能力(少ない切替段数)で結合するととも
に、通信性能とハードウェア量に関して最適な結合を与
えるシステム構成を提供すること、特に最小もしくは最
適なスイッチ・ハードウェア量を持つネットワークを可
変的に構成する技術を提供することを目的としている6
すなわち、従来技術の範囲では、プロセッサ台数が少な
いうちはフルクロスバスイッチで、ある台数以上になる
と超立方体結合でネットワークを構成せざるを得なかっ
たが、本発明によればこれら再結合方式の中間の性能を
持ち、デッドロックの恐れのない自動中継機能付きの場
合にはさらにスイッチ・ハードウェア量も超立方体結合
より少ない結合ネットワークを幾種類も構成できる。ま
た実装は、単位となるスイッチをチップ内、モジュール
内、ボード内、匣体内、匡体間等にスイッチ毎にまとめ
て実装出来るので、性能バランス上、保守上好適である
。
ットワークであり、かつ、ハードウェア量の上限値(技
術的・経済的)と要素プロセッサ台数が任意に与えられ
たとき、これらのプロセッサをフルクロスバスイッチに
近い高い結合能力(少ない切替段数)で結合するととも
に、通信性能とハードウェア量に関して最適な結合を与
えるシステム構成を提供すること、特に最小もしくは最
適なスイッチ・ハードウェア量を持つネットワークを可
変的に構成する技術を提供することを目的としている6
すなわち、従来技術の範囲では、プロセッサ台数が少な
いうちはフルクロスバスイッチで、ある台数以上になる
と超立方体結合でネットワークを構成せざるを得なかっ
たが、本発明によればこれら再結合方式の中間の性能を
持ち、デッドロックの恐れのない自動中継機能付きの場
合にはさらにスイッチ・ハードウェア量も超立方体結合
より少ない結合ネットワークを幾種類も構成できる。ま
た実装は、単位となるスイッチをチップ内、モジュール
内、ボード内、匣体内、匡体間等にスイッチ毎にまとめ
て実装出来るので、性能バランス上、保守上好適である
。
上記目的は、基本的には、 L = n I X n2
X・・・×nNと因数分解できるLを要素プロセッサの
台数とする並列計算機において、これらの因数の各々を
一辺の格子点数とするN次元格子間空間上の超直方体の
内点の座’!!4 (i1、iz+・・・、IN)To
≦i1≦nz1、O≦12≦nz−1,−0≦iN ≦
nN−1を各要素プロセッサのプロセッサ番号として与
え、任意のkに対し第に次元の座標のみが異なるプロセ
ッサ番号を持つ一群の要素プロセッサ、すなわち、プロ
セッサ番号 (11+12y・・・、or・・・、1s)(11,1
2?・・・、1、・・・、i*)(11112y ”’
HnK 1 r ”’t iN)を持つnに個の要素
プロセッサ群を一つのnK入力nK出力のクロスバスイ
ッチで相互に結合し、該結合を第に次元を除くN−1次
元部分空間の座標(Ill 12? ”’r n
K−1r nK+1+ ”’t IN)の全て(
L/ng組)にわたって行ない、さらに全てのK(1≦
に≦N)に対して行なうことにより構成した、計LX
(1/nz+1/nz+−+1/nN)個のクロスバス
イッチにより要素プロセッサを結合し、さらにこの結合
において、送信側プロセッサに付随する中継手段が自プ
ロセッサ番号(i工、izt・・・txh)と目的地プ
ロセッサ番号F1+J2y・・・、jN)とで不一致な
次元の一つに(iに≠jx)を選び、送信側プロセッサ
の中継手段に付随しているN個のクロスバスイッチ(こ
れを以下、座標変換クロスバスイッチと呼ぶ)のうち第
に次元の座標のみが異なるプロセッサ番号の要素プロセ
ッサ群を結合しているクロスバスイッチ(第に次元座標
変換クロスバスイッチ)を選択し、これに目的地プロセ
ッサ番号を送信データと組にして構成した通信用情報パ
ケットを入力し、各座標変換クロスバスイッチは目的地
プロセッサ番号の第に次元座標部分をデコードして第に
次元の座標が目的地プロセッサ番号の第に次元座標と等
しいプロセッサ番号を持つプロセッサ、すなわち、目的
地プロセッサそれ自身、または目的地プロセッサへ至る
経路上のプロセッサに送信して中継させ、後者の場合、
これを不一致座標が無くなるまで繰り返すことにより目
的地プロセッサに情報パケットを送信する方式を用いる
ことにより解決することが出来る。さらに、要素プロセ
ッサに付随する中継手段としてクロスバスイッチを用い
ることにより、中継時に他の中継パスと競合することが
無くなるためデッドロックの危険性を完全に排除するこ
とができる。
X・・・×nNと因数分解できるLを要素プロセッサの
台数とする並列計算機において、これらの因数の各々を
一辺の格子点数とするN次元格子間空間上の超直方体の
内点の座’!!4 (i1、iz+・・・、IN)To
≦i1≦nz1、O≦12≦nz−1,−0≦iN ≦
nN−1を各要素プロセッサのプロセッサ番号として与
え、任意のkに対し第に次元の座標のみが異なるプロセ
ッサ番号を持つ一群の要素プロセッサ、すなわち、プロ
セッサ番号 (11+12y・・・、or・・・、1s)(11,1
2?・・・、1、・・・、i*)(11112y ”’
HnK 1 r ”’t iN)を持つnに個の要素
プロセッサ群を一つのnK入力nK出力のクロスバスイ
ッチで相互に結合し、該結合を第に次元を除くN−1次
元部分空間の座標(Ill 12? ”’r n
K−1r nK+1+ ”’t IN)の全て(
L/ng組)にわたって行ない、さらに全てのK(1≦
に≦N)に対して行なうことにより構成した、計LX
(1/nz+1/nz+−+1/nN)個のクロスバス
イッチにより要素プロセッサを結合し、さらにこの結合
において、送信側プロセッサに付随する中継手段が自プ
ロセッサ番号(i工、izt・・・txh)と目的地プ
ロセッサ番号F1+J2y・・・、jN)とで不一致な
次元の一つに(iに≠jx)を選び、送信側プロセッサ
の中継手段に付随しているN個のクロスバスイッチ(こ
れを以下、座標変換クロスバスイッチと呼ぶ)のうち第
に次元の座標のみが異なるプロセッサ番号の要素プロセ
ッサ群を結合しているクロスバスイッチ(第に次元座標
変換クロスバスイッチ)を選択し、これに目的地プロセ
ッサ番号を送信データと組にして構成した通信用情報パ
ケットを入力し、各座標変換クロスバスイッチは目的地
プロセッサ番号の第に次元座標部分をデコードして第に
次元の座標が目的地プロセッサ番号の第に次元座標と等
しいプロセッサ番号を持つプロセッサ、すなわち、目的
地プロセッサそれ自身、または目的地プロセッサへ至る
経路上のプロセッサに送信して中継させ、後者の場合、
これを不一致座標が無くなるまで繰り返すことにより目
的地プロセッサに情報パケットを送信する方式を用いる
ことにより解決することが出来る。さらに、要素プロセ
ッサに付随する中継手段としてクロスバスイッチを用い
ることにより、中継時に他の中継パスと競合することが
無くなるためデッドロックの危険性を完全に排除するこ
とができる。
本発明の相互結合方式により任意の要素プロセッサ間で
通信が行えることを述べる。プロセッサ番号(ixgx
z+・・・txN)を持つ送信元プロセッサからプロセ
ッサ番号F tt x 2.・・・、iN)を持つ目的
地プロセッサへ通信する場合を考える6送信元プロセッ
サの第一座標izと目的地プロセッサ第一座標jzとが
等しくない場合、これ以外の座標が全て等しい要素プロ
セッサは一つのクロスバスイッチ(第1次座標変換クロ
スバスイッチ)に接続されているから、このクロスバス
イッチによりプロセッサ番号F1y ig、・・・tx
N)を持つ要素プロセッサ、または該要素プロセッサに
付随した中継クロスバスイッチに情報を送信できる。
通信が行えることを述べる。プロセッサ番号(ixgx
z+・・・txN)を持つ送信元プロセッサからプロセ
ッサ番号F tt x 2.・・・、iN)を持つ目的
地プロセッサへ通信する場合を考える6送信元プロセッ
サの第一座標izと目的地プロセッサ第一座標jzとが
等しくない場合、これ以外の座標が全て等しい要素プロ
セッサは一つのクロスバスイッチ(第1次座標変換クロ
スバスイッチ)に接続されているから、このクロスバス
イッチによりプロセッサ番号F1y ig、・・・tx
N)を持つ要素プロセッサ、または該要素プロセッサに
付随した中継クロスバスイッチに情報を送信できる。
次にいま情報を受は取った要素プロセッサ、または該要
素プロセッサに付随した中継クロスバスイッチは、第2
次座標以外の座標が全て等しい要素プロセッサと一つの
座標変換クロスバスイッチにより結合されているから、
12≠j2なら、このスイッチによりプロセッサ番号C
jsv jzt ia、・・・iN)を持つ要素プロセ
ッサ、または該要素プロセッサに付随した中継クロスバ
スイッチに情報を送信できる。このような経路を選び次
々とクロスバスイッチにより対応する座標を置き換えた
要素プロセッサ、または該要素プロセッサに付随した中
継クロスバスイッチに送信していくことにより、最後に
はプロセッサ番号F1+、]2.・・・W jS)を持
つ要素プロセッサに情報を送信できる。
素プロセッサに付随した中継クロスバスイッチは、第2
次座標以外の座標が全て等しい要素プロセッサと一つの
座標変換クロスバスイッチにより結合されているから、
12≠j2なら、このスイッチによりプロセッサ番号C
jsv jzt ia、・・・iN)を持つ要素プロセ
ッサ、または該要素プロセッサに付随した中継クロスバ
スイッチに情報を送信できる。このような経路を選び次
々とクロスバスイッチにより対応する座標を置き換えた
要素プロセッサ、または該要素プロセッサに付随した中
継クロスバスイッチに送信していくことにより、最後に
はプロセッサ番号F1+、]2.・・・W jS)を持
つ要素プロセッサに情報を送信できる。
また、多くの場合、Lの因数分解を適当に行なうことに
より、各次元の結合要素プロセッサ台数をある範囲に制
限することが出来る。これにより、各次元の座標変換ク
ロスバスイッチを定められた実装単位内、例えば、チッ
プ内、モジュール内。
より、各次元の結合要素プロセッサ台数をある範囲に制
限することが出来る。これにより、各次元の座標変換ク
ロスバスイッチを定められた実装単位内、例えば、チッ
プ内、モジュール内。
ボード内、置体内、匡体間等に収めることが可能となる
。この性質は、各因数がすべて同じ値をとるという条件
:L=mNの下では充分満たすことができず、本発明の
分解:L=nIXn2X・・・XnNが必要条件となる
。
。この性質は、各因数がすべて同じ値をとるという条件
:L=mNの下では充分満たすことができず、本発明の
分解:L=nIXn2X・・・XnNが必要条件となる
。
中継クロスバスイッチを用いない場合には、要素プロセ
ッサP1が要素プロセッサP2にパケットを中継しよう
とし、同時に要素プロセッサP2も要素プロセッサP1
にパケットを中継しようとするとデッドロックが生じる
。しかし、中継クロスバスイッチを用いると、Plから
Plへのパケットの流れと独立にPlからPlへのパケ
ットの流れを設定できるため、プツトロックは発生しな
い。
ッサP1が要素プロセッサP2にパケットを中継しよう
とし、同時に要素プロセッサP2も要素プロセッサP1
にパケットを中継しようとするとデッドロックが生じる
。しかし、中継クロスバスイッチを用いると、Plから
Plへのパケットの流れと独立にPlからPlへのパケ
ットの流れを設定できるため、プツトロックは発生しな
い。
以下、本発明の実施例を図面により詳細に説明する。
第一実施例
(1)相互結合ネットワークの構成
第1図は本発明の第一実施例の結合方式の3次元を例と
した説明図であるが、N次元に拡張した場合も同様であ
る。第2図に示すように。
した説明図であるが、N次元に拡張した場合も同様であ
る。第2図に示すように。
3次元格子空間上のLXMXKの直方体の内点に対応す
る各格子点に論理的に配置された任意の(プロセッサ番
号(1*、1*k)を持つ)要素プロセッサP(1t
a s k)は、第1図に示すように、3個のクロスバ
スイッチ9−1、9−2.9−3に接続される。ここに
クロスバスイッチ9−1は、プロセッサp (i、 J
、k)と第1次元の座標のみが異なる要素プロセッサP
(Ow j+ k)+ P(1+ j+ k)+・・・
・・・、P(L−1,jtk)を完全結合するものであ
り。
る各格子点に論理的に配置された任意の(プロセッサ番
号(1*、1*k)を持つ)要素プロセッサP(1t
a s k)は、第1図に示すように、3個のクロスバ
スイッチ9−1、9−2.9−3に接続される。ここに
クロスバスイッチ9−1は、プロセッサp (i、 J
、k)と第1次元の座標のみが異なる要素プロセッサP
(Ow j+ k)+ P(1+ j+ k)+・・・
・・・、P(L−1,jtk)を完全結合するものであ
り。
同様にクロスバスイッチ9−2は第2次元の座標のみが
異なる要素プロセッサP(i、O,k)。
異なる要素プロセッサP(i、O,k)。
P (1+ 1+ k)+・・・・・・、P (i、M
−1,k)を、また、クロスバスイッチ9−3は第3次
元の座標のみが異なる要素プロセッサP(1+j+0)
t P (le jv 1)t・・・・・・、P (1
+ 、)+に−1)を完全結合するものである。
−1,k)を、また、クロスバスイッチ9−3は第3次
元の座標のみが異なる要素プロセッサP(1+j+0)
t P (le jv 1)t・・・・・・、P (1
+ 、)+に−1)を完全結合するものである。
各々のクロスバスイッチは、プロセッサ番号を構成する
3次元座標の一つの特定次元の座標値を他の座標値に置
き換えた番号を持つ要素プロセッサと通信する機能を持
つ。このため、このクロスバスイッチを以下では座標変
換クロスバスイッチと呼ぶ。そして、特定の次元にの座
標変換を行なうスイッチをに次元座標変換クロスバスイ
ッチと呼ぶ。後に示すように、3個の座標変換クロスバ
スイッチを中継することにより、いかなる番号の要素プ
ロセッサとも通信することができる。
3次元座標の一つの特定次元の座標値を他の座標値に置
き換えた番号を持つ要素プロセッサと通信する機能を持
つ。このため、このクロスバスイッチを以下では座標変
換クロスバスイッチと呼ぶ。そして、特定の次元にの座
標変換を行なうスイッチをに次元座標変換クロスバスイ
ッチと呼ぶ。後に示すように、3個の座標変換クロスバ
スイッチを中継することにより、いかなる番号の要素プ
ロセッサとも通信することができる。
(2)要素プロセッサの構造
第3図には、要素プロセッサの構造を示す。
要素プロセッサp (i、j+ k)は中継装置1およ
びプログラムカウンタを持ち命令を逐次実行していく通
常の計算機である処理装置2とから構成されている。中
継装置1はマイクロプログラムを内蔵し、処理装置2ま
たは入力ポートレジスタ5から入力した通信用パケット
送信先プロセッサ番号を解読し、その結果に基づき特定
の座標変換クロスバスイッチ9−1〜9−3、または処
理装置2を選択してそこに通信用パケットを送る機能を
持つ通信制御装置3と、通信用パケットを一時的に格納
する入力ポートレジスタ5および出力ポートレジスタ6
と、3個の座標変換クロスバスイッチからの入力通信路
の一つを選択するセレクタ7と、出力ポート中の通信用
パケットの送出先としてN個の座標変換クロスバスイッ
チの一つを選択する分配器8とから構成されている。こ
こに通信用パケットは送信先プロセッサ番号と送信デー
タとから成っている。
びプログラムカウンタを持ち命令を逐次実行していく通
常の計算機である処理装置2とから構成されている。中
継装置1はマイクロプログラムを内蔵し、処理装置2ま
たは入力ポートレジスタ5から入力した通信用パケット
送信先プロセッサ番号を解読し、その結果に基づき特定
の座標変換クロスバスイッチ9−1〜9−3、または処
理装置2を選択してそこに通信用パケットを送る機能を
持つ通信制御装置3と、通信用パケットを一時的に格納
する入力ポートレジスタ5および出力ポートレジスタ6
と、3個の座標変換クロスバスイッチからの入力通信路
の一つを選択するセレクタ7と、出力ポート中の通信用
パケットの送出先としてN個の座標変換クロスバスイッ
チの一つを選択する分配器8とから構成されている。こ
こに通信用パケットは送信先プロセッサ番号と送信デー
タとから成っている。
(3)通信方法
次に第1図の3次元の例で、プロセッサP(i、j、k
)−出発地プロセッサーからプロセッサP (0,O,
O)−目的地プロセッサーへ送信する仕組みについて第
1、3.4図を用いて説明する。まず、出発地プロセッ
サP(i。
)−出発地プロセッサーからプロセッサP (0,O,
O)−目的地プロセッサーへ送信する仕組みについて第
1、3.4図を用いて説明する。まず、出発地プロセッ
サP(i。
j、k)の処理袋W2は、通信制御装置3に通信用パケ
ットを入力しその送信を指示する。通信用パケットの宛
先情報(プロセッサ番号)は3個の座標(0,O,O)
から構成され、その第一座標から順にその座標値を通信
制御装置3のマイクロプログラム中の自プロセッサ番号
を構成する3個の座標値(i、jt k)と比較してい
き、最初に不一致となった第1座標iに関してこの座標
値をOに置き換えた査を持つ要素プロセッサp (0,
j+ k)と通信するべく、対応する第1座標変換クロ
スバスイッチ9−1を選択する。通信用パケットは出力
ポートレジスタ6に置かれ、選択されたクロスバスイッ
チ9−1の番号“1″は信号線12により分配器に入力
される。分配器8はこの番号111 IFを用いてデー
タ線13、制御信号線12を第1座標変換クロスバスイ
ッチ9−1の一つの入力チャネル101,102に接続
する。通信制御装置3は制御信号線12および101デ
ータ線13および102を用いて出力ポートロ中の通信
用パケットを第1座標変換クロスバスイッチ9−1に送
出する。座標変換クロスバスイッチの構造と動作につい
ては後述する。
ットを入力しその送信を指示する。通信用パケットの宛
先情報(プロセッサ番号)は3個の座標(0,O,O)
から構成され、その第一座標から順にその座標値を通信
制御装置3のマイクロプログラム中の自プロセッサ番号
を構成する3個の座標値(i、jt k)と比較してい
き、最初に不一致となった第1座標iに関してこの座標
値をOに置き換えた査を持つ要素プロセッサp (0,
j+ k)と通信するべく、対応する第1座標変換クロ
スバスイッチ9−1を選択する。通信用パケットは出力
ポートレジスタ6に置かれ、選択されたクロスバスイッ
チ9−1の番号“1″は信号線12により分配器に入力
される。分配器8はこの番号111 IFを用いてデー
タ線13、制御信号線12を第1座標変換クロスバスイ
ッチ9−1の一つの入力チャネル101,102に接続
する。通信制御装置3は制御信号線12および101デ
ータ線13および102を用いて出力ポートロ中の通信
用パケットを第1座標変換クロスバスイッチ9−1に送
出する。座標変換クロスバスイッチの構造と動作につい
ては後述する。
該クロスバスイッチ9−1を経由してこの通信用パケッ
トを送られた要素プロセッサP (0゜j、k)は、そ
のセレクタ7−2が送信要求信号0REQ (後述)を
出力している複数のクロスバスイッチの中から該クロス
バスイッチ9−1を選択すると、(本発明では選択の論
理については主張しない)クロスバスイッチの出力チャ
ネル線103,104が制御信号線10−2とデータ線
11−2に接続され、入力ポートレジスタ5−2を経て
通信制御装置3−2に通信用パケットを取り込む。この
とき、セレクタ7−2はその選択論理が選択した受信ク
ロスバスイッチ9−1の番号111 #lも制御信号線
1〇−2により伝える。要素プロセッサP (0* j
+k)の通信制御袋[3−2では該スイッチ番号Jl
I I+から変換された座標−二の例では第1座標−を
知り、再びそれ(第1座標)以降の座標から順に目的地
プロセッサの座標値(傘、0゜0)−傘は変換済み座標
であることを示す−を自プロセッサの座標値(0,j、
k)と比較していき、最初に不一致となった第2次元座
標jに関してこの座標値を0に置き換えた座標を持つ要
素プロセッサP (0,O,k)に送信するべく第2次
元座標変換クロスバスイッチ9−4を選択して入力チャ
ネル線201,202に通信用パケットを送出する。出
力チャネル線203゜204からパケットを入力したプ
ロセッサP(0,O,k)でも同様にして中継動作を行
ない、第3次元座標変換クロスバスイッチ9−5の入力
チャネル線301,302にパケットを送出し、目的地
プロセッサP (0,O,O)へは出力チャネル線30
3,304を経由して通信用パケットを届けることが出
来る。目的地プロセッサP (0,O,O)では、セレ
クタ7−4を経由して入力ボート5−4に格納されたパ
ケットの宛先(プロセッサ番号)(0,O,O)を通信
制御装置3−4が解読し、マイクロプログラム中の自プ
ロセッサ番号(0,0,0)と一致するので、処理装置
2−4にパケットの到着を通知する。
トを送られた要素プロセッサP (0゜j、k)は、そ
のセレクタ7−2が送信要求信号0REQ (後述)を
出力している複数のクロスバスイッチの中から該クロス
バスイッチ9−1を選択すると、(本発明では選択の論
理については主張しない)クロスバスイッチの出力チャ
ネル線103,104が制御信号線10−2とデータ線
11−2に接続され、入力ポートレジスタ5−2を経て
通信制御装置3−2に通信用パケットを取り込む。この
とき、セレクタ7−2はその選択論理が選択した受信ク
ロスバスイッチ9−1の番号111 #lも制御信号線
1〇−2により伝える。要素プロセッサP (0* j
+k)の通信制御袋[3−2では該スイッチ番号Jl
I I+から変換された座標−二の例では第1座標−を
知り、再びそれ(第1座標)以降の座標から順に目的地
プロセッサの座標値(傘、0゜0)−傘は変換済み座標
であることを示す−を自プロセッサの座標値(0,j、
k)と比較していき、最初に不一致となった第2次元座
標jに関してこの座標値を0に置き換えた座標を持つ要
素プロセッサP (0,O,k)に送信するべく第2次
元座標変換クロスバスイッチ9−4を選択して入力チャ
ネル線201,202に通信用パケットを送出する。出
力チャネル線203゜204からパケットを入力したプ
ロセッサP(0,O,k)でも同様にして中継動作を行
ない、第3次元座標変換クロスバスイッチ9−5の入力
チャネル線301,302にパケットを送出し、目的地
プロセッサP (0,O,O)へは出力チャネル線30
3,304を経由して通信用パケットを届けることが出
来る。目的地プロセッサP (0,O,O)では、セレ
クタ7−4を経由して入力ボート5−4に格納されたパ
ケットの宛先(プロセッサ番号)(0,O,O)を通信
制御装置3−4が解読し、マイクロプログラム中の自プ
ロセッサ番号(0,0,0)と一致するので、処理装置
2−4にパケットの到着を通知する。
一般のN次元の場合でも同様に、このようにして次々と
座標変換クロスバスイッチにより不一致座標を目的地プ
ロセッサの座標に置き換えた座標を持つ要素プロセッサ
に中継していくことにより、最後には目的地プロセッサ
に情報を送信できる。不一致座標の変換は高々N回で完
了するから、この結合方式の最大通信路長はNである。
座標変換クロスバスイッチにより不一致座標を目的地プ
ロセッサの座標に置き換えた座標を持つ要素プロセッサ
に中継していくことにより、最後には目的地プロセッサ
に情報を送信できる。不一致座標の変換は高々N回で完
了するから、この結合方式の最大通信路長はNである。
第1図の3次元の例では、最大通信路長は3である。し
かし、格子結合、リング結合。
かし、格子結合、リング結合。
バタフライ結合に関しては、中継動作無しで一回の送信
で目的地プロセッサに通信用パケットを転送できるので
、フルクロスバスイッチと同等の通信性能となる。第4
図には、以上に述べた通信制御装置3の中継動作論理を
示す。
で目的地プロセッサに通信用パケットを転送できるので
、フルクロスバスイッチと同等の通信性能となる。第4
図には、以上に述べた通信制御装置3の中継動作論理を
示す。
(4)座標変換クロスバスイッチの構造と動作第5図に
は、一つのL入力り出力のクロスバスイッチ9の外部イ
ンタフェースを示す。−組の入力チャネルは2本の制御
信号線IREQとIACK、およびデータ線IDATA
とからなっている。IREQは通信用の要素プロセッサ
が出力ポートレジスタ6に送信したいデータを格納して
送信待ち状態にあることをクロスバスイッチに通知する
信号を載せるためのものであり、IACKはクロスバス
イッチが次の送信データを出力ポートレジスタ6に書き
込んでも良いことを要素プロセッサに通知する信号を載
せるためのものである。IDATAには送信データを載
せる。同様に、−組の出力チャネルは2本の制御信号g
OREQと0AcK、オヨび出力データ線0DATAと
からなっている。0REQはクロスバスイッチが受信側
要素プロセッサの入力ポートレジスタ5に送信データの
転送を要求する信号を載せるためのものであり、 OA
Cには受信側要素プロセッサがそれを完了した信号を載
せるためのものである。0DATAには送信データを載
せる。以上のインタフェースにおいて、制御信号線IR
EQ、IACKは第3図に示すように分配器8を介して
要素プロセッサの通信制御装置3と、また、制御信号線
0REQ。
は、一つのL入力り出力のクロスバスイッチ9の外部イ
ンタフェースを示す。−組の入力チャネルは2本の制御
信号線IREQとIACK、およびデータ線IDATA
とからなっている。IREQは通信用の要素プロセッサ
が出力ポートレジスタ6に送信したいデータを格納して
送信待ち状態にあることをクロスバスイッチに通知する
信号を載せるためのものであり、IACKはクロスバス
イッチが次の送信データを出力ポートレジスタ6に書き
込んでも良いことを要素プロセッサに通知する信号を載
せるためのものである。IDATAには送信データを載
せる。同様に、−組の出力チャネルは2本の制御信号g
OREQと0AcK、オヨび出力データ線0DATAと
からなっている。0REQはクロスバスイッチが受信側
要素プロセッサの入力ポートレジスタ5に送信データの
転送を要求する信号を載せるためのものであり、 OA
Cには受信側要素プロセッサがそれを完了した信号を載
せるためのものである。0DATAには送信データを載
せる。以上のインタフェースにおいて、制御信号線IR
EQ、IACKは第3図に示すように分配器8を介して
要素プロセッサの通信制御装置3と、また、制御信号線
0REQ。
0AGKはセレクタ7を介して要素プロセッサの通信制
御装置3と接続されている。また、データ線IDATA
は分配器8を介して要素プロセッサの出力ポートレジス
タ6と、データ線0DATAはセレクタ7を介して要素
プロセッサの入力ポートレジスタ5と接続されている。
御装置3と接続されている。また、データ線IDATA
は分配器8を介して要素プロセッサの出力ポートレジス
タ6と、データ線0DATAはセレクタ7を介して要素
プロセッサの入力ポートレジスタ5と接続されている。
クロスバスイッチは、他に、後述するプロセッサ番号を
マスクするためのマスクレジスタの内容(マスクバタン
)を設定するためのマスクレジスタ書き込み制御信号線
Wとマスクバタン信号線MASKを備えている。
マスクするためのマスクレジスタの内容(マスクバタン
)を設定するためのマスクレジスタ書き込み制御信号線
Wとマスクバタン信号線MASKを備えている。
クロスバスイッチの構造の一例を第6図に示す。この例
では、3入力6出力のクロスバスイッチをとりあげてい
るが、一般のL入力L出力の場合でも全く同様である。
では、3入力6出力のクロスバスイッチをとりあげてい
るが、一般のL入力L出力の場合でも全く同様である。
送信を行なおうとする要素プロセッサ、例えば第3図で
i=2とした場合プロセッサp (21jt k)の通
信制御装置3は出力ポートレジスタ6に送信データを格
納した後、分配器8にクロスバスイッチの番号“1”を
送って特定のクロスバスイッチ9−1を選択・接続し、
信号線12を経由して入力チャネル2の制御信号、[1
01すなわちIREQ2に送信要求信号を出力する。当
該クロスバスイッチはプロセッサP (01j、k)、
P (1゜j、k)r P (2w j−k)をそれぞ
れ人出カチャネル0,1、2により接続している。線I
REQZ上の要求信号が当該クロスバスイッチのデコー
ダ20−3に入力されると、送信先を求めるために出力
ポートロ上にある送信情報パケット中の送信先プロセッ
サ番号の第1次元座標相当部分がデコードされ、送信先
チャネル、例えば目的地プロセッサP (0,O,O)
に対応するチャネル(出力チャネルO)に対しては1が
、それ以外に対してはOが信号線26−3に出力されて
全ての優先順位制御回路21−1〜21−3に伝えられ
る。デコードされるプロセッサ番号のビット列はその一
部だけがデコーダ20−3に入力されれば良い。従って
、プロセッサ番号は、3次元格子空間の座標を表す3個
のフィールドよりなり、各次元の座標変換クロスバスイ
ッチではこれらのフィールドの当該次元に対応する一つ
のフィールドを取り出す機構が必要である。各次元の座
標値の範囲は一般には等しくなく、これに伴い各次元の
座標フィールドの位置や長さはまちまちである。本実施
例では、このフィールドを可変的に選択できるよう、各
デコーダにはマスクレジスタ24−1〜24−3を用意
し、プロセッサ番号の一部マスクして残りのビット列だ
けをデコードする仕組にしている。
i=2とした場合プロセッサp (21jt k)の通
信制御装置3は出力ポートレジスタ6に送信データを格
納した後、分配器8にクロスバスイッチの番号“1”を
送って特定のクロスバスイッチ9−1を選択・接続し、
信号線12を経由して入力チャネル2の制御信号、[1
01すなわちIREQ2に送信要求信号を出力する。当
該クロスバスイッチはプロセッサP (01j、k)、
P (1゜j、k)r P (2w j−k)をそれぞ
れ人出カチャネル0,1、2により接続している。線I
REQZ上の要求信号が当該クロスバスイッチのデコー
ダ20−3に入力されると、送信先を求めるために出力
ポートロ上にある送信情報パケット中の送信先プロセッ
サ番号の第1次元座標相当部分がデコードされ、送信先
チャネル、例えば目的地プロセッサP (0,O,O)
に対応するチャネル(出力チャネルO)に対しては1が
、それ以外に対してはOが信号線26−3に出力されて
全ての優先順位制御回路21−1〜21−3に伝えられ
る。デコードされるプロセッサ番号のビット列はその一
部だけがデコーダ20−3に入力されれば良い。従って
、プロセッサ番号は、3次元格子空間の座標を表す3個
のフィールドよりなり、各次元の座標変換クロスバスイ
ッチではこれらのフィールドの当該次元に対応する一つ
のフィールドを取り出す機構が必要である。各次元の座
標値の範囲は一般には等しくなく、これに伴い各次元の
座標フィールドの位置や長さはまちまちである。本実施
例では、このフィールドを可変的に選択できるよう、各
デコーダにはマスクレジスタ24−1〜24−3を用意
し、プロセッサ番号の一部マスクして残りのビット列だ
けをデコードする仕組にしている。
第11図にマスクレジスタの機能と端成を述べる。図で
は16X16のクロスバスイッチを想定しているが、他
の規模のクロスバスイッチでも同様である。マスクレジ
スタ24は一種のマトリクススイッチとして働き、ID
ATA中の送信先プロセッサ番号を示すビット列do。
は16X16のクロスバスイッチを想定しているが、他
の規模のクロスバスイッチでも同様である。マスクレジ
スタ24は一種のマトリクススイッチとして働き、ID
ATA中の送信先プロセッサ番号を示すビット列do。
dz、・・・d211のうち特定次元の座標を示す部分
ビット列didJdhd露を選択してデコーダ(ROM
)2oへの入力(アドレス)AtAzAaA4として出
力する。そのためには、図に示すようにデータ線dsd
adhdmと出力線A IA x A s A &の交
点に対応するフィールドにOを、他のフィールドに1を
書き込めば良い、出力線A I A zA s A !
上の信号はデコーダ20により優先順位制御回路番号を
表す4ビツトの2進数としてデコードされ、優先順位制
御回路0〜15への送信要求信号ro”rtsに変換さ
れる0例えば。
ビット列didJdhd露を選択してデコーダ(ROM
)2oへの入力(アドレス)AtAzAaA4として出
力する。そのためには、図に示すようにデータ線dsd
adhdmと出力線A IA x A s A &の交
点に対応するフィールドにOを、他のフィールドに1を
書き込めば良い、出力線A I A zA s A !
上の信号はデコーダ20により優先順位制御回路番号を
表す4ビツトの2進数としてデコードされ、優先順位制
御回路0〜15への送信要求信号ro”rtsに変換さ
れる0例えば。
d+dJdkdtの内容が’o o o o’であれば
、優先順位制御回路Oを選択するべ(’1000・・・
0′なる信号にデコードされる。このスイッチを16X
16より小模式のクロスバスイッチ、例えば4X4のク
ロスバスイッチとして用いる場合は、マスクレジスタ2
4は2ビツトだけを選択し、デコーダROM20への入
力アドレスA s A 2として用いる。A a A
4は0となる。従って、この場合にはデコーダROMは
その一部だけが使用される。マスクレジスタ24−1〜
24−3の内容は外部(要素プロセッサまたはホスト計
算機等)からマスクレジスタ書き込み制御回路25に指
示して設定可能である(WおよびMASK信号線を用い
る)。
、優先順位制御回路Oを選択するべ(’1000・・・
0′なる信号にデコードされる。このスイッチを16X
16より小模式のクロスバスイッチ、例えば4X4のク
ロスバスイッチとして用いる場合は、マスクレジスタ2
4は2ビツトだけを選択し、デコーダROM20への入
力アドレスA s A 2として用いる。A a A
4は0となる。従って、この場合にはデコーダROMは
その一部だけが使用される。マスクレジスタ24−1〜
24−3の内容は外部(要素プロセッサまたはホスト計
算機等)からマスクレジスタ書き込み制御回路25に指
示して設定可能である(WおよびMASK信号線を用い
る)。
優先順位制御回路21−1には各入力チャネルから送信
要求が伝えられ、後述するように、予め定められた論理
に従ってそのうちの一つが選択される。その後、優先順
位制御回路21−1は選択転送制御回路22−1中のバ
ッファ23−1が空きであることを確認し、信号線27
−1により選択転送制御回路22−1に選択された入力
チャネル番号(チャネル2)を伝える。その結果、プロ
セッサP (2,jt k)の出力ポートロ上にある送
信情報パケットが(分配器8および入力チャネル2のデ
ータ線102(すなわちIDATAz)を経由して)選
択転送制御回路22−1中のバッファ23−1に転送さ
れる。この間優先順位制御回路21−1はビジー状態に
あり、転送が完了すると次の選択動作に入る。
要求が伝えられ、後述するように、予め定められた論理
に従ってそのうちの一つが選択される。その後、優先順
位制御回路21−1は選択転送制御回路22−1中のバ
ッファ23−1が空きであることを確認し、信号線27
−1により選択転送制御回路22−1に選択された入力
チャネル番号(チャネル2)を伝える。その結果、プロ
セッサP (2,jt k)の出力ポートロ上にある送
信情報パケットが(分配器8および入力チャネル2のデ
ータ線102(すなわちIDATAz)を経由して)選
択転送制御回路22−1中のバッファ23−1に転送さ
れる。この間優先順位制御回路21−1はビジー状態に
あり、転送が完了すると次の選択動作に入る。
選択転送制御回路22−1は、バッファ23−1にデー
タが転送されると、出力光プロセッサ(プロセッサP
(0,j、k))に対して送信を要求する信号線○RE
Qo、すなわち制御信号線103上に出力する。プロセ
ッサp(o。
タが転送されると、出力光プロセッサ(プロセッサP
(0,j、k))に対して送信を要求する信号線○RE
Qo、すなわち制御信号線103上に出力する。プロセ
ッサp(o。
j+k)のセレクタ7−2には複数個の座標変換クロス
バスイッチからの送信要求信号が入力され、予め定めら
れた論理に従ってそのうちの一つが選択され通信制御装
置3−2に伝えられる0通信制御装置3−2は、入力ポ
ートレジスタ5−2が空であるばあい、データ線0DA
TAo。
バスイッチからの送信要求信号が入力され、予め定めら
れた論理に従ってそのうちの一つが選択され通信制御装
置3−2に伝えられる0通信制御装置3−2は、入力ポ
ートレジスタ5−2が空であるばあい、データ線0DA
TAo。
すなわちデータ、11!104上のデータをセレクタ7
−2を経由して入力ポートレジスタ5−2に書き込み、
書き込みが終了すると、書き込み完了信号を制御信号線
0ACKo上に出力する。
−2を経由して入力ポートレジスタ5−2に書き込み、
書き込みが終了すると、書き込み完了信号を制御信号線
0ACKo上に出力する。
選択転送制御回路22−1は線OA CK oから書き
込み完了信号を入力すると線ORE Qo上の送信要求
信号をネゲートし、プロセッサP(Ot jt k)の
通信制御装置3−2はこれを検知して線OA CK o
上の受信完了信号をネゲートする。選択転送制御回路2
2−1のバッファ23−1は再び転送可能状態になり、
プロセッサP (0= jt k)のセレクタ7−2も
他のクロスバスイッチを選択可能になる。
込み完了信号を入力すると線ORE Qo上の送信要求
信号をネゲートし、プロセッサP(Ot jt k)の
通信制御装置3−2はこれを検知して線OA CK o
上の受信完了信号をネゲートする。選択転送制御回路2
2−1のバッファ23−1は再び転送可能状態になり、
プロセッサP (0= jt k)のセレクタ7−2も
他のクロスバスイッチを選択可能になる。
一方、優先順位制御回路21−1がビジー状態から抜は
出ると、信号線26−3によりこれを検知したデコーダ
20−3は、プロセッサP(21、L k)に対しIA
CKz上に転送完了信号を送る。IACKz上の転送完
了信号を受信したプロセッサp (21、L k)の通
信制御装置3はIREQz上の転送要求信号をネゲート
し1次の送信データを出力ポートロ上に載せることが可
能となる。
出ると、信号線26−3によりこれを検知したデコーダ
20−3は、プロセッサP(21、L k)に対しIA
CKz上に転送完了信号を送る。IACKz上の転送完
了信号を受信したプロセッサp (21、L k)の通
信制御装置3はIREQz上の転送要求信号をネゲート
し1次の送信データを出力ポートロ上に載せることが可
能となる。
優先順位制御回路21−1〜21−3の論理の一例を第
7図に示す。この例では、3つのデコーダからの入力が
3ビツトの情報、すなわちO〜7となることに着目し、
8エントリのメモリ(RAM)15に各入力に対応した
許可信号のパタンを記憶させておく方式をとる。しかし
、優先順位制御回路の論理はこれにとどまるものではな
い。
7図に示す。この例では、3つのデコーダからの入力が
3ビツトの情報、すなわちO〜7となることに着目し、
8エントリのメモリ(RAM)15に各入力に対応した
許可信号のパタンを記憶させておく方式をとる。しかし
、優先順位制御回路の論理はこれにとどまるものではな
い。
第二実施例
第8,9図には第二実施例の結合方式の説明図を示す。
第一実施例と異なるのは、要素プロセッサ内の通信制御
装置3で中継動作を行う代わりに、各要素プロセッサ毎
に設置された中継クロスバスイッチ14がこれを行う点
にある。
装置3で中継動作を行う代わりに、各要素プロセッサ毎
に設置された中継クロスバスイッチ14がこれを行う点
にある。
(1)中継クロスバスイッチの構造と動作中継クロスバ
スイッチの構造は基本的には座標変換クロスバスイッチ
の構造と同じであるが、デコーダに入力される宛先プロ
セッサ番号は一つの座標フィールドでなく、3個の座標
フィー゛ルド全でである。中継クロスバスイッチの宛先
デコード部の詳細説明図を第12図を用いて行なう。デ
ータ線IDATAより入力された送信先プロセッサ番号
と、中継クロスバスイッチ内に用意された自プロセッサ
番号を格納した自プロセッサ番号レジスタ50の内容は
比較器51に入力され、ビットワイズにEXORがとら
れて一致すれば1が、不一致であれば0が信号線52−
1〜52−32上に出力される。この出力はマスクレジ
スタ24に入力され、マスクレジスタ24の交点フィー
ルドにOが書かれている場合、すなわちマスクされてい
ない場合は、この入力は出力線A I A Z A a
上にそのまま出力され、ここでワイアラドANDがとら
れる。その結果、マスクされずに出力線につながれた比
較器出力が全て1の場合にのみ、出力線には1が出力さ
れる。各出力線A I A ! A sに対しプロセッ
サ番号の第1〜第3各座標を割り付ければ。
スイッチの構造は基本的には座標変換クロスバスイッチ
の構造と同じであるが、デコーダに入力される宛先プロ
セッサ番号は一つの座標フィールドでなく、3個の座標
フィー゛ルド全でである。中継クロスバスイッチの宛先
デコード部の詳細説明図を第12図を用いて行なう。デ
ータ線IDATAより入力された送信先プロセッサ番号
と、中継クロスバスイッチ内に用意された自プロセッサ
番号を格納した自プロセッサ番号レジスタ50の内容は
比較器51に入力され、ビットワイズにEXORがとら
れて一致すれば1が、不一致であれば0が信号線52−
1〜52−32上に出力される。この出力はマスクレジ
スタ24に入力され、マスクレジスタ24の交点フィー
ルドにOが書かれている場合、すなわちマスクされてい
ない場合は、この入力は出力線A I A Z A a
上にそのまま出力され、ここでワイアラドANDがとら
れる。その結果、マスクされずに出力線につながれた比
較器出力が全て1の場合にのみ、出力線には1が出力さ
れる。各出力線A I A ! A sに対しプロセッ
サ番号の第1〜第3各座標を割り付ければ。
ある座標フィールドが全て自プロセッサ番号の対応する
フィールドと等しければ出力線には1が、そうでなけれ
ば(不一致座標の場合には)Oが出力されることになる
6出力線上の信号は反転されてデコーダ20に入力され
る。
フィールドと等しければ出力線には1が、そうでなけれ
ば(不一致座標の場合には)Oが出力されることになる
6出力線上の信号は反転されてデコーダ20に入力され
る。
例えば1図で第1座標がデータ線IDATAより入力さ
れた送信先プロセッサ番号のビット0゜1、2で表され
るとする。対応する自プロセッサ番号レジスタ50のビ
ット0,1,2とともに比較器51に入力され、全ての
ビットが一致すれば信号線52−1、52−2.52−
3には1が出力される。第1座標フイールートとマスク
レジスタの第1出力線Arの交点フィールド53−1、
53−2.53−3にはOが、他の出力線A z A
sとの交点フィールドには1が書き込まれているから、
第1出力1iA A 1に対してのみ比較結果が送られ
る。従って、信号線52−1、52−2.52−3に全
て1が出力された場合にのみ、マスクレジスタの第1出
力線A1に1が出力される。
れた送信先プロセッサ番号のビット0゜1、2で表され
るとする。対応する自プロセッサ番号レジスタ50のビ
ット0,1,2とともに比較器51に入力され、全ての
ビットが一致すれば信号線52−1、52−2.52−
3には1が出力される。第1座標フイールートとマスク
レジスタの第1出力線Arの交点フィールド53−1、
53−2.53−3にはOが、他の出力線A z A
sとの交点フィールドには1が書き込まれているから、
第1出力1iA A 1に対してのみ比較結果が送られ
る。従って、信号線52−1、52−2.52−3に全
て1が出力された場合にのみ、マスクレジスタの第1出
力線A1に1が出力される。
デコーダは出力線A s A z A s上の信号を2
進アドレスとしてチャネル番号に変換し、該チャネルの
優先順位制御回路に1を、他には0を送る。例えば、出
力線A I A x A s上の信号が全て1であった
場合、すなわち反転されたデコーダ入力アドレス’o
o o’に対してはチャネルO1すなわち、自プロセッ
サへのチャネルを選択する。
進アドレスとしてチャネル番号に変換し、該チャネルの
優先順位制御回路に1を、他には0を送る。例えば、出
力線A I A x A s上の信号が全て1であった
場合、すなわち反転されたデコーダ入力アドレス’o
o o’に対してはチャネルO1すなわち、自プロセッ
サへのチャネルを選択する。
(2)通信方法
第8図において、一つの座標変換クロスバスイッチ9か
ら中継クロスバスイッチ14に通信用パケットが入力さ
れるとその宛先がデコードされ、もし、このプロセッサ
宛であればスイッチを要素プロセッサの入力ポート5へ
接続しパケットを入力する。もし、その以外の宛先であ
れば、不一致座標を変換する座標変換クロスバスイッチ
9を選択してそれに接続する。中継クロスバスイッチ1
4の外部インタフェースは座標変換クロスバスイッチ9
と同じである。
ら中継クロスバスイッチ14に通信用パケットが入力さ
れるとその宛先がデコードされ、もし、このプロセッサ
宛であればスイッチを要素プロセッサの入力ポート5へ
接続しパケットを入力する。もし、その以外の宛先であ
れば、不一致座標を変換する座標変換クロスバスイッチ
9を選択してそれに接続する。中継クロスバスイッチ1
4の外部インタフェースは座標変換クロスバスイッチ9
と同じである。
第9図には要素プロセッサP (i、j、k)から要素
プロセッサP (01jt k) 、 P (0゜0、
k)の中継クロスバスイッチを経由して要素プロセッサ
P (0,O,O)にパケットを転送する例を破線で示
しである。
プロセッサP (01jt k) 、 P (0゜0、
k)の中継クロスバスイッチを経由して要素プロセッサ
P (0,O,O)にパケットを転送する例を破線で示
しである。
第二実施例においては、通信制御装置3は第一実施例に
て述べたような通信用パケットの宛先情報(通信先プロ
セッサ番号)の解読、その結果に基づく特定の座標変換
クロスバスイッチ。
て述べたような通信用パケットの宛先情報(通信先プロ
セッサ番号)の解読、その結果に基づく特定の座標変換
クロスバスイッチ。
または処理装置2の選択と通信用パケットの送出機能は
持たず、単に中継クロスバスイッチ14とのインタフェ
ースをとる機能だけを持つ。
持たず、単に中継クロスバスイッチ14とのインタフェ
ースをとる機能だけを持つ。
評価
第9図の例では座標変換クロスバスイッチを三つ(9−
1,9,−4,9−5)と、中継クロスバスイッチを四
つ(14−1,14−2,14−3゜14−4)経由し
ているので計7回スイッチング、動作が必要である。第
一実施例ではクロスポイントの通過数、すなわち通信用
パケットを一つの入出力ボート/バッファから次のバッ
ファ/入出力ポートへ転送する単位スイッチング動作を
3回と数えているが、要素プロセッサの制御装置3での
判定・選択処理を考慮すれば、転送に要する時間は結局
同じことになる。第一実施例(プロセッサ自身が中継す
る方式)では最大N回の送信動作が必要であることから
、このスイッチの最大通信路長はNであり、ハードウェ
アとしてはクロスポイントの数でみるとntXnzX・
・・XnNX(nt+nz+ −+ n N)となる。
1,9,−4,9−5)と、中継クロスバスイッチを四
つ(14−1,14−2,14−3゜14−4)経由し
ているので計7回スイッチング、動作が必要である。第
一実施例ではクロスポイントの通過数、すなわち通信用
パケットを一つの入出力ボート/バッファから次のバッ
ファ/入出力ポートへ転送する単位スイッチング動作を
3回と数えているが、要素プロセッサの制御装置3での
判定・選択処理を考慮すれば、転送に要する時間は結局
同じことになる。第一実施例(プロセッサ自身が中継す
る方式)では最大N回の送信動作が必要であることから
、このスイッチの最大通信路長はNであり、ハードウェ
アとしてはクロスポイントの数でみるとntXnzX・
・・XnNX(nt+nz+ −+ n N)となる。
また、nK”: k=1、−Nの最大値がクロスバスイ
ッチの最大結合能力である。
ッチの最大結合能力である。
また、第二実施例(プロセッサ対応に中継クロスバスイ
ッチを持つ方式)では、中継クロスバスイッチ14で中
継動作を行うこと自体を一回の送信動作とみなすと最大
2N+1回の送信動作が必要となる。すなわちこのスイ
ッチの最大通信路長は2N+1である。また、ハードウ
ェア量はn1×n2×−XnN×{(N+1)”+nl
+nz+−+nN)で表される。
ッチを持つ方式)では、中継クロスバスイッチ14で中
継動作を行うこと自体を一回の送信動作とみなすと最大
2N+1回の送信動作が必要となる。すなわちこのスイ
ッチの最大通信路長は2N+1である。また、ハードウ
ェア量はn1×n2×−XnN×{(N+1)”+nl
+nz+−+nN)で表される。
次に、本発明の相互結合方式により、一つのクロスバス
イッチの最大結合能力が与えられたときに、最高の性能
が出せる構成と最小のハードウェア量で済む構成を容易
に求めることが出来ることを示す。
イッチの最大結合能力が与えられたときに、最高の性能
が出せる構成と最小のハードウェア量で済む構成を容易
に求めることが出来ることを示す。
性能は、クロスバスイッチの各プロセッサ間結合用信号
線の本数を一定とすると、通信路長Nまたは2N+1で
決まる。すなわち、プロセッサを論理的に配置する空間
の次元を出来るだけ小さくする方が高い性能が得られる
。例えば第一実施例に示すプロセッサが中継する方式の
場合、プロセッサ台数をり、一つのクロスバスイッチの
最大結合可能プロセッサ台数をnとするとき、q= [
logL/logn] + 1が該クロスバスイッチを
用いたときの最小通信路長である。ここに[]は商の整
数部分をとる記号である。このときの構成は、要素プロ
セッサをqまたはq+1次元の格子空間の超立方体状領
域に配置し、その中の一次元部分領域を構成する全ての
要素プロセッサを結合可能プロセッサ台数が上記最大値
nであるクロスバスイッチを用いて結合したものである
。
線の本数を一定とすると、通信路長Nまたは2N+1で
決まる。すなわち、プロセッサを論理的に配置する空間
の次元を出来るだけ小さくする方が高い性能が得られる
。例えば第一実施例に示すプロセッサが中継する方式の
場合、プロセッサ台数をり、一つのクロスバスイッチの
最大結合可能プロセッサ台数をnとするとき、q= [
logL/logn] + 1が該クロスバスイッチを
用いたときの最小通信路長である。ここに[]は商の整
数部分をとる記号である。このときの構成は、要素プロ
セッサをqまたはq+1次元の格子空間の超立方体状領
域に配置し、その中の一次元部分領域を構成する全ての
要素プロセッサを結合可能プロセッサ台数が上記最大値
nであるクロスバスイッチを用いて結合したものである
。
一方、ハードウェア量はnlXn2X・・・X−nNX
(n工+n2+・・・+nN)となるから、明らかにn
1=2の場合が最小ハードウェア量となる。しかし、第
二実施例に示す中継クロスバスイッチを用いろ方式では
、第10図に示すように、別の構成を取るときにハード
量が最小と成る。例えば256台構成では8X8X4台
の3次元に、4096台構成では8X8X8X8台の4
次元に配置する場合がハード量が最小となる。また、あ
る程度ハード量が多くても性能が出た方が良いとする立
場に立てば、要素プロセッサ64台〜1024台構成で
は8×8〜32x32の2次元構成が、2048〜32
768台構成では4X8X8〜32X32×32の3次
元構成が適当であろう。
(n工+n2+・・・+nN)となるから、明らかにn
1=2の場合が最小ハードウェア量となる。しかし、第
二実施例に示す中継クロスバスイッチを用いろ方式では
、第10図に示すように、別の構成を取るときにハード
量が最小と成る。例えば256台構成では8X8X4台
の3次元に、4096台構成では8X8X8X8台の4
次元に配置する場合がハード量が最小となる。また、あ
る程度ハード量が多くても性能が出た方が良いとする立
場に立てば、要素プロセッサ64台〜1024台構成で
は8×8〜32x32の2次元構成が、2048〜32
768台構成では4X8X8〜32X32×32の3次
元構成が適当であろう。
〔発明の効果〕
本発明により、一つのクロスバスイッチ(フルクロスバ
スイッチ)では接続出来ないような多数の要素プロセッ
サを、プロセッサ台数の如何にかかわらずフルクロスバ
スイッチに近い結合能力で接続するスイッチを構成する
ことができる。二二にフルクロスバスイッチに近い結合
能力とは、通信性能が高い(クロスポイント通過数が少
ない)こと、応用上重要なプロセッサ間結合トポロジー
(格子、リング、バタフライ)を内包していて、このよ
うなプロセッサ間通信パタンに対しては最小のクロスポ
イント通過数で通信できること、を意味する。従来技術
の範囲では、上記結合トポロジーを内包し、かつ、多数
台のプロセッサを結合できるネットワークとしてはハイ
パーキューブが公知であるが、本発明の結合方式は上記
特定の結合トポロジー以外の通信パタンにおける通信性
能が、ハイパーキューブよりはるかに優れている。
スイッチ)では接続出来ないような多数の要素プロセッ
サを、プロセッサ台数の如何にかかわらずフルクロスバ
スイッチに近い結合能力で接続するスイッチを構成する
ことができる。二二にフルクロスバスイッチに近い結合
能力とは、通信性能が高い(クロスポイント通過数が少
ない)こと、応用上重要なプロセッサ間結合トポロジー
(格子、リング、バタフライ)を内包していて、このよ
うなプロセッサ間通信パタンに対しては最小のクロスポ
イント通過数で通信できること、を意味する。従来技術
の範囲では、上記結合トポロジーを内包し、かつ、多数
台のプロセッサを結合できるネットワークとしてはハイ
パーキューブが公知であるが、本発明の結合方式は上記
特定の結合トポロジー以外の通信パタンにおける通信性
能が、ハイパーキューブよりはるかに優れている。
とくに中継クロスパイスイッチを用いることにより、デ
ッドロックを完全に防止することができる。
ッドロックを完全に防止することができる。
また、本発明により、座標変換用クロスバスイッチ規模
(クロスバスイッチの入出力チャネル数)の(技術的・
経済的な)上限値と要素プロセッサ台数が任意に与えら
れたとき、最適(通信性能最大、ハードウェア量最小、
または両者の中間)な結合方式を構成する方法が与えら
れ、フルクロスバスイッチとハイパーキューブの間隙を
埋めることが可能となる。
(クロスバスイッチの入出力チャネル数)の(技術的・
経済的な)上限値と要素プロセッサ台数が任意に与えら
れたとき、最適(通信性能最大、ハードウェア量最小、
または両者の中間)な結合方式を構成する方法が与えら
れ、フルクロスバスイッチとハイパーキューブの間隙を
埋めることが可能となる。
さらに、チップ、モジュール、ボード、筐体等の実装単
位ごとに各次元の座標変換スイッチを収納できるよう、
要素プロセッサの結合関係を定めることが可能である。
位ごとに各次元の座標変換スイッチを収納できるよう、
要素プロセッサの結合関係を定めることが可能である。
第1図は本発明の第1実施例の構成図、第2図はプロセ
ッサの超直方体状配置図、第3図は要素プロセッサの摺
成図、第4図は通信制御装置3の中継動作を示す説明図
、第5図はクロスバスイッチのインタフェース説明図、
第6図はクロスバスイッチの構成図、第7図は優先順位
制御回路の一例を示す説明図、第8図は第二実施例の構
成図、第9図は第二実施例の動作説明図、第10図は中
継クロスバスイッチを含む場合のハードウェア量を示す
説明図、第11図はマクスレジスタの説明図、第12図
は中継用クロスバスイッチのデコード部説明図である。 1・・・中継装置、2〜2−4・・・処理装置、3〜3
−4・・・通信制御装置、5〜5−4・・・入力ポート
レジスタ、6〜6−4・・・出力ポートレジスタ、7〜
7−4・・・セレクタ、8〜8−4・・・分配器、9−
1〜9−5・・・座標変換クロスバスイッチ、20.2
0−1〜20−3・・・プロセッサ番号デコーダ、21
−1〜21−3・・・優先順位制御回路、22−1〜2
2−3・・・選択転送制御回路、24.24−4〜24
−3・・・マスクレジスタ、14−1〜14−4・・・
中継クロスバスイッチ、15・・・メモリ(RAM)5
0・・・自プロセッサ番号レジスタ、51・・・比較器
−ン 顎 1 図 r(v忍θ) Kz 図 第 5 図 (jIV川旦用Ja化2 哲迭ぺj1門5 児7K ’ flβ 入力チャネルネル前 不 9 凪 P(θ、θ、ρ) ■ /θ 困 不 11 図 Z4 マス7Lノス7
ッサの超直方体状配置図、第3図は要素プロセッサの摺
成図、第4図は通信制御装置3の中継動作を示す説明図
、第5図はクロスバスイッチのインタフェース説明図、
第6図はクロスバスイッチの構成図、第7図は優先順位
制御回路の一例を示す説明図、第8図は第二実施例の構
成図、第9図は第二実施例の動作説明図、第10図は中
継クロスバスイッチを含む場合のハードウェア量を示す
説明図、第11図はマクスレジスタの説明図、第12図
は中継用クロスバスイッチのデコード部説明図である。 1・・・中継装置、2〜2−4・・・処理装置、3〜3
−4・・・通信制御装置、5〜5−4・・・入力ポート
レジスタ、6〜6−4・・・出力ポートレジスタ、7〜
7−4・・・セレクタ、8〜8−4・・・分配器、9−
1〜9−5・・・座標変換クロスバスイッチ、20.2
0−1〜20−3・・・プロセッサ番号デコーダ、21
−1〜21−3・・・優先順位制御回路、22−1〜2
2−3・・・選択転送制御回路、24.24−4〜24
−3・・・マスクレジスタ、14−1〜14−4・・・
中継クロスバスイッチ、15・・・メモリ(RAM)5
0・・・自プロセッサ番号レジスタ、51・・・比較器
−ン 顎 1 図 r(v忍θ) Kz 図 第 5 図 (jIV川旦用Ja化2 哲迭ぺj1門5 児7K ’ flβ 入力チャネルネル前 不 9 凪 P(θ、θ、ρ) ■ /θ 困 不 11 図 Z4 マス7Lノス7
Claims (1)
- 【特許請求の範囲】 1、L=n_1×n_2×・・・×n_N台の要素プロ
セッサまたは外部デバイス(以下、要素プロセッサで代
表)から構成される並列計算機において、N次元格子座
標(i_1、i_2、・・・、i_N)、0≦i_1≦
n_1−1、0≦i_2≦n_2−1、・・・、0≦i
_N≦n_N−1を各要素プロセッサのプロセッサ番号
として与え、特定次元の格子点数に対応して定まる固有
の位置および長さを持つたプロセッサ番号中の該次元フ
ィールドをデコードして、当該次元に関するスイッチン
グ動作を行なうクロスバスイッチを用意し、任意のkに
対し、第k次元の座標のみが異なるプロセッサ番号を持
つ一群の要素プロセッサ、すなわちプロセッサ番号 (i_1、i_2、・・・、■、・・・、i_N)(i
_1、i_2、・・・、1、・・・、i_N)・・・・
・・ (i_1、i_2、・・・、n_K−1、・・・、i_
N)を持つn_K個の要素プロセッサ群を一つのn_K
入力n_K出力の上記クロスバスイッチで相互に結合し
、該結合を第k次元を除くN−1次元部分空間の座標 (i_1、i_2、・・・、n_K_−1、n_K+1
、・・・、i_N)の全て(L/n_K組)にわたつて
行ない、さらに全てのK(1≦k≦N)に対して行なう
ことにより構成した、計L×(1/n_1+1/n_2
+・・・+1/n_N)個のクロスバスイッチによる要
素プロセッサの相互結合ネットワーク 2、特許請求の範囲第1項の相互結合ネットワークにお
いて、最終目的地の送信先プロセッサ番号をアドレスと
して送信データに付して与えた情報パケットを順次取り
込み、自要素プロセッサ番号(i_1、i_2、・・・
、n_N)と目的地要素プロセッサの番号(j_1、j
_2、・・・、j_N)とで不一致な次元の一つに(i
_K≠j_K)を選び、該要素プロセッサに結合してい
るN個のクロスバスイッチのうち、該要素プロセッサの
プロセッサ番号と第k次元の座標のみが異なるプロセッ
サ番号を持つ要素プロセッサ群を結合し、第k次元の座
標が目的地プロセッサ番号の第k次元座標と等しいプロ
セッサ番号を持つプロセッサ、すなわち、目的地プロセ
ッサそれ自身、または目的地プロセッサへ至る経路上の
プロセッサに送信することの出来るクロスバスイッチを
選択して、該情報パケットを該クロスバスイッチに入力
し、不一致座標が無い場合は自プロセッサの処理装置に
該情報パケットを入力する各要素プロセッサ毎に設けた
情報パケット中継手段を有することを特徴とする相互結
合ネットワーク。 3、特許請求の範囲第1項の相互結合ネットワークにお
いて、該プロセッサの入出力ポートレジスタおよび該プ
ロセッサに接続するN個のクロスバスイッチをこれに接
続することにより、目的地へ情報パケットを中継する、
各要素プロセッサ毎に設けたN+1入力N+1出力の中
継用クロスバスイッチを有することを特徴とする相互結
合ネットワーク。 4、特許請求の範囲第3項において、ハードウェアの量
を情報パケットが通過する、基本切替スイッチ(クロス
ポイント)の数で評価するとき、与えられたプロセッサ
台数Lに対して最小のハードウェア量を取る、すなわち
、L×{(N+1)^2+n_1+n_2+・・・+n
_N}が最小となるように次元Nと、各次元の因数n_
1、n_2、・・・n_Nが定められている相互結合ネ
ットワーク。 5、多次元座標で表される送信先アドレスを持つ情報パ
ケツトを入力し、送信先アドレスの特定次元に関するス
イッチングを行ない転送する機能を持つクロスバスイッ
チにおいて、該次元に対応して定まる固有の位置および
長さを持つたプロセッサ番号中のフィールドを、外部か
らの指示により可変的に選択しデコードする手段を持つ
ことを特徴とするクロスバイスイッチ。
Priority Applications (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP62289323A JP2585318B2 (ja) | 1987-11-18 | 1987-11-18 | 相互結合ネツトワークおよびそのためのクロスバスイツチ |
| US08/119,601 US5339396A (en) | 1987-11-18 | 1993-09-10 | Interconnection network and crossbar switch for the same |
| US08/203,265 US5517619A (en) | 1987-11-18 | 1994-02-28 | Interconnection network and crossbar switch for the same |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP62289323A JP2585318B2 (ja) | 1987-11-18 | 1987-11-18 | 相互結合ネツトワークおよびそのためのクロスバスイツチ |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPH01131950A true JPH01131950A (ja) | 1989-05-24 |
| JP2585318B2 JP2585318B2 (ja) | 1997-02-26 |
Family
ID=17741707
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP62289323A Expired - Fee Related JP2585318B2 (ja) | 1987-11-18 | 1987-11-18 | 相互結合ネツトワークおよびそのためのクロスバスイツチ |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP2585318B2 (ja) |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH05236525A (ja) * | 1991-10-31 | 1993-09-10 | Internatl Business Mach Corp <Ibm> | 超大規模モジュラースイッチ |
| US5377333A (en) * | 1991-09-20 | 1994-12-27 | Hitachi, Ltd. | Parallel processor system having computing clusters and auxiliary clusters connected with network of partial networks and exchangers |
-
1987
- 1987-11-18 JP JP62289323A patent/JP2585318B2/ja not_active Expired - Fee Related
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US5377333A (en) * | 1991-09-20 | 1994-12-27 | Hitachi, Ltd. | Parallel processor system having computing clusters and auxiliary clusters connected with network of partial networks and exchangers |
| JPH05236525A (ja) * | 1991-10-31 | 1993-09-10 | Internatl Business Mach Corp <Ibm> | 超大規模モジュラースイッチ |
Also Published As
| Publication number | Publication date |
|---|---|
| JP2585318B2 (ja) | 1997-02-26 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US5339396A (en) | Interconnection network and crossbar switch for the same | |
| Patel | Processor-memory interconnections for multiprocessors | |
| EP0018755B1 (en) | Digital communication networks employing speed independent switches | |
| US5175733A (en) | Adaptive message routing for multi-dimensional networks | |
| US6230252B1 (en) | Hybrid hypercube/torus architecture | |
| EP1032887B1 (en) | Router table lookup mechanism | |
| US4237447A (en) | Speed independent selector switch for digital communication networks | |
| US6101181A (en) | Virtual channel assignment in large torus systems | |
| KR900006791B1 (ko) | 패킷 스위치식 다중포트 메모리 n×m 스위치 노드 및 처리 방법 | |
| US4833468A (en) | Layered network | |
| US4251879A (en) | Speed independent arbiter switch for digital communication networks | |
| US6304568B1 (en) | Interconnection network extendable bandwidth and method of transferring data therein | |
| US5594918A (en) | Parallel computer system providing multi-ported intelligent memory | |
| US6061345A (en) | Crossbar routing switch for a hierarchical crossbar interconnection network | |
| JPH05506528A (ja) | 並列処理アレイ用のスケーリング可能なプロセッサ間及びプロセッサ・i/oメッセージシステム | |
| WO1986002510A1 (en) | PACKET SWITCHED MULTIPLE QUEUE NxM SWITCH NODE AND PROCESSING METHOD | |
| JP2533223B2 (ja) | 多段通信ネットワ―ク | |
| CN102866980B (zh) | 用于多核微处理器片上互连网络的网络通信胞元 | |
| WO1991019258A1 (en) | Dimensionally reconfigurable multi-dimensional processor array | |
| JPH05241947A (ja) | 分散クロスバー・スイッチ・アーキテクチャにおける交換接続の配列。 | |
| JPH0635874A (ja) | 並列プロセッサ | |
| JPH01131950A (ja) | 相互結合ネツトワークおよびそのためのクロスバスイツチ | |
| KR0168904B1 (ko) | 그룹통신을 제공하는 데이터 교환 장치 및 방법 | |
| JPH10105530A (ja) | 計算機接続装置 | |
| Lay | High-performance communication in parallel computers |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| LAPS | Cancellation because of no payment of annual fees |