WO1998036351A1

WO1998036351A1 - Processeur de donnees

Info

Publication number: WO1998036351A1
Application number: PCT/JP1997/000411
Authority: WO
Inventors: Mitsuru Hiraki; Atsushi Kiuchi; Kesami Hagiwara
Original assignee: Hitachi, Ltd.
Priority date: 1997-02-17
Filing date: 1997-02-17
Publication date: 1998-08-20
Also published as: US20030074546A1; US6505295B1; US7080240B2

Description

明細書

データ処理装置技術分野

本発明はマイクロプロセッサ、デジタルシグナルプロセッサ（D S P (Digital Signal Procesor)) 等のデータ処理装置に関し、特に命令バッファに適用して有効な技術に関する。背景技術

近年、 P C (Personal Computer)、 P D A (Personal Digital Assistants) 、デジタルセルラ、ゲーム機、カーナビゲ一シヨンなどの高度情報機器の発展に伴って、これらに搭載される L S I (Large Scale Integrated Circuit) に対する低消費電力化の二ーズが非常に高まってきている。これは、携帯型情報機器では電池使用時間を伸ばしたい、また、据え置き型情報機器ではチップ 'パッケージや冷却系のコストを抑えたいという要求があるからである。一方、最近は情報機器に画像、音声、通信処理などの高性能のマルチメディア機能を取り込む動きが活発化している。かくして、マルチメディア処理を実行するために L S Iに求められる計算能力は上昇の一途をたどっており、これがし S Iの消費電力を増大させる主な要因のひとつとなっている。

マイクロプロセッサやデジタルシグナルプロセッサ（D S P )などのデータ処理装置は、上に述べたようなマルチメディア処理を実行する L S Iとして広く用いられている。ところで、一般にこれらのデータ処理装置がマルチメディァ処理を実行する場合、比較的少ない個数の命令からなるループを実行する処理が非常に多い。なぜなら、マルチメディア処理の内容はほとんどが積和演算を主体とするデジタル信号処理であり、積和演算は、（1 )乗算を行う、（2 )乗算結果をそれまでの累計値に加算する、を多数回繰り返すことにより行われるからである。

デジタルシグナルプロセッサでは、多くの場合、一連の命令を繰り返し実行すべき内部状態を発生させる命令（リピート命令）がサポートされている。リピ一卜命令では、その直後の繰り返し実行すべき一連の命令の個数および繰り返し実行すべき回数を指定する。その結果、多数回繰り返し実行される命令をメモリ（R O M、 R AM又はキヤッシュメモリ）からわざわざ何回も読み出すことなく実行される。従って、高速化及び低消費電力化が図られる。この例としては、日本テキサスィンスツルメンッ株式会社、 1 9 9 0年発行の「T M S 3 2 0 C 3 0 第 3世代ディジタル.シグナル 'プロセッサユーザーズ 'マニュアル」（以下、従来技術 1という。）ゃ特開平 4— 2 9 3 1 2 4号公報（以下、従来技術 2という。）に記載されている。発明の開示

従来技術 1及び従来技術 2のようなデジタルシグナルプロセッサでル一プ処理時に命令バッファから命令を繰り返し読み出すことによりメモリアクセスに要する電力を低減するには、リピー卜命令を利用できることが前提となっている。従って、リピ一卜命令を備えていないデータ処理装置では、従来技術 1及び従来技術 2のようなデジタルシグナルプロセッザで行つているような制御方法は適用できないという問題がある。デジタル信号処理に用途を特化せずに汎用的に用いられるマイクロプロセッサ等ではリピ一ト命令は必ずしもサポートされていない。これは、リピート命令を備えるために命令バッファゃリピート制御回路の導入が必要である。また、リピート制御回路は、リピートスタートァドレスレジスタ、リピ一トェンドアドレスレジスタ、リピートカウントレジスタ、比較回路、ダウンカウンタ等多くのハードウヱァを必要とするため、マイク口プロセッサにとってこのようなリピート制御回路の導入により回路規模を増大させることが必ずしも得策ではな L、との見識に基づ! ^、ている。

また、実際のプロダラムで出現するループ処理では単純な繰り返しだけではなく様々な構造のループが出現する。これらの中には、前記命令ノソファから命令を繰り返し読み出す制御方法が原理的に適用できないループが含まれている。例えば、ループ内に複数の経路がありループの繰り返し回数によりたどる経路が異なる場合、前記命令バッファには 1回目の経路で実行した命令しか格納されていないので 2回目以降のループには対応できなくなる。従って、命令バッファから繰り返し命令を読み出す制御の適用を - ループの構造に応じて禁止する手段をマイクロプロセッサが備えている必要がある。しかるに従来技術 1及び従来技術 2のようなデジタルシグナルプロセッサはこのような手段を備えておらず、ループ処理時は必ず命令バッファから命令を繰り返し読み出す制御が行われるので、命令ノ <ッファから命令を繰り返し読み出す制御を適用できな L、構造のループに出くわすと正しくプログラム処理ができないという問題がある。

一方、特開平 4— 333929号公報（以下、従来技術 3という。）には、ループ処理実行中にループ内のすべての命令を確実にキヤッシュメモリに駐在させることによりプログラム処理の高速化をはかる技術が記載されている。従来技術 3ではループ処理を実行しているか否かによらず、命令読み出し時は（キャッシュミスしない限り）必ずキャッシュメモリが動作する。ループ処理時の電力を低減するためにはキャッシュメモリ自身の容量を小さくする必要がある。しかるに非ループ処理時にも同じ小容量のキヤッシュメモリをアクセスするので、ヒット率が低下しプログラム処理の高速化がはかれなくなるという問題がある。

本発明の目的は、リピート命令が利用できないにもかかわらず、ループ処理時に命令を小規模なバッファから繰り返し読み出すことによりメモリアクセスに要する電力を低減する制御手段を備えて L、るデータ処理装置を提供することである。

本発明の他の目的は、ループ処理時に繰り返し実行すべき命令を小規模なバッファから繰り返し読み出す制御を適用するか否かを選択する手段を備えているデータ処理装置を提供することである。

本発明の前記並びにその他の目的と新規な特徴は、本明細書の記述及び添付図面から明らかになるであろう。

本願において開示される発明のうち代表的なものの概要を簡単に説明すれば下記の通りである。

すなわち、第 1の命令記憶手段（1 02、 702、 902、 1 402、 1 602) に格納されている命令を読み出して実行するデータ処理装置（1 00、 700、 900、 1 400、 1 600)は、繰り返し実行すべき一連の命令に先立ってレジスタ（1 25、 74 2、 93 1、 932、 1 429、 1 62 9)の内容を変更する命令を実行した結果前記レジスタ（ 1 25、 742、 93 1、 932、 1 429、 1 629) の内容が特定条件に合致した場合に、繰り返し実行すべき前記の一連の命令を第 2の命令記憶手段 ( 1 04、 704、 904、 1 42 1、 1 62 1 ) に保持させ前記第 2の命令記憶手段 (1 04、 704、 904、 1 4 2 1、 1 62 1 )から繰り返し出力させるものである (図 1、図 5、図 7、図 1 1、図 1 3参照）。

さらに、前記データ処理装置（1 00、 700、 1 4 00、 1 600) において、繰り返し実行すべき前記の一連の命令の最後の命令は所定の条件が成立したときに前記の一連の命令の最初の命令への分岐を生じさせる命令である。

さらに、前記データ処理装置（1 00、 1 4 00、 1 600) において、前記レジス夕（1 25、 1 429、 1 629) の内容を変更する命令は、前記レジスタ（1 25、 1 429、 1 629 ) に含まれる特定ビッ卜（1 24、 1 428、 1 628) の論理値を指定する命令である（図 1、図 1 1、図 1 3参照）。

さらに、前記データ処理装置（700)において、前記レジスタの内容を変更する命令は前記一連の命令の実行を繰り返すべき回数値を前記レジスタ（742)にロードする命令である（図 5参照）。

さらに、前記データ処理装置（1 00、 70 0、 900)において、前記第 2の命令記憶手段は、前記第 1の命令記憶手段から実行に先立って読み出される複数の命令を格納する命令キューとは別の命令バッファである（1 04、 7 04、 904) 。

さらに、前記データ処理装置（ 900) において、前記レジスタ（93 1、 932) の内容を変更する命令は、繰り返し実行すべき前記一連の命令の先頭命令の位置を特定する情報及び末尾命令の位置を特定する情報を前記レジスタ（93 1、 932)に口一ドする命令である（図 7参照）。

さらに、前記データ処理装置（900)において、前記先頭命令の位置を特定する情報と前記の末尾命令の位置を特定する情報とから求められる繰り返し実行されるべき前記命令の数が特定の値以下であることが前記特定条件に相当するものである（図 7参照）。

さらに、前記データ処理装置（ 1 400、 1 6 00) において、前記第 2の命令記憶 -

手段は、前記第 1の命令記憶手段から実行に先立って読み出される複数の命令を格納する命令キュー（1421、 1621) である。

さらに、前記データ処理装置（100、 700、 900) において、前記の第 2の命令記憶手段（104、 704、 904)は、そのゲ一卜端子が第 1のノード（WL— k ) に接続され、そのソース、ドレイン端子の一方が第 2のノード（B L—1 )、他方が第 3のノード（Nl 101)に接続された第 1の Nチャネル型 MOSFET (1 103) と、そのゲート端子が前記の第 1のノード（WL— k)に接続され、そのソース、ドレイン端子の一方が第 4のノード（BLB— 1 )、他方が第 5のノード（Nl 102)に接続された第 2の Nチャネル型 MOSFET (1 1 04)と、そのゲ一卜端子が前記の第 5のノード（N 1 1 02)に接続され、そのドレイン端子が前記の第 3のノード（N 1 1 01)に接続され、そのソース端子が第 1の動作電位点（GND)に接続された第 3の Nチャネル型 MOSFET (1 101)と、そのゲート端子が前記の第 3のノード (N 1 101 )に接続され、そのドレイン端子が前記の第 5のノード（N 1 1 02)に接続され、そのソース端子が前記の第 1の動作電位点（GND)に接続された第 4の N チャネル型 MOSFET (1 102)を構成要素に含む記憶保持回路（ 1030— k— 1 ) を有する（図 1、図 5、図 7、図 8、図 9参照）。

さらに、前記データ処理装置（100、 700、 900) において、前記第 2の命令記憶手段（104、 704、 904) は、さらに前記第 2のノード（ B L— 1 ) と前記第 4のノード（BLB_1 )を一対とする入力信号に応答する増幅回路（ 1040—1 ) を具備する（図 1、図 5、図 7、図 8参照）。

さらに、前記データ処理装置（ 1400、 1600)において、前記レジスタ（ 14 29. 1629)の内容が前記特定条件に合致していない状態においては、前記第 1の命令記憶手段（ 1402、 1 602)から読み出された任意の命令はたかだか 1回実行されるまでの間のみ前記の第 2の命令記憶手段（1421、 1621)に一時的に保持されるものである（図 1 1、図 1 3参照）。

例えば、データ処理装置（100)は、あるループを実行する時に命令をバッファ（1 04)から繰り返し読み出すために単にそのループを実行する直前に特定ビット（12 -

4、バッファ制御フラグ）のセット命令を挿入するだけでよい。従って、リピ一卜命令を利用することなくループ処理時に小規模なバッファ（1 0 4 )から命令を繰り返し読み出し、メモリァクセスで消費する電力を低減することができる。

また、特定ビット（1 2 4、バッファ制御フラグ）がセッ卜されない限り、いかなるループの処理時もバッファ（ 1 0 4 )へのアクセスは行われない。従って、あるループを実行する時に命令をバッファ（1 0 4 )から繰り返し読み出す制御の適用を禁止するには、単にそのループを実行する直前に特定ビット（1 2 4、バッファ制御フラグ）のセット命令を挿入しなければよい。図面の簡単な説明

図 1は本発明の第 1の実施例（実施例 1 ) を示すデータ処理装置の構成を示す。図 2は実施例 1のデータ処理装置の命令読み出し動作を示す。

図 3は実施例 1のデータ処理装置においてバッファ制御フラグセット命令をプログラム記述中に挿入するためのアルゴリズムを示す。

図 4はあるデータ処理装置で音声符号化復号化処理プログラムを実行したときのル

—プサイズ分布を示す。

図 5は本発明の第 2の実施例（実施例 2 ) を示すデータ処理装置の構成を示す。図 6は実施例 2のデータ処理装置においてプログラム記述中の命令を置換するためのアルゴリズムを示す。

図 7は本発明の第 3の実施例を示すデータ処理装置の構成を示す。

図 8は実施例 1のデータ処理装置に含まれるバッファの構成を示す。

図 9はバッファに含まれるメモリセルの構成を示す。

図 1 0はバッファの占有面積の比較を示す。

図 1 1は本発明の第 4の実施例（実施例 4 ) を示すデータ処理装置の構成を示す。図 1 2は実施例 4のデータ処理装置の制御を示す。

図 1 3は本発明の第 5の実施例（実施例 5 ) を示すデータ処理装置の構成を示す。図 1 4は実施例 5のデータ処理装置の制御を示す。図 1 5は本発明の実施形態の分類を示す。発明を実施するための最良の形態

以下に、本発明の実施例を図面により詳細に説明する。

《実施例 1》

図 1は本発明の第 1の実施例を示すデータ処理装置の構成図である。データ処理装置 1 0 0は、制御部 1 2 0と命令実行部 1 4 0とプログラムカウンタ 1 6 0とバッファ 1 0 4とセレクタ 1 0 6等から構成されるデータ処理部と、メモリ 1 0 2とで構成される。データ処理装置 1 0 0は、単一の半導体基板上に形成するようにされても良いし、前記データ処理部のみを単一の半導体基板上に形成するようにされても良い。制御部 1 2 0 は、命令デコーダ 1 2 2、制御レジスタ 1 2 5、バッファ制御回路 1 2 6等から構成される。なお、命令デコーダ 1 2 2の中或いはセレクタ 1 0 6と命令デコーダ 1 2 2との間に命令フェッチキュー（命令先読みバッファ）を備えていてもよい。

メモリ 1 0 2は、例えば主記憶としての R O M (Read Only Memory) や R A M (Random Access Memory) 若しくは主記憶に格納される命令の一部を保持するキヤッシュメモリである。 R 0 Mは、例えば半導体の製造工程でプログラムされるマスク R O Mやフラッシュメモリ等の電気的に書き換え可能な不揮発性メモリで構成される。 R A Mは、例えば S R A M (Static Random Access memory)、 D R A M (Dynamic Random Access Memory) や強誘電体メモリ（書き込みサイクルと読み出しサイクルがほぼ等しい電気的に書き換え可能な不揮発性メモリ）で構成される。キャッシュメモリは、フルァソシァティブ方式ゃセットァソシァティブ方式で構成される。

なお、プログラムカウンタ 1 6 0の出力 S 1 6 2はァドレスバスを介してメモリ 1 0 2に供給されてもよい。

本実施例は、繰り返し実行すべき命令群の末尾命令が先頭命令への条件付き分岐命令となっているループを実行するときにバッファ 1 0 4から命令を繰り返し読み出す制御を適用するものである。従って、リピート命令を利用していない。以下にデータ処理装置 1 0 0力、'命令群を繰り返し実行する動作概要が示される。 (1)パ'ッファ 104から命令を繰り返し読み出す制御を適用すべきループを実行する直前に、特定ビット 124 (バッファ制御フラグ）をセッ卜する命令を実行する。ビット 124 (パ'ッファ制御フラグ）がセットされた直後からは、メモリ 102から読み出される命令は実行に移される一方でバッファ 104に順次書き込まれる。（ 2 )に移る。 (2) ビット 124 (バッファ制御フラグ）がセッ卜されてから条件付き分岐命令（末尾の命令）が初めて読み出され、その条件が成立している場合は（3)に、不成立の場合は（5) に移る。

(3)メモリ 102へのアクセスを停止し、バッファ 104に格納されている命令を先頭から順次読み出す。（4) に移る。

(4)バッファ 104から条件付き分岐命令（末尾の命令）が読み出され、その条件が成立している場合は（3) に、不成立の場合は（5) に移る。

(5)パヽソファ 104へのアクセスを停止し、通常どおりにメモリ 102からの命令読み出しを開始する。ビッ卜 124 (バッファ制御フラグ）をクリアする。

上記処理によれば、リピート命令を利用することなくループ処理時に小規模なバッファ 1 04から命令を繰り返し読み出し、メモリ 102をアクセスしないようにされる。また、ビット 124 (バッファ制御フラグ）がセッ卜されない限り、いかなるループの処理時もバッファ 104へのアクセスは行われない。従って、あるループを実行する時に命令をバッファ 104から繰り返し読み出す制御の適用を禁止するには、単にそのル —プを実行する直前にビッ卜 124 (バッファ制御フラグ）のセット命令を挿入しなければよい。

次に繰り返し実行すべき命令群の末尾命令が先頭命令への条件付き分岐命令となつているループの例が以下に示される。

例えば n個（nは正の整数）の命令（ i n s t (l)、 i n s t (2)、 * * *、 i n s t (n) )を m回（mは正の整数）繰り返し実行するには、プログラムを次のようにコ一ディングする。

g r 0 <— m；

LOOP： i n s t ( 1 ) ； i n s t ( 2 )

i n s t ( n ) ；

g r 0— g r 0- 1 ;

i f NZ g o t o LOOP ;

ここで、「g r 0— m」はレジスタ（g r 0、例えば命令実行部に備わっている）へのループ回数のセットを表わしている。「g r 0— g r 0— 1」はループ回数のデクリメントを表わしている。「 i f NZ go t o L 00 P」は直前に行ったループ回数デクリメン卜の演算結果が 0でない（NZ : No t Z e r o)場合に、すなわちループが終了していない場合に、ループの先頭命令（ i n s t ( 1 ) )に分岐を生じさせる条件付き分岐命令である。

このループを実行するときにバッファ 104に命令を保持させ、このバッファ 104 から命令を繰り返し読み出させるには、制御レジスタ 125内のバッファ制御フラグ 1 24 (BCF)をセッ卜する命令（s e t B C F )を次のようにループの先頭命令（ i n s t ( 1 ) ) の前に挿入する。

g r 0— m；

s e t BCF ;

LOOP ： i n s t ( 1 ) ；

i n s t ( 2 ) ；

i n s t ( n ) ；

g r 0-g r 0 - 1 ;

i f NZ g o t o LOOP 図 2は、上に記述したループをデータ処理装置 100が処理するときに行われる命令の読み出し動作を示している。以下に、図 2を用いながらデータ処理装置 100の動作を説明する。

データ処理装置 100の命令読み出し動作には次のような 3とおりの動作状態がある（図 2の（b) 参照）。

( 1 ) 「通常」状態

プログラムカウンタ 1 60の値に従ってメモリ 102から読み出された命令がメモリの出力 S 101及びバス S 102を経由してそのまま制御部 120に送られる。バッファ 104は停止している。セレクタ 106は、バス S 102からの出力 S 103の信号を選択信号 S E Lによって選択するようにされる。

( 2 ) 「バッファへの書き込み」状態

メモリ 1 02から読み出された命令は制御部 1 20に送られると同時にバッファ 1 04に順次書き込まれる。セレクタ 106は、バス S 1 02からの出力 S 103の信号を選択信号 S E Lによつて選択するようにされる。

(3) 「バッファからの読み出し」状態

バッファ 104から読み出された命令が制御部 1 20に送られる。メモリ 102は停止している。セレクタ 106は、ノくッファ 104からの出力 S 1 04の信号を選択信号 S E Lによって選択するようにされる。

図 2の（a) に示されるうように、パヽソファ制御フラグ 124 (BCF)がセッ卜されていないときはデータ処理装置 1 00は「通常」状態の命令読み出しを行う。バッファ制御フラグ 124 (BCF)をセッ卜する命令（s e t BCF)を実行すると、次のようなルールに従つて命令の読み出しが行われる。

(0 バッファ制御フラグ 124 (BCF) がセッ卜された直後から「バッファへの書き込み」状態に遷移する。

(ii) 「バッファへの書き込み」状態で条件付き分岐命令（ i f NZ g o t o L OOP) が読み出されたときその条件が成立していれば（iii) に、不成立ならば（V) に従う。 (iii) 「バッファからの読み出し」状態に遷移する。バッファ 104に格納されている命令を先頭から順に読み出す。条件付き分岐命令（ i f NZ go t o LOOP:) が読み出された場合は（IV) に従う。

(iv) 条件が成立していれば（iii) に、不成立の場合には（V) に従う。

(V) 「通常」状態に遷移する。バッファ制御フラグ 1 24 (BCF) はバッファ制御フラグクリア信号 C LRによってクリアされる。

(i) （V)の動作を行うためバッファ制御回路 126は、バッファ制御フラグ 124 (B C F)からの出力 S 126および命令デコーダ 122からの分岐情報 S 123 (条件付き分岐命令の検出および条件の成立 Z不成立に関する情報）を基に以下のような制御信号をメモリ 102 ッファ 104、セレクタ 1 06及びバッファ制御フラグ 12 4 (BCF) に発行する。

(a) メモリエネ一ブル信号 ME N：

メモリ 1 02の動作 Z停止を指示するようにされる。 "LOW" レベルのとき、「パ' ッファからの読み出し」状態でメモリ 102を停止するようにされる。 "H I GH" レベルのとき、メモリ 102を動作するようにされる。この信号は、メモリアクセス要求信号として用いられてもよい。

(b) セレクタ制御信号 S EL ：

セレクタ 106を制御するようにされる。 "H I GH" レベルのとき、「バッファからの読み出し」状態でバッファからの出力 S 104を選択するようにされる。 "LOW" レベルのとき、バス S 102からの出力 S 103を選択するようにされる。

(c) ポインタリセット信号 RST：

バッファ 104のポインタを先頭に戻すようにされる。「バッファへの書き込み」状態または「バッファからの読み出し」状態において条件付き分岐命令が読み出されたときに活性化するよう（ "H I GH" レベル）にされる。

( d )バッファエネ一ブル信号 B E N：

'ッファ 104の動作 Z停止を指示するようにされる。「バッファへの書き込み」状態または「バッファからの読み出し」状態のときに、 "H I GH" にされ、バッファ 1 04を動作するようにされる。

( e ) 書き込みエネーブル信号 WE N：

ノ'ッファ 104の書き込み/読み出しを指示するようにされる。「バッファへの書き込み」状態のときに、 'Ή I GH" にされ、書き込みを指示するようにされる。

( f )バッファ制御フラグクリア信号 CLR：

条件付き分岐命令の条件が不成立となったときバッファ制御フラグ 124 (BCF) をクリアするようにされる。

かくして本実施例によれば、リピート命令を利用することなくループ処理時に小規模なバッファ 104から命令を繰り返し読み出し、メモリアクセスで消費する電力を低減すること力、'できる。なお、バッファ制御回路 126はごく小規模な順序回路により実現することができる。

また、本実施例ではバッファ制御フラグ 124 (BCF)をセッ卜しない限り、いかなるループ処理時もバッファ 104へのアクセスは行われない。従って、あるループを実行するときに命令をバッファ 104から繰り返し読み出す制御の適用を禁止するには、単にそのループを実行する直前（上記の例では i n s t ( 1 )の直前）にバッファ制御フラグ 124 (B C F)をセッ卜する命令（s e t BCF)を挿入しなければよい。

次に、末尾命令以外には分岐命令などのフ口一制御命令を一切含まないループ（以後これを「単純繰り返しループ」と呼ぶ）であってループを構成する命令の個数力、'バッファ 1 04に格納できる最大命令個数以下であるような小規模なループに限定してバッファ 104から繰り返し命令を読み出す制御を適用するには、図 3に示すようなァルゴリズムに従ってバッファ制御フラグセッ卜命令（s e t B C F)をプログラム記述中に挿入する。図 3に示すアルゴリズムを以下に説明する。

( 1 ) ひとつの命令を参照する（ S 1 ) 。

(2)その命令が下記の条件 A~Dをすベて満たしている場合は（3)の処理を行う。それ以外の場合は（4) に従う（S 21、 S 22、 S 23、 S 24) 。

条件 A：参照している命令は条件付き分岐命令である（上記の例では i f NZ g o t o LOOP) 。

条件 B ： (分岐先アドレス） < (条件付き分岐命令のアドレス）

条件 C： (分岐先の命令から条件付き分岐命令までの命令の個数） ≤ (バッファ 10

4が保持できる命令の最大個数）、上記の例では n + 2≤ (パ'ッファ 104が保持できる命令の最大個数）

条件 D：分岐先の命令から条件付き分岐命令までの間（上記の例では i n s t ( 1 ) から i f Z g o t o LOOPまでの間）に参照している命令（上記の例では i f NZ go t o LOOP)以外にフロー制御命令（分岐命令等）がない。

( 3 )分岐先の命令（上記の例では i n s t ( 1 ) )の直前にバッファ制御フラグセッ卜命令（s e t BCF) を挿入する（S 3) 。

( 4 ) 参照対象を次の命令に移す（ S 4 ) 。

上に述べたようなァルゴリズムを例えばコンパイラやアセンブラなどのォブジェクトコ一ド生成ツールに組み込んでおけば、プログラマはバッファ 104の存在を意識することなく従来どおりにプログラム（ソースコード）をコ一ディングすることができる。また、上述のようにバッファ 104から繰り返し命令を読み出す制御を適用する対象を小規模な単純繰り返しループに限定しても、低消費電力化の効果がかなり期待できる。図 4には、音声符号化復号化処理プログラムを実行の単純繰り返しループサイズの分布が示される。横軸はループサイズ（命令個数）、縦軸はループ実行の累積サイクル数 (%)である。データ処理装置 1 00が音声符号化復号化処理プログラムを実行するときに全実行サイクル数の約 60%は 20ステップ以下の命令で構成される単純繰り返しループである。すなわち、バッファ 104に 20命令まで格納できる容量があれば全実行サイクルの約 60%はメモリ 102へのアクセスを停止することができる。さらにバッファ 104の容量を 32命令まで拡大すれば約 80%のサイクルをカバ一できる。《実施例 2》

図 5は本発明の第 2の実施例を示すデータ処理装置の構成図である。データ処理装置 700は、制御部 720と命令実行部 740とプログラムカウンタ 760とバッファ 7 04とセレクタ 706等から構成されるデータ処理部と、メモリ 702とで構成される _c デー夕処理装置 700は、単一の半導体基板上に形成するようにされても良いし、前記データ処理部のみを単一の半導体基板上に形成するようにされても良い。制御部 720 は、命令デコーダ 7 22、バッファ制御回路 724等から構成される。なお、命令デコ —ダ 72 2の中或いはセレクタ 70 6と命令デコーダ 7 22との間に命令フェッチキユー（命令先読みバッファ）を備えていてもよい。

メモリ 7 0 2は、例えば主記憶としての ROM (Read Only Memory) や RAM (Random Access Memory) 若しくは主記憶に格納される命令の一部を保持するキヤッシュメモリである。 R 0 Mは、例えば半導体の製造工程でプログラムされるマスク R 0 Mやフラッシュメモリ等の電気的に書き換え可能な不揮発性メモリで構成される。 R AMは、例えば S RAM (Static Random Access memory) 、 DRAM (Dynamic Random Access Memory) や強誘電体メモリ（書き込みサイクルと読み出しサイクル力、'ほぼ等し、電気的に書き換え可能な不揮発性メモリ）で構成される。

なお、プログラムカウンタ 760の出力 S 762はァドレスパ'スを介してメモリ 7 02に供給されてもよい。

データ処理装置 700は、データ処理装置 1 00力、'備えていたバッファ制御フラグ 1 24 (B C F) の代わりにループカウントレジスタ 742 (L C) を備えている。データ処理装置 700にもリピー卜命令が設けられていない。そこで、例えば n個（n は正の整数）の命令（ i n s t ( 1) 、 i n s t (2)、 · · ·、 i n s t (n) )を m回（mは正の整数）繰り返し実行するには、プログラムを次のようにコ一ディングする。

g r 0— m；

LOOP ： i n s t ( 1 ) ；

i n s t (2) ；

i n s t ( n ) g r 0-g r 0 - 1 ;

i f NZ g o t o LOOP ;

ここで、「」 g r 0— mは汎用レジスタ（g r 0、例えば命令実行部に備わっている）へのループ回数のセットを表わしている。「 g r 0— g r 0— 1」はループ回数のデクリメン卜を表わしている。「 i f NZ g o t o L 00 P」は直前に行ったループ回数デクリメン卜の演算結果が 0でない（NZ： No t Z e r o)場合に、すなわちループが終了していない場合に、ループの先頭命令（ i n s t ( 1 ) )に分岐を生じさせる条件付き分岐命令である。

このループを実行するときにバッファ 704に命令を保持させこのバッファから命令を繰り返し読み出させるには、下記のようにレジスタ（g r 0)の代わりにループ力ゥントレジスタ 742 (LC) を用いてループ回数のカウントを行う。

L C— m；

LOOP： i n s t ( 1 ) ；

i n s t ( 2 ) ；

i n s t ( n ) ；

L C— L C- 1 ；

i f NZ g o t o LOOP ；

上に記述したループをデータ処理装置 700が処理するときの命令読み出し動作を以下に説明する。データ処理装置 700はデータ処理装置 1 00と同様に「通常」、「バッファへの書き込み」、および「バッファからの読み出し」の 3とおりの動作状態（図 2の（b)参照）を持つ。ループカウントレジスタ 742 (LC)の初期値は 0である。ループカウントレジスタ 742 (L C)の値が 0のときはデータ処理装置 700は「通常」状態の命令読み出しを行う。ループカウントレジスタ 742 (LC)にループを繰り返すべき回数（0ではない値）がロードされると（ LC— m) 、次のようなルールに従って命令の読み出しが行われる。

(i) ループカウントレジスタ 742 (LC) に 0ではない値がロードされた直後から「バッファへの書き込み」状態に遷移する。

(ii) 「バッファへの書き込み」状態で条件付き分岐命令（ i f NZ go t o L OOP) が読み出されたときその条件が成立していれば（iii) に、不成立ならば（V) に従う。

(iii) 「バッファからの読み出し」状態に遷移する。パヽソファ 704に格納されている命令を先頭から順に読み出す。条件付き分岐命令（ i f NZ g o t o LOOP:) が読み出された場合は（iv) に従う。

(v) 「通常」状態に遷移する。

(i) 〜（V)の動作を行うためにバッファ制御回路 724は、ループカウントレジスタ 742 (L C)からの出力 S 742及び命令デコーダ 722からの分岐情報 S 722 (条件付き分岐命令の検出および条件の成立/不成立に関する情報)を基に以下のような制御信号をメモリ 702、ノくッファ 704及びセレクタ 706に発行する。

(a) メモリエネ一ブル信号 M E N：

メモリ 702の動作 Z停止を指示するようにされる。 "LOW"レベルのときに、「バッファからの読み出し」状態でメモリ 702を停止するようにされる。 "H I GH" レベルのときに、メモリ 702を動作するようにされる。この信号は、メモリアクセス要求信号であってもよい。

(b) セレクタ制御信号 S E L.:

セレクタ 706を制御するようにされる。 "H I GH" レベルのときに、「バッファ力、らの読み出し」状態でバッファからの出力 S 704を選択するようにされる。 "L〇 W" レベルのときに、バス S 702からの出力 S 703を選択するようにされる。 (c) ポインタリセット信号 RST：

パヽソファ 704のポィンタを先頭に戻すようにされる。「バッファへの書き込み」状態又は「バッファからの読み出し」状態にお L、て条件付き分岐命令が読み出されたときに活性化するよう（ "H I GH" ) レベルにされる。

(d)バッファエネ一ブル信号 B E N：

ッファ 704の動作 Z停止を指示するようにされる。「バッファへの書き込み」状態又は「バッファからの読み出し」状態のときに、 "H I GH" レベルにされ、バッファ 704を動作するようにされる。

( e ) 書き込みエネーブル信号 WE N

ッファ 704の書き込み Z読み出しを指示するようにされる。「バッファへの書き込み」状態のときに、 "H I GH" レベルにされ、書き込みを指示するようにされる。かくして本実施例によれば、リピート命令を利用することなくループ処理時に小規模なバッファ 704から命令を繰り返し読み出し、メモリアクセスで消費する電力を低減することができる。なお、バッファ制御回路 724はごく小規模な順序回路により実現することができる。

また、本実施例ではループカウントレジスタ 742 (LC)に 0ではない値を口一ドしない限り（0を口一ドすれば）、いかなるループ処理時もバッファ 704へのァクセスは行われない。従って、あるループを実行するときに命令をバッファ 704から繰り返し読み出す制御の適用を禁止するには、ループ回数のカウントにループカウントレジスタ 742 (L C) を用いなければよい（レジスタ g r 0等を用いればよい）。

次に、単純繰り返しループであってループを構成する命令の個数がバッファ 704に格納できる最大命令個数以下であるような小規模なループに限定してバッファ 704 から繰り返し命令を読み出す制御を適用するには、図 6に示すようなァルゴリズムに従つてループ回数のカウントに用いるレジスタをループカウントレジスタ 742 (L C) に割り当て直す。

(1) ひとつの命令を参照する（S 10)

(2)その命令が下記の条件 A Fをすベて満たしている場合は（3)の処理を行う。それ以外の場合は（4) に従う（S 201 S 202 S 203 S 204 S 205

S 206) o

条件 A：参照している命令は条件付き分岐命令である（上記の例では i f NZ g o t o L 00 P) 。

条件 C： (分岐先の命令から条件付き分岐命令までの命令の個数） ≤ (バッファ 70 4力、'保持できる命令の最大個数）、上記の例では n + 2≤ (バッファ 704が保持できる命令の最大個数）

条件 D：分岐先の命令から条件付き分岐命令までの間（上記の例では i n s t ( 1 ) から i f NZ g o t o LOOPまでの間）に参照している命令（上記の例では i f NZ go t o LOOP)以外にフロー制御命令（分岐命令等）がない。

条件 E：分岐先の直前の命令はあるレジスタへのロード命令（上記の例では g r 0— m) である。

条件 F ：条件付き分岐命令の直前の命令は同レジスタの値をデクリメン卜する命令 (g r 0— g r 0— 1 ) である。

( 3)上記口一ド命令およびデクリメント命令のオペランドをループカウントレジス夕 742 (L C) に置換する（S 30) 。

(4) 参照対象を次の命令に移す（ S 40 ) 。

上に述べたようなァルゴリズムを例えばコンパイラやアセンブラなどのォブジヱクトコ一ド生成ツールに組み込んでおけば、プログラマはバッファ 704の存在を意識することなく従来どおりにプログラム（ソースコ一ド）をコ一ディングすることができる。《実施例 3》

図 7は本発明の第 3の実施例を示すデータ処理装置の構成図である。データ処理装置 900は、制御部 940と命令実行部 950とプログラムカウンタ 960とバッファ 9 04とセレクタ 906等から構成されるデータ処理部と、メモリ 902とで構成される _c データ処理装置 900は、単一の半導体基板上に形成するようにされても良いし、前記データ処理部のみを単一の半導体基板上に形成するようにされても良い。制御部 940 は、命令デコーダ 920、リピート制御部 930等から構成される。なお、命令デコ一ダ 920の中或いはセレクタ 906と命令デコーダ 920との間に命令フヱツチキュ一（命令先読みバッファ）を備えていてもよい。メモリ 902は、例えば主記憶としての ROM (Read Only Memory) や RAM (Random Access Memory)若しくは主記憶に格納される命令の一部を保持するキヤッシュメモリである。 R 0 Mは、例えば半導体の製造工程でプログラムされるマスク R 0Mやフラッシュメモリ等の電気的に書き換え可能な不揮発性メモリで構成される。 R AMは、例えば SRAM (Static Random Access memory) 、 DRAM (Dynamic Random Access Memory) や強誘電体メモリ（書き込みサイクルと読み出しサイクル力、 Ίまぼ等しい電気的に書き換え可能な不揮発性メモリ）で構成される。

なお、プログラムカウンタ 960の出力 S 962はァドレスノくスを介してメモリ 9

02に供給されてもよい。

本実施例では、データ処理装置 900にはリピート命令が設けられている。リピ一ト制御部 930はリピートスター卜ァドレスレジスタ 931 (RS)、リピートェンドアドレスレジスタ 932 (RE) 、リピートカウントレジスタ 933 (RC)、比較回路 935、ダウンカウンタ 936、差分検出回路 937、パヽソファ制御回路 938を備えている。

例えば、 n個（ nは正の整数）の命令（ i n s t (l) 、 i n s t (2) 、 . . .、

1 n s t (n) )を m回（mは正の整数）繰り返し実行するには、プログラムを次のようにコーディングする。

RS— START；

RE— END；

R C— m；

RPT；

START : i n s t (l) ;

i n s t (2) ；

END： n s t ( n ) ここで、「RS— START」は繰り返し実行すべき一連の命令の先頭命令（ i n s t ( 1 )のアドレス（START)をリピートスタートアドレスレジスタ 931 (RS) にロードする命令を表わす。「 RE— END」は繰り返し実行すべき一連の命令の末尾命令（ i n s t (n)のァドレス（END)をリピ一トェンドアドレスレジスタ 93 2 (RE)にロードする命令を表わす。「 RC— m」は繰り返し実行すべき回数（m) をリピートカウントレジスタ 933 (RC) にロードする命令を表わす。、「RPT」は繰り返し命令を実行すべき内部状態を発生させる命令（リピート命令）である。リピート命令（RPT)が実行されると、リピートエンドアドレスレジスタ 932 (R E)の内容とプログラムカウンタ（PC)が比較回路 935により比較される。それらがー致し、リピートカウントレジスタ 933 (RC)の内容が 1でない場合には、ダウンカウンタ 936によりリピートカウントレジスタ 933 (RC)が 1減らされ、プログラムカウンタ 960の値がリピ一トス夕一トァドレスレジスタ 931 (R S)の値に書き変えられて処理が続行される。リピートエンドアドレスレジスタ 932 (RE)の内容とプログラムカウンタ（P C)力、'一致し、かつリピートカウントレジスタ 933 (R C)の内容が 1である場合は、リピー卜状態が解除される。もし、非リピート状態におけるリピートカウントレジスタ 933 (RC)の値を常に 0にしておきたい場合には、この時点でリピートカウントレジスタ 933 (RC)をクリアする制御を行えばよい。なお、 RS— START、 RE-END. RC— m、 R P Tは必ずしも 4つの命令コ一ドに分ける必要はない。例えば、上記の 4つの命令コードを 1つの命令コードにまとめて記述することも可能である。また、 RC— mと RPTを統合し RC— mをリビート命令とすることも可能である。

データ処理装置 900では、リピート命令による命令の繰り返し実行中は小規模なバッファ 904から命令を繰り返し読み出す制御を行う。しかしながら、ループを構成する命令の個数がバッファ 904に格納できる最大命令個数を超えるような大きなループをパヽソファ 904にこのまま格納しょうとするとループ最終部の命令は既に命令が格納されている場所にオーバ一ライ卜されてしまうので正しいループ処理ができなくなる。この問題を回避する最も簡単な方法は、バッファ 9 0 4のサイズより大きなループに対してはバッファ 9 0 4から命令を繰り返し読み出す制御の適用を禁止することである。データ処理装置 9 0 0では、以下のようにしてこれを実現している。差分検出回路 9 3 7はリピ一トスタートァドレスレジスタ 9 3 1 ( R S )とリピートェンドアドレスレジスタ 9 3 2 ( R E )の値の差からループを構成する命令の個数（上記の例では n個）を算出している。もし、ループを構成する命令の個数（上記の例では n個）力バッファ 9 0 4に格納できる最大命令個数を超えていたら、差分検出回路 9 3 7はバッファ 9 0 4へのアクセスの禁止をバッファ制御回路 9 3 8に指示し通常どおりにメモリ 9 0 2 から命令を読み出させる。

かくして本実施例によれば、ループを構成する命令の個数がバッファ 9 0 4に格納できる命令の個数を超える場合にはバッファ 9 0 4から命令を繰り返し読み出す制御の適用を禁止することができる。

なお、本実施例では、繰り返し実行すべき一連の命令の先頭命令及び末尾命令の位置情報をそれらが格納されている物理ァドレスとしたが、例えば相対ァドレス等の別の表現形式であってもよい。また、繰り返し実行すべき一連の命令の先頭命令及び末尾命令の位置情報をから求められる繰り返し実行されるべき前記命令の数（ステップ数）であつてもよい。

《バッファの構成》

図 8はデータ処理装置 1 0 0が備えているバッファ 1 0 4の構成の一例である。本実施例はバッファ 1 0 4をメモリ回路により構成している。命令コード S 1 0 3は Mビット幅で、バッファ 1 0 4が格納できる最大命令個数は N個であるとする。すなわち、 N ワード X Mビッ卜のメモリアレイに命令が格納される。命令コードの各ビットはメモリセル 1 0 3 0— k— 1 (ただし、 k = 1， 2， · · ·， N、 1 = 1 , 2， · · ·， M) に格納される。

カウンタ 1 0 6 0はァドレスデコーダ 1 0 7 0に与えるァドレス S 1 0 6 2を 1ずつカウントアップする。バッファ制御回路 1 2 6からのポインタリセット信号 R S Tがアクティブになるとカウンタ 1 0 6 0はアドレス S 1 0 6 2を先頭にもどす。了ドレスデコーダ 1 07はカウンタ 1060が与えるァドレス S 1 062をデコ一ドし、対応するワード線 WL_k ( k- 1, 2, · · ·, N) を一本選択する。

書き込み動作時は、トランジスタ 1020— 1 ( 1 = 1, 2， · · ·， M)のドレイン 'ソース経路を介して命令コード S 103— 1 ( 1 = 1, 2, · ' ·， Μ)がワード線で選択されたメモリセルに書き込まれる。

読み出し動作時は、ワード線で選択されたメモリセルからビット線対（BL_1、 B LB— 1、 · · ·、 BL— M、 BLB— M) に現われた小振幅の相補信号が増幅回路 1 040—1 ( 1 = 1, 2, · · ·, M)により出力信号 S 104—1 ( 1 = 1， 2, · · ·, M) として取り出される。

メモリセル 1030_k_ 1 (ただし、 k= l， 2, · ' ·, Ν、 1 = 1, 2, · · ·, Μ) の構成の一例が図 9に示される。メモリセル 1 030_k— 1 (ただし、 k= l， 2, · · ·, N、 1 = 1, 2, · · ·, M) は、いわゆる 6 MO Sトランジスタの S RAMで構成される。トランジスタ 1 105と 1 106は Pチャネル型 MOSトランジスタ（Pチャネル型 MOSFET)である。トランジスタ 1 101、 1 102、 1 10 3. 1 104は Nチャネル MOSトランジスタ（Nチャネル型 MO S F E T)である。「VDD」は電源電圧を、「GND」は接地電圧を表わしている。

また、本実施例のバッファの構成は、データ処理装置 1 00だけではなく、データ処理装置 700やデータ処理装置 900にも適用できる。

図 10に示すように、バッファ 104をメモリ回路で構成すると、特にバッファに格納する命令個数が比較的多い場合には、レジスタで構成するよりもバッファの占有面積を小さくできるというメリッ卜がある。なぜなら、メモリ回路でバッファを構成した場合にはメモリセル 1030_k_l (ただし、 k= l, 2， ' * '， N、 1 = 1, 2, · · ·, M)からビット線対（BL— 1、 BLB— 1、 · · ·、 B L— M、 B L B_M) に読み出される信号は微小信号で十分なのでメモリセル自身の電流駆動力は小さくてよく、従つてメモリセルを構成する素子の寸法を小さくできるからである。

《実施例 4》

高速マイクロプロセッザではメモリ（例えばキャッシュメモリ）から取り出された命令が命令デコーダに送り出されるまでの間、一時的に複数の命令を保持しておくための命令キュー（命令先読みバッファ）を制御部に備えている。命令キューから命令デコーダへ命令が送り出されると、極力空きができないようにメモリから命令キュ一に命令が取り込まれる。この命令キューをデータ処理装置 1 00のバッファ 1 04として機能させることを検討した。以下に、その実施例を説明する。

図 1 1は本発明の第 4の実施例を示すデータ処理装置の構成図である。データ処理装置 1 400は、制御部 1 420と命令実行部 144 0とプログラムカウンタ 1 460等から構成されるデータ処理部と、メモリ 1 402とで構成される。データ処理装置 1 4 00は、単一の半導体基板上に形成するようにされても良いし、前記データ処理部のみを単一の半導体基板上に形成するようにされても良い。制御部 1 4 20は、命令デコ一ダ 1 4 22、命令キュー 1 42 1 ( I Q 0〜7)、ポインタ 1 4 24、命令キュー制御回路 1 426、制御レジスタ 1 429等から構成される。

メモリ 1 4 02は、例えば主記憶としての ROM (Read Only Memory) や RAM (Random Access Memory)若しくは主記憶に格納される命令の一部を保持するキヤッシュメモリである。 ROMは、例えば半導体の製造工程でプログラムされるマスク R 0 Mやフラッシュメモリ等の電気的に書き換え可能な不揮発性メモリで構成される。 R AMは、例えば S RAM (Static Random Access memory) 、 DRAM (Dynamic Random Access Memory) や強誘電体メモリ（書き込みサイクルと読み出しサイクルがほぼ等しい電気的に書き換え可能な不揮発性メモリ）で構成される。

なお、プログラムカウンタ 1 460の出力 S 1 462はアドレスパ'スを介してメモリ 1 402に供給されてもよい。

命令キュー（ I Q 0〜7)は繰り返し命令読み出し力亍われていないときは従来のプリフヱツチキューとして機能する。

データ処理装置 1 4 00の動作を説明するために、データ処理装置 1 00の動作を説明するときに用いたプログラム記述をここに再び示す。

g r 0— m；

s e t B C F ； LOOP : i n s t ( 1 ) ；

i n s t (2) ；

i n s t ( n ) ；

g r 0— g r 0- 1 ;

i f NZ g o t o LOOP ;

データ処理装置 1400では図 12に示すようなルールに従って制御を行うようにされる。

(i)パ'ッファ制御フラグ 1428 (BCF) を参照し、もしセットされていれば（ii) に、セッ卜されていなければ（viii) に従う（S 1 51 ) 。

(ii) ポインタ 1424が指し示す命令をデコードする。（iii) に従う（S 152) 。

(iii)デコ一ドした命令が条件付き分岐命令（上記の例では i f NZ g o t o L OOP) でなければ（iv) に、条件付き分岐命令ならば（V) に従う（S 1 53) 。

(iv)命令を発行し、ポインタ 1424をインクリメン卜する（S 1 54) 。（ix) に従う。

(v) 分岐条件が成立していれば（vi) に、不成立ならば（vii) に従う（S 1 55) 。

(vi)分岐命令を発行し、ポインタ 1424を I Q 0に初期化する（ S 156 )。（ix) に従う。

(vii) I Q0からポインタ 1424が指し示していた命令までをすベて命令キュー 1 421からシフトァゥ卜し、ポインタ 1424を I Q 0に初期化し、バッファ制御フラグ 1428 (B C F) をクリアする（S 1 57) 。（ix) に従う。

(viii) ポインタ 1424が指し示す命令をデコ一ドし発行する。発行した命令を命令キュー 1421からシフトアウトする（S 158) 。（ix) に従う。

(ix) 次の命令デコ一ドサイクルへ移る（S 1 59) 。

かくして本実施例によれば、リピート命令を利用することなくループ処理時に命令キュ一（ I Q 0〜7)から繰り返し命令が読み出される。その間、命令キュー（ I Q 0〜 7)には命令が満たされているのでメモリ 1402から命令が読み出されることはなく、メモリアクセスで消費する電力が節約できる。

また、本実施例ではバッファ制御フラグ 1428 (BCF)をセッ卜しない限り、いかなるループ処理時も命令キュー（ I Q 0〜7)は従来どおりの使い方がなされる。従つて、あるループを実行するときに命令を命令キュー（ I Q 0〜7)から繰り返し読み出す制御の適用を禁止するには、単にそのループを実行する直前（上記の例では i n s t ( 1 )の直前）にバッファ制御フラグ 1428 (B C F)をセッ卜する命令（s e t BCF) を挿入しなければよい。

元々命令キューを備えているマイクロプロセッサに対して本実施例の形態を適用すると、実施例 1のようにわざわざバッファ 1 04を追加する必要がないので省面積化がはかれるというメリッ卜がある。

《実施例 5》

図 13は本発明の第 5の実施例を示すデータ処理装置の構成図である。データ処理装置 1600は、制御部 1620と命令実行部 1640とプログラムカウンタ 1660等から構成されるデータ処理部と、メモリ 1602とで構成される。データ処理装置 16 00は、単一の半導体基板上に形成するようにされても良いし、前記デ一タ処理部のみを単一の半導体基板上に形成するようにされても良い。制御部 1620は、命令デコ一ダ 1622、命令キュー 1621 ( I Q0〜7)、命令キュー制御回路 1626、制御レジスタ 1629等から構成される。

メモリ 1 602は、例えば主記憶としての ROM (Read Only Memory) や RAM (Random Access Memory)若しくは主記憶に格納される命令の一部を保持するキヤッシュメモリである。 R 0 Mは、例えば半導体の製造工程でプログラムされるマスク R OMやフラッシュメモリ等の電気的に書き換え可能な不揮発性メモリで構成される。 R AMは、例えば SRAM (Static Random Access memory) 、 DRAM (Dynamic Random Access Memory) や強誘電体メモリ（書き込みサイクルと読み出しサイクルがほぼ等しい電気的に書き換え可能な不揮発性メモリ）で構成される。なお、プログラムカウンタ 1660の出力 S 1662はァドレスパ'スを介してメモリ 1602に供給されてもよい。

データ処理装置 1 600はデータ処理装置 1400と同様に命令キュー（ I Q 0〜 7)を利用するものである。ただし、命令キュー（ I Q 0〜7)に付随した実行フラグ (Ε 0〜7)をデータ処理装置 1400におけるポインタ 1424の代わりに使用する。データ処理装置 1 600は図 14に示すようなルールに従って制御を行うようにされる。

(0バッファ制御フラグ 1628 (BCF) を参照し、もしセッ卜されていれば（ii) に、セッ卜されていなければ（viii) に従う（S 171 ) 。

(ii) 実行フラグ（Eフラグ； E 0〜7) 力クリアされている命令をデコードする（S 172) 。（iii) に従う。

(iii)デコードした命令が条件付き分岐命令（上記の例では i f NZ go t o L OOP) でなければ（iv) に、条件付き分岐命令ならば（V) に従う（S 173) 。

(iv)命令を発行し、対応する実行フラグ（ E 0〜 7 )をセットする（ S 174 )。（ix) に従う。

(V) 分岐条件が成立していれば（vi) に、不成立ならば（vii) に従う（S 175) 。

(vi)分岐命令を発行し、すべての実行フラグ（E 0〜7)をクリアする（S 176)。

(ix) に従う。

(vii) 実行フラグ（E 0〜7) がセッ卜されている命令をすベて命令キュー（ I Q 0 〜7)からシフトアウトし、ノくッファ制御フラグ 1 628 (B C F)をクリアする（S

177) 。（ix) に従う。

(viii) 命令をデコードし発行する。発行した命令を命令キュー（ I Q0〜7) からシフトアウトする（S 178) 。（ix) に従う。

(ix) 次の命令デコードサイクルへ移る（S 179)。

かくして本実施例によれば、リピ一ト命令を利用することなくループ処理時に命令キユー（ I Q 0〜7)から繰り返し命令が読み出される。その間、命令キュー（ I Q 0〜 7)には命令が満たされているのでメモリ 1602から命令が読み出されることはなく、メモリアクセスで消費する電力が節約できる。

また、本実施例ではバッファ制御フラグ 1628 (BCF)をセットしない限り、い力、なるループ処理時も命令キュー（I Q0〜7)は従来どおりの使い方がなされる。従つて、あるループを実行するときに命令を命令キュー（ I Q 0〜7)から繰り返し読み出す制御の適用を禁止するには、単にそのループを実行する直前（上記の例では i n s t ( 1 )の直前）にバッファ制御フラグ 1628 (B C F)をセッ卜する命令（s e t BCF) を挿入しなければよい。

元々命令キューを備えているマイクロプロセッザに対して本実施例の形態を適用すると、実施例 1のようにわざわざバッファ 104を追加する必要がないので省面積化がはかれるというメリッ卜がある。さらに、本実施例では命令キュー（ I Q 0〜7)を用レ、て繰り返し命令を実行するときにループ内の命令の順序を入れ替えて実行できる命令から先に発行することができるので、実施例 4よりもループ処理が高速化できるといっメリッ卜&ある。

本発明の実施形態は図 15に示すように分類される。あるループ処理時に命令を繰り返し読み出すためにバッファを使用するか否かを判別する手段として次の 3つがあげられる。

( 1 )制御フラグの導入。例えば、実施例 1のパ'ッファ制御フラグ 124 ( B C F )。

(2)ループカウン卜レジスタへのループ回数口一ド。例えば、実施例 2のループカウントレジスタ 742 (L C) 。

(3) リピート先頭および末尾ァドレスレジスタの値の差を調べる。例えば、実施例 3 のリピートスタートァドレスレジスタ 931 (R S)、リビートェンドアドレスレジスタ 932 (RE) およびその差分検出回路 937。

一方、パ'ッファの実現手段は次の 2つに大別される。

G)命令キューとは別にバッファを持つ。例えば、実施例 1のバッファ 104は命令キューとは全く別の機能ブロックである。

(ii)命令キューを流用してバッファを実現する。例えば、実施例 4又は実施例 5のバッファ（ I Q0〜7) は命令キューとしても利用している。本発明の実施形態は、上記の（1 ) 〜（3 ) と（i) 〜（ii) を任意に組み合わせて実現する（3 x 2 = 6とおり）ことが可能である。従って、実施例として、実施例 1、実施例 2、実施例 3、実施例 4、実施例 5で示した組合せ以外にも上記（2 ) と（ii) 又は（3 ) と（ii) の組合せで実現することもできる。

以上本発明者によってなされた発明を実施例に基づいて具体的に説明したが、本発明はそれに限定されるものではなく、その要旨を逸脱しない範囲において種々変更可能であることはいうまでもない。

本願において開示される発明のうち代表的なものによって得られる効果を簡単に説明すれば下記のとおりである。

すなわち、リピート命令が利用できないにもかかわらず、ループ処理時に命令を小規模なバッファから繰り返し読み出すことによりメモリアクセスに要する電力を低減する制御手段を備えているデータ処理装置を提供することができる。また、ループ処理時に繰り返し実行すべき命令を小規模なバッファから繰り返し読み出す制御を適用するか否かを選択する手段を備えているデータ処理装置を提供することができる。

Claims

請求の範囲

1 .第 1の命令記憶手段に格納されている命令を読み出して実行するデータ処理装置であつて、繰り返し実行すべき一連の命令に先立ってレジス夕の内容を変更する命令を実行した結果前記のレジス夕の内容が特定条件に合致した場合に、繰り返し実行すべき前記の一連の命令を第 2の命令記憶手段に保持させ前記の第 2の命令記憶手段から繰り返し出力させることを特徴とするデータ処理装置。

2 .請求項 1に記載のデータ処理装置において、繰り返し実行すべき前記の一連の命令の最後の命令は所定の条件が成立したときに前記の一連の命令の最初の命令への分岐を生じさせる命令である。

3 .請求項 2に記載のデータ処理装置において、前記レジスタの内容を変更する命令は、前記レジスタに含まれるビッ卜の論理値を指定する命令である。

4 . 請求項 2に記載の処理装置において、前記レジスタの内容を変更する命令は、前記の一連の命令の実行を繰り返すべき回数値を前記レジスタにロードする命令である。

5 . 請求項 1に記載のデータ処理装置において、前記第 2の命令記憶手段は、前記第 1 の命令記憶手段から実行に先立つて読み出される複数の命令を格納する命令キユーとは別の命令ノくッファである。

6 .請求項 1に記載のデータ処理装置において、前記レジスタの内容を変更する命令は、繰り返し実行すべき前記の一連の命令の先頭命令の位置を特定する情報及び末尾命令の位置を特定する情報を前記レジスタにロードする命令である。

7 . 請求項 6に記載のデータ処理装置において、前記の先頭命令の位置を特定する情報と前記の末尾命令の位置を特定する情報から求められる繰り返し実行すべき命令の数力、'特定の値以下であることが前記の特定条件に相当する。

8 . 請求項 7に記載のデータ処理装置において、前記第 2の命令記憶手段は、前記第 1 の命令記憶手段から実行に先立って読み出される複数の命令を格納する命令キューである。

9 . 請求項 1に記載のデータ処理装置において、前記第 2の命令記憶手段は、そのゲ一ト端子が第 1のノードに接続され、そのソース、ドレイン端子の一方が第 2 のノード、他方が第 3のノードに接続される第 1の Nチャネル型 MOS FETと、そのゲー卜端子が前記第 1のノードに接続され、そのソース、ドレイン端子の一方が第 4のノード、他方が第 5のノードに接続される第 2の Nチャネル型 MOS FETと、そのゲート端子が前記第 5のノードに接続され、そのドレイン端子が前記第 3のノードに接続され、そのソ一ス端子が第 1の動作電位点に接続される第 3の Nチャネル型 M OS FETと、

そのゲ一卜端子が前記第 3のノードに接続され、そのドレイン端子が前記第 5のノードに接続され、そのソース端子が前記第 1の動作電位点に接続される第 4の Nチャネル型 M0SFETとを構成要素に含む記憶保持回路を有する。

10. 請求項 9に記載の処理装置において、前記第 2の命令記憶手段は、さらに前記第 2のノードと前記第 4のノードとを一対とする入力信号に応答する増幅回路を具備する。

1 1.請求項 1に記載のデータ処理装置において、前記レジスタの内容が前記特定条件に合致していない状態においては、前記第 1の命令記憶手段から読み出された任意の命令はたかだか 1回実行されるためにのみ前記第 2の命令記憶手段に一時的に保持される。

12. 請求項 1に記載のデータ処理装置において、前記第 1の命令記憶手段は、主記憶装置に記憶される命令の一部を記憶するキヤッシュメモリである。

13. 請求項 1に記載のデータ処理装置は、単一の半導体基板上に形成される。

14.請求項 1に記載のデータ処理装置において、前記命令はソースプログラム作成時には存在せず、コンパイラでォブジヱクトコードに変換されるとき生成される。

15. プログラムメモリと、

命令バッファと、

レジスタとを単一の半導体基板上に具備し、

前記命令バッファは、前記プログラムメモリに記憶される命令の一部を保持可能にされ、前記レジス夕の内容を変更する命令が前記レジスタの内容を所定の条件に設定した場合、前記命令に弓 Iき続く繰り返し実行される命令は前記命令ノヾッファから読み出されることを特徴とするデータ処理装置。

1 6 . 請求項 1 5に記載のデータ処理装置において、前記繰り返し実行される命令は複数の命令であり、前記繰り返し実行される命令の最後の命令は所定の条件が成立したとき、前記繰り返し実行される命令の最初の命令への分岐を生じさせる命令である。

1 7 . 請求項 1 6に記載のデータ処理装置において、前記命令バッファは命令プリフエッテキユーでめる。

1 8 . 請求項 1 7に記載のデータ処理装置において、前記プログラムメモリは、該デ一タ処理装置の外部にある主記憶装置に格納される命令の一部を格納するキヤッシュメモリである。

1 9 . 請求項 1 8に記載のデータ処理装置において、前記レジスタの内容を変更する命令は、前記レジスタに含まれるビッ卜の論理値を指定する命令である。

2 0 .請求項 1 8に記載のデータ処理装置において、前記レジスタの内容を変更する命令は、前記繰り返し実行される命令の繰り返し回数に相当する値を前記レジスタに口一ドする命令である。

2 1 .請求項 1 8に記載のデータ処理装置において、前記レジスタの内容を変更する命令は、前記繰り返し実行される命令の先頭の命令の位置を特定する情報と末尾の命令の位置を特定する情報とを前記レジスタにロードする命令である。

2 2 .請求項 2 1に記載のデータ処理装置において、前記命令の先頭の命令の位置を特定する情報と前記末尾の命令の位置を特定する情報との差が所定の値以下であることが所定の条件に相当する。