論文

# レジスタ転送レベルデータパスの単一制御並行可検査性に基づく 組込み自己テスト法

山口 賢一<sup>†</sup> 和田 弘樹<sup>††</sup> 増澤 利光<sup>†††</sup> 藤原 秀雄<sup>†</sup>

A BIST Based on Concurrent Single-Control Testability of RTL Data Paths

Ken-ichi YAMAGUCHI<sup>†</sup>, Hiroki WADA<sup>††</sup>, Toshimitsu MASUZAWA<sup>†††</sup>, and Hideo FUJIWARA<sup>†</sup>

あらまし レジスタ転送レベルデータパスの組込み自己テスト法として,単一制御可検査性に基づく方法が提 案されている[2].この手法では,小さいハードウェアオーバヘッドで100%近い故障検出率が得られるが,組合 せ回路要素を一つずつテストするためテスト実行時間が大きい.そこで本論文では,複数の組合せ回路要素を同 時にテスト(並行テスト)できるように,単一制御可検査性を拡張した単一制御並行可検査性を提案し,この可 検査性に基づく組込み自己テスト方式を提案する.ベンチマーク回路を用いた実験の結果により,提案手法は単 一制御可検査性に基づく手法に比べて,ハードウェアオーバヘッドがほとんど増加することなく,テスト実行時 間を縮小できることを示す.

キーワード テスト容易化設計,レジスタ転送レベルデータパス,組込み自己テスト,単一制御可検査性,階 層テスト

## 1. まえがき

VLSIの大規模化,複雑化に伴い,論理回路のテス トとして組込み自己テスト法(Built-In Self-Test.以 下,BIST)が重要視されている.BISTを実現する ために,テスト対象回路の外部入力(Primary Input. PI),外部出力(Primary Output. PO)に,それぞ れ,テストパターン生成器(Test Pattern Generator. TPG),応答解析器(Response Analyzer.RA)を付 加する.しかし,テスト対象回路に閉路が含まれてい る場合には,PIとPOにTPG,RAを付加するだけ では高い故障検出率を得ることができない.そのため, 高い故障検出率を得るために,回路内部にテストのた めのハードウェアを付加する方法が数多く提案されて いる[1].このように,回路の設計をテスト容易となる

 \* 奈良先端科学技術大学院大学情報科学研究科,生駒市 Graduate School of Information of Science, Nara Institute of Science and Technology, 8916-5 Takayama-cho, Ikoma-shi, 630-0101 Japan

<sup>††</sup> 株式会社日立製作所中央研究所システム LSI 研究部,国分寺市 Central Research Laboratory, Hitachi, Ltd, 1-280 Higashi-Koinokubo, Kokubunji-shi, 185-8601 Japan

\*\*\*\* 大阪大学大学院基礎工学研究科,豊中市 Graduate School of Engineering Science, Osaka University, 1-3 Machikaneyama, Toyonaka-shi, 560-8531 Japan ように変更することをテスト容易化設計(Design For Testability. 以下, DFT)と呼ぶ.

BIST は, test per scan 方式と test per clock 方式 に分類できる.test per scan 方式では,回路中の(一 部の)レジスタをスキャンレジスタに変更し,スキャ ン操作により,TPG で生成したテスト系列をスキャ ンレジスタにシフトインし,スキャンレジスタに格納 された応答を RA にシフトアウトする.test per scan 方式では,スキャン操作によりテスト系列を1ビット ずつシフトインするので,連続したシステムクロック でテスト系列を印加できず,テスト実行時間も長い.

一方,test per clock 方式では,回路中の(一部の) レジスタを TPG, RA に変更する.このようなテス トレジスタとしては,BILBO(Built-In Logic Block Observer)[3],CBILBO(Concurrent BILBO)が用 いられる.test per clock 方式の BIST として,Wunderlich ら [4] は,回路中のすべての閉路が少なくと も二つの BILBO か一つの CBILBO を含むようにす るテスト容易化設計法を提案している.この手法で は,内部レジスタを含む多くのレジスタを BILBO や CBILBO に設計変更する必要があるため,ハードウェ アオーバヘッドが大きくなる.

そこで,井筒ら [2]は,単一制御可検査性というテス ト容易性を提案し, test per clock 方式の BIST とし て,単一制御可検査性に基づく方法とそのテスト容易 化設計法を提案している.この手法では,内部レジス タを BILBO や CBILBO に変更せず, TPG, RAは, それぞれテスト対象回路の PI, PO のみに付加する. そして,階層テストに基づいてデータパス中の組合せ 回路要素(演算器,マルチプレクサなど)ごとにテス トを行う. つまり, テスト系列を TPG から各組合せ 回路要素までデータパス内の経路を通って伝搬させ、 応答をその組合せ回路要素から RA までデータパス内 の経路を通って伝搬させる.また,連続クロックでテ スト系列の生成/印加,応答の解析を可能にするため, これらの経路が共通部分をもたないようにする.その ため,単一制御可検査性は(単一縮退故障に対して) 高い故障検出率が保証され,更にシステムクロックで のテストが必要となる他の故障モデル(トランジショ ン故障,遅延故障など)も検出することが可能である. 井筒らの手法 [2] では,内部レジスタを TPG や RA に変更せず,応答の伝搬はデータパス中の経路を利用 するため, Wunderlichら [4] の手法と同等の故障検出 率を得るために必要な, ハードウェアオーバヘッドは 小さい.しかし,組合せ回路要素を一つずつテストす るために,テストセッション数がテスト対象回路要素 分だけ必要になるためテスト実行時間が大きくなる.

そこで,本論文では,井筒らの手法[2]の長所であ る高い故障検出率と低いハードウェアオーバヘッドを 実現し,欠点であったテスト実行時間を短縮するため に,単一制御並行可検査性を提案する.単一制御並行 可検査性は,複数の組合せ回路要素を同時にテストす ることによりテスト実行時間を短縮するように単一制 御可検査性を一般化したものである.単一制御並行可 検査性は単一制御可検査性と同様にデータパス内のレ ジスタを TPGやRAに変更せず,PIのみに付加した TPGからの値を伝搬し,POのみに付加したRAへ の応答の伝搬を行うため,井筒らの手法[2]と同様に 低いハードウェアオーバヘッドで高い故障検出率を得 ることができる.また,低いハードウェアオーバヘッ ドで与えられたデータパスを単一制御並行可検査にな るように設計変更するテスト容易化設計法を提案する.

本論文で提案する BIST の特徴は以下のとおりで ある.

高い故障検出率:提案手法は階層テスト [5] に基づき,テストはデータパス中の回路要素ごとに行われ

る.実際のデータパスで使用されるほとんどの組合せ 回路要素(加算器,減算器,乗算器,マルチプレクサ など)は,ランダムパターンを用いることにより,高 い故障検出率を得られることが知られており[6],提案 手法で高い故障検出率が得ることが期待できる.

 低いハードウェアオーバヘッド:提案手法は井 筒らの手法[2]と同様にTPG, RAをPI, POのみに 付加するので,Wunderlichら[4]の手法に比べ,ハー ドウェアオーバヘッドが低いことが期待できる.

短いテスト実行時間:提案手法はデータパス中の複数の組合せ回路要素を同時にテストする.そのため,一つずつテストする井筒らの手法[2]に比べて,テスト実行時間が短くなることが期待できる.

test per clock 方式:井筒らの手法 [2] と同様,
 連続クロックで,テストパターンの生成,応答の解析が可能であり,システムクロックでのテストが可能である.ただし,システムクロックは,通常動作時の最大遅延だけから決定するのではなく,テスト動作時の最大遅延も考慮して決定するものとする.

以下,2.ではデータパスを定義し,データパスグラ フについて述べる.3.では単一制御並行可検査性を定 義する.4.では単一制御並行可検査性に基づくテスト 容易化設計法を述べる.5.ではベンチマーク回路を用 いた実験により,提案手法を評価し,6.にてまとめる.

## 2. データパス

2.1 データパス

レジスタ転送レベル回路はデータパスとコントロー ラから構成されるが,本論文ではデータパスのみを対 象と考える.データパスは以下の構成要素からなる.

▷ 回路要素

▷ データ信号線:回路要素を相互に接続

▷ 制御信号線:コントローラから回路要素へ制御 信号を伝達

▷ 状態信号線:回路要素からコントローラへ状態 信号を伝達

以下に各構成要素について説明する.

 回路要素:回路要素は PI, PO, ラッチ, レジ スタ,マルチプレクサ,演算モジュールに分類される.
 このうちマルチプレクサ,演算モジュールを組合せ回 路要素と呼ぶ.

回路要素に対してデータ信号線が接続される端子を データ端子,制御信号線が接続される端子を制御端子, 状態信号線が接続される端子を状態端子と呼ぶ.デー タ端子は回路要素に信号を入力するためのデータ入力 端子と回路要素からデータを出力するためのデータ出 力端子に分類される(以下,データ入力端子を入力端 子,データ出力端子を出力端子と呼ぶ).データパス 上のすべての回路要素のデータ端子は等しいビット幅 をもつものとする.

PI, PO: PI はデータパス外部からデータパスに データを入力するための回路要素, PO はデータパス から外部にデータを出力するための回路要素である. 便宜上, PI は一つの出力端子のみをもち, PO は一つ の入力端子のみをもつものとする.

マルチプレクサ: マルチプレクサは二つの入力端子 と一つの出力端子,1ビットの制御端子をもつ.制御 端子の値に従って,対応する入力端子の値をそのまま 出力端子に出力する.

演算モジュール: 演算モジュールは一つまたは二つ の入力端子,一つの出力端子,たかだか一つの制御端 子,たかだか一つの状態端子をもつ.入力端子に与え られた値に対して演算を行い,その結果を出力端子に 出力する.

ラッチ,レジスタ: ラッチ,レジスタはいずれも記憶 素子である.ラッチは一つの入力端子と一つの出力端 子をもつ.入力端子に与えられた値を記憶し,その値 を次のクロックサイクルで出力端子に出力する.レジ スタは一つの入力端子と一つの出力端子,1ビットの 制御端子をもつ.制御端子の値によって,入力端子の 値を新たに記憶するか(ロード),既に記憶している 値を保持する(ホールド).記憶している値は次のク ロックサイクルで出力端子に出力する.

 データ信号線:データ信号線(以降,単に信号 線と呼ぶ)は相異なる回路要素の出力端子と入力端子 を接続する.複数の信号線を同一の出力端子に接続で きる(ファンアウト可能)が,入力端子に接続する信 号線は1本のみとする.

 制御信号線, 状態信号線:制御信号線はコント ローラからデータパス上の回路要素に対して制御信号 を伝達し,状態信号線は回路要素からコントローラに 対して状態信号を伝達する.

2.2 データパスグラフ

データパスに対してデータパスグラフG = (V, A)を次の有向グラフとして定義する.

•  $V = V_1 \cup V_2$ 

ここで *V*<sub>1</sub> はデータパス中のすべての回路要素の集合, *V*<sub>2</sub> はデータパス中のすべてのデータ端子の集合



図 1 データパスとデータパスグラフ Fig. 1 Data path and data path digraph.

とする.以下では,データパスグラフ G の頂点集合  $V_1, V_2$ をそれぞれ  $G.V_1, G.V_2$ ,と表す.また,すべて の組合せ回路要素の頂点集合を  $V_C(\subseteq V_1)$  として表す.

•  $A = A_1 \cup A_2 \cup A_3$ 

ここで  $A_1$  はデータ信号線を表し,  $A_1 = \{(x, y) \in V_2 \times V_2 |$  出力端子 x と入力端子 y がデータ信号線で接続  $\}$  とする.また,  $A_2$ ,  $A_3$  はそれぞれ, 入力端子と回路要素を接続する信号線,回路要素と出力端子を接続する信号線を表す.すなわち,  $A_2 = \{(x, u) \in V_2 \times V_1 | x | u u 0 入力端子 \}$ ,  $A_3 = \{(u, x) \in V_1 \times V_2 | x | u u 0 出力端子 \}$ とする.以下では,データパスグラフ G の辺集合  $A_1, A_2, A_3$ をそれぞれ  $G.A_1, G.A_2, G.A_3$ として表す.

図 1 (a) のデータパスに対するデータパスグラフを 図 1 (b) に示す.本論文で対象とするデータパスは,そ のデータパスグラフにおいてすべての入力端子は,少 なくとも一つの PI から到達可能であり,すべての出 力端子は少なくとも一つの PO に到達可能であるもの とする.また,データパスグラフはその対応するデー タパスと同一視する.

またデータパスグラフの拡張として,演算器にス ルー機能が実現されている場合のデータパスグラフに ついても考える.スルー機能は,演算モジュールにお いて入力端子と出力端子の間での任意の値の伝搬を保 証する機能である.

そこで, データパスグラフ G = (V, A) の部分



(a) Data path with thru  $% \left( b\right) = \left( b\right) \left( b\right)$ 

- 図 2 スルー機能付データパスとスルー制約付データパス 部分グラフ
- Fig. 2 A data path and data path diagraph with thru function.

グラフとして,スルー制約付データパス部分グラフ  $G' = (V, A'(\subseteq A))$ を定義する. $A' = A_1 \cup A'_2 \cup A_3$ のように定義され, $A'_2$ は,スルー機能を有する組合 せ回路要素の入力端子と回路要素,若しくはレジスタ 及びラッチの入力端子と回路要素への対応を表す.

図 2 にスルー機能を有するデータパスに対するス ルー制約付データパスグラフを示す.データパスの制 御信号線に適切な制御ベクトルを与えることでスルー 制約付データパス部分グラフ上の任意の単純経路に 沿って任意の値を連続して伝搬することができる.

図 2 (a) のデータパスに対するデータパスグラフを 図 2 (b) に示す.

3. 単一制御並行可検査性

3.1 単一制御可検査性

井筒らの手法 [2] は, BIST のためにレジスタ転送レ ベルデータパスの単一制御可検査性を提案し,与えら れたデータパスを単一制御可検査にするための DFT 手法を提案した.データパスの単一制御可検査性を次 のように定義している.

[定義 1] データパス中の任意の組合せ回路要素 M に おいて,以下の条件を満たす三つの共通部分をもたな い経路 P<sub>1</sub>, P<sub>2</sub>, P<sub>3</sub> が存在するなら,データパスは単一 制御可検査であるという. 任意の値がそれぞれ P<sub>1</sub>, P<sub>2</sub>, P<sub>3</sub> を通って伝搬
 可能.

*P*<sub>1</sub>, *P*<sub>2</sub> は TPG を始点とし, *M*<sup>(注1)</sup>の入力端子
 を終点とする.

● *P*<sub>3</sub> は , *M* の出力端子を始点とし , RA を終点 とする . □

P<sub>1</sub>, P<sub>2</sub> を M の制御経路, P<sub>3</sub> を M の観測経路と呼ぶ.

単一制御可検査データパスにおいて TPG と RA を それぞれ PI と PO に置くことにより,組合せ回路要 素 M に対して,制御経路を用いて PI から連続した テスト系列を印加し,観測経路を用いて M の応答を 連続して PO で観測できる.ほとんどの組合せ回路要 素(加算器,減算器,乗算器,シフタ,マルチプレク サなど)はランダムパターンでテスト可能である.ま た,比較器などランダムパターンでテスト可能でない 組合せ回路要素に関しては,テストポイント挿入手法 によってランダムパターンでテスト可能にできる[6]. したがって,単一制御可検査データパスに対しては, BIST によって高い故障検出率を得ることができる.

制御経路,観測経路上の,演算モジュールやマルチ プレクサは,この経路上の入力端子の値が出力端子に 伝搬するように制御する<sup>(注2)</sup>.これらを制御する信号 は, M のテストの間固定しておけばよい.このよう に,各組合せ回路要素に対して,一つの制御パターン で十分なので,この性質のことを単一制御可検査性と 呼ぶ.

3.2 単一制御並行可検查性

ここでは,複数の組合せ回路要素を同時にテスト可 能なように単一制御可検査性を拡張した単一制御並行 可検査性を定義する.

[定義 2] *M*をデータパス中の組合せ回路要素の集合 とする.スルー制約付データパス部分グラフ *G'*にお いて組合せ回路要素の集合 *M*が以下の条件を満たす とき,*M*は単一制御並行可検査であるという.

以下の条件を満たす,互いに共通部分をもたな
 い木 T<sub>1</sub>, T<sub>2</sub>,...,T<sub>m</sub> が存在(各 T<sub>i</sub>を制御木と呼ぶ.)

- それぞれの木は PIを根とする.

- 各組合せ回路要素  $M_i (\in \mathcal{M})$ の各入力端子は木

<sup>(</sup>注1): P<sub>1</sub> と P<sub>2</sub> はそれぞれ異なる TPG を始点とする. (注2): 演算モジュールが入力端子の値を出力端子に伝搬する機能(ス ルー機能)をもたない場合は,テスト容易化設計でスルー機能を付加し, それを利用する.

の葉である.

- 各組合せ回路要素  $M_i (\in \mathcal{M})$ の二つの入力端子 は異なる木に属する.

G' − (T<sub>1</sub> ∪ T<sub>2</sub> ∪... ∪ T<sub>m</sub>) において,以下の条件を満たす,互いに共通部分をもたない経路 P<sub>1</sub>, P<sub>2</sub>,..., P<sub>n</sub>が存在(各 P<sub>i</sub>を観測経路と呼ぶ.)

- 各組合せ回路要素  $M_i (\in \mathcal{M})$ の出力端子が始点である.

- 各経路の終点は PO である. □

M が単一制御並行可検査なら, TPG, RA をそれ ぞれ PI, PO に配置し, テスト系列, 応答を制御木, 観測経路を用いて伝搬することにより, M に属する すべての組合せ回路要素を同時にテストできる.更に, このテストの間,制御木及び観測経路に現れる演算モ ジュール及びマルチプレクサの制御信号を固定してお けばよい.つまり, M に対して,一つの制御パター ンで十分である.

データパスのすべての組合せ回路要素を,単一制御 並行可検査な組合せ回路要素の集合  $\mathcal{M}_1, \mathcal{M}_2, \ldots, \mathcal{M}_l$ に分割できるとする.このとき,各  $\mathcal{M}_i$ に属する組合 せ回路要素を同時にテストすれば,データパス全体の テスト実行時間は,全体の組合せ回路要素数ではなく, lに比例すると考えられる.このとき,各  $\mathcal{M}_i$ に属す る組合せ回路要素のテストをテストセッションと呼ぶ.

データパス全体のテスト実行時間を短縮するには, テストセッション数が小さくなるように,すべての組 合せ回路要素を単一制御並行可検査な集合に分割すれ ばよい.一方,同時にテストされる組合せ回路は,相 異なる応答解析器を利用するので,応答解析器が k 個 しかなければ,たかだか k 個の組合せ回路要素が単 一並行可検査となり得る.これらのことを考慮して, データパスの並行可検査性を以下のように定義する. [定義 3](データパスの単一制御 k-並行可検査性) ス ルー制約付データパス部分グラフ G'において,以下 の条件を満たす組合せ回路要素 V<sub>C</sub> 上の分割 P(V<sub>C</sub>) が存在するなら,データパス DP が単一制御 k-並行 可検査であると定義する.

∀S ∈ P(V<sub>C</sub>) に対して, S(組合せ回路要素の
 集合)が単一制御並行可検査

•  $\forall S \in P(V_C)$  に対して,  $|S| \leq k$ 

•  $|P(V_C)| = \lceil |V_C|/k \rceil$ 

単一制御 k—並行可検査データパスでは,組合せ回 路要素集合  $V_C$  を, $[|V_C|/k]$  個の部分集合(ただし, 各部分集合はたかだか k 個の組合せ回路要素を含む)

に分割し,各部分集合に属する組合せ回路要素を同時 にテストできる.したがって,テストセッション数が 単一制御可検査データパスの場合に比べてほぼ 1/k に 減少する.単一制御 k-並行可検査性は,単一制御可 検査性の一般化であり,k=1の場合,単一制御 k-並 行可検査性は単一制御可検査性となる.以下では,k の値を特に指定しないときは,単一制御 k-並行可検 査性のことを単一制御並行可検査性と呼ぶ.

4. 単一制御並行可検査テスト容易化設計法

本章では,与えられたデータパスを単一制御並行 可検査データパスに設計変更するための DFT 手法を 示す.

4.1 問題の定式化

与えられたデータパスにおいて,同時にテストする 組合せ回路要素に対して,共通部分をもたない制御木 及び観測経路が存在しない場合,単一制御並行可検査 にするためには,データパスに新しい経路を付加しな ければならない.提案するDFTでは,この経路付加 は,マルチプレクサ(テスト MUX と呼ぶ)を用いて 実現する.また,制御経路,観測経路に演算モジュー ルが現れる場合,任意の値を伝搬可能とするために, この演算モジュールにスルー機能を付加する.そこで, 単一制御並行可検査のためのDFTを,次の最適化問 題として定式化する.

[定義 4](単一制御並行可検査 DFT)単一制御並行可 検査のための DFT を次の最適化問題として定義する.

• 入力:データパス,並行度 k

• 出力:単一制御 k-並行可検査なデータパス

● 最適化目標:付加する DFT 要素(スルー機能,
 テスト MUX)のハードウェア量最小化

4.2 DFT アルゴリズムの概要

単一制御並行可検査 DFT のための発見的アルゴリ ズムを示す.本アルゴリズムは,以下の2段階から なる.

ステージ1: 与えられたデータパスを単一制御可検査 に設計変更する.この設計変更には,井筒ら[2]の手 法を改良したものを用いる.詳細は4.3に示す.

ステージ2:ステージ1で得られたデータパスを単一 制御 k-並行可検査なデータパスに設計変更する.こ こでは,すべての組合せ回路要素に対して制御経路と 観測経路を決定するまで,以下の三つのステップを繰 り返す.

(1) スケジューリング:同時にテストする組合せ

回路要素として,未スケジューリング組合せ回路要素 から k 個選択する.1.で詳細を示す.

(2) 観測経路に関する DFT:(1) で選ばれた k 個の組合せ回路要素に対して,それぞれ観測経路を決 定する.ここで,テスト MUX を付加した場合,付加 したテスト MUX は未スケジューリング組合せ回路要 素となり,後のスケジューリングの対象となる.1.で 詳細を示す.

(3) 制御経路に関する DFT:(1)で選ばれた k 個 の組合せ回路要素に対して,それぞれ制御経路を決定 する.(2)と同様に,付加したテスト MUX は未スケ ジューリング組合せ回路要素であり,後にスケジュー リング対象となる.4.5 で詳細を示す.

4.3 単一制御可検査 DFT (ステージ1)

このステージの目的は,与えられたデータパスを最 小のハードウェアオーバヘッドで単一制御可検査にす ることであり,井筒ら[2]の手法を改良した手法を用 いる.文献[2]の手法は,組合せ回路要素一つずつを 順に処理し,互いに共通部分をもたない二つの制御経 路と一つの観測経路をもつようにDFT 要素を付加す る.先に加えたDFT 要素は後の組合せ回路要素で再 利用できるので,全体のハードウェアオーバヘッドを 削減するには,必要性の高いDFT 要素を早い段階で 付加することが重要である.そこで,本論文の手法で は,文献[2]の手法を適用する前に,以下に定義する カットエッジに基づいた処理を行う.

[定義 5] データパスグラフ G に対して,  $e \in G.A_3$ を取り除いて得られるグラフを G'(e) と表す.つまり, G'(e).V = G.V かつ  $G'(e).A = G.A - \{e\}$  である. G'(e) においてどの PI からも到達不能な組合せ回路 要素 M が存在する場合,  $e(\in G.A_3)$  をカットエッジ と呼び, M は e によって支配されるという.

データパスグラフがカットエッジ e をもつなら, e によって支配される組合せ回路要素は共通部分をもたない二つの制御経路をもつことができず, MUX を 付加することにより,新たな経路を追加する.一つの MUX を加えることにより,複数のカットエッジを解 消できる可能性がある.そこで,カットエッジに対し て次の半順序関係を定義し,その半順序に従ってカットエッジを処理する.

[定義 6] データパスグラフ G におけるカットエッジ e に対して, e によって支配されるすべての組合せ回路 要素を D(e) と表す.ここで,G におけるカットエッ ジの半順序を次のように定義する. while (there exists a cut edge in G){

e :=minimal cut edge in G;

- V(e) :=the set of all vertices unreachable from any PI in G(e);
- M(e) :=the maximal subgraph of G(e) with vertex set V(e);

construct a spanning tree T of  ${\cal M}(e)$ 

- with the root u (u is the end vertex of e);
- $V' := \{ v \in V(e) \mid v \text{ has an outgoing edge}$

in M(e).E - T.E;

choose any v from  $V^\prime$  and insert a test MUX M

in front of the v's input port;

if (there exists a PI i unreachable to  $\boldsymbol{e})$ 

connect i to the other input port of M; else

choose any PI i and connect i to

the other input port of M;

update G by adding M and the lines;

apply the DFT method in [2];

図 3 単一制御可検査 DFT

Fig. 3 DFT for single-control testability.

カットエッジ e 及び e'において ,  $D(e) \subset D(e')$ のとき , またそのときに限り , e < e'とする .  $\Box$ 

もし,二つのカットエッジ  $e_1 \ge e_2$  が  $e_1 < e_2$  を 満たすなら, $e_1$  のために加えられる MUX によって,  $e_2$  がカットエッジでなくなることがある.このよう に提案手法では,最初に  $e_1$  に対してテスト MUX を 付加しておき,必要であれば  $e_2$  に対してもテスト MUX を付加する.カットエッジがなくなるまでテス ト MUX を付加し,その後は [2] で提案した手法を適 用して DFT を行う.ただし,提案手法は最初のステー ジでは制御経路及び観測経路の決定は行わない.図 3 に我々の DFT 手法の最初のステージを示す.

4.4 スケジューリング及び観測経路に関するDFT
 (ステージ2)

スケジューリングは同時にテストする組合せ回路要素の集合 *M* を決定することである.提案する DFT アルゴリズムは,最小のハードウェアオーバヘッドで 観測経路を実現できるように *M* を決定する.観測経 路を制御経路より先に決定するのは,制御経路は異な る組合せ回路要素で共有可能だが,観測経路は共有不 能であり,可観測性のための DFT ハードウェアオー バヘッドが支配的(並行度 *k* が大きいとき,特に顕 著)になるためである.

スケジューリングにおいて,組合せ回路要素が既に 決定された集合 *M* に含まれるならスケジューリング 済み,そうでないなら未スケジューリング組合せ回路 要素という.ただし,すべての PO はスケジューリン グ済みとする.未スケジューリング組合せ回路要素か ら同時にテストする組合せ回路要素を決定する2ス テップを以下に示す.

(1) 候補組合せ回路要素の選択

 k 個以上未スケジューリング組合せ回路要素が存在する場合:スケジューリング済み組合せ回路要素に隣接するすべての未スケジューリング組合せ回路要素を候補とする.候補数 ℓ が k 未満ならば,候補が k 個になるように,未スケジューリング組合せ回路要素を適当に候補に加える

m(< k) しか未スケジューリング組合せ回路要素が存在しない場合:すべての未スケジューリング組合せ回路要素を候補とする.</li>

(2) 組合せ回路要素集合 *M* 及び *M* に含まれる
 組合せ回路要素の観測経路の決定

次に示すようにデータパスグラフを構築し,流量 k (ただし,候補数が m(< k) 個なら流量 m)の最小費 用流問題を解く.図4に k = 3の例を示す.

• 各候補組合せ回路要素に対する辺をもつダミー 頂点を付加し始点とする.

すべての PO からの辺をもつダミー頂点を付加
 し終点とする.

 各候補組合せ回路要素から PO ヘテスト MUX に対応する辺を加える.

• 得られたグラフにおける各辺 (u,v) に対して, 容量を c(u,v) = 1 と定義し,コスト p(u,v) を以下 のように定義する.

| $p(u, v) = cost\_thru(u)$ | u が $v$ の入力端子      |
|---------------------------|--------------------|
| $= cost\_MUX$             | (u,v) が付加された $MUX$ |
| = 0                       | 上記以外の場合            |

( $cost\_thru(u)$ はuからvの出力端子へのスルー機能 のハードウェアコスト.スルー機能が既に付加されて いる場合は, $cost\_thru(u) = 0.cost\_MUX$ はMUX のハードウェアコスト)

グラフの最小費用流は *M* を構成する組合せ回路要 素数であり,最小費用流で用いる経路は,最小のハー ドウェアオーバヘッドで実現できる観測経路を表す. 観測経路のために,スルー機能とテスト MUX が付加 される.

4.5 制御経路に関する DFT (ステージ2)

与えられた組合せ回路要素集合 *M* に対して, *M* に含まれるすべての組合せ回路要素の制御経路を図 5





 $\begin{array}{l} G':= \text{a digraph obtained from } G \text{ by removing} \\ \text{ the observation paths of all modules in } \mathcal{M} \\ \text{while } (\mathcal{M} \neq \emptyset) \{ \\ \text{ choose any module } v \in \mathcal{M}; \\ \text{ determine control paths } P_1 \text{ and } P_2 \text{ of } v \\ \text{ (by finding the minimum cost flow of two);} \\ \text{ add DFT elements for } P_1 \text{ and } P_2; \\ \text{ for each module } u \text{ on } P_i \ (i=1,2) \\ \text{ update } G' \text{ by removing the outgoing edge} \\ \text{ from the input port of } u \text{ that is not on } P_i; \\ \mathcal{M}:=\mathcal{M}{\{v\}} \\ \end{array} \right\}$ 

図5 制御経路に関する DFT Fig.5 DFT for control paths.

の手続きによって決定する.この手続きでは, *M* の 要素は一つずつ考慮する.組合せ回路要素の制御経路 は観測経路と同様に決定される: *G* から *M* に含まれ る組合せ回路要素のすべての観測経路を除去して構成 されるグラフ *G*'において,流量2の最小費用流問題 を解く.*G* の代わりに *G*'において扱うのは,決定す る制御経路が既に決定されている観測経路と共通部分 をもたないようにするためである.すべての制御経路 が手続きによって互いに共通部分をもたない木を決定 するので,各繰返しステップの最後に *G*'を更新する.

図 5 において,組合せ回路要素に二つの共通部分を もたない制御経路が見つからない場合,テスト MUX *M*を制御経路を構成するために付加する.テスト MUX *M*は,付加されたときには未スケジューリング 組合せ回路要素とみなされ,*M*の制御経路と観測経 路は後で決定する.データパスの構造によっては,*M* の入力端子に新たにもう一つのテスト MUX が制御経 路を決定するために加えられる可能性があり,更にテ スト MUX のためのテスト MUX が付加され続ける可 能性もある.連続したテスト MUX の付加を避けるた めに,必要に応じて図 5 の手続きに例外処理を行う. この場合,グラフ G において M の制御経路の決定 を妨げる観測経路を有する組合せ回路要素  $M' \in \mathcal{M}$ を検出し,M'から(テスト MUX を加えることで) PO に直接観測経路を生成することによって M'の観 測経路を変更する.

4.6 テスト MUX 挿入に関する考察

提案した DFT 手法では,ある組合せ回路要素 *M* の制御経路若しくは観測経路を新たに生成するために, テスト MUX(*M*'とする)を付加することがある.こ のテスト MUX *M*'もテストの対象であり,追加時に は,*M*'は未スケジューリング組合せ回路要素とみな される.つまり,*M* のスケジュールのために *M*'を 加えることは,未スケジューリング組合せ回路要素数 を減らすことには寄与しない.

そこで,テスト MUX M'を付加する代わりに,M を以降のテストセッションに移すことによって,全体 として同じテストセッション数を小さいハードウェア オーバヘッドで実現できる可能性がある.ただし,M のテストのために M'を追加すると,M'を他の組合 せ回路要素の制御経路及び観測経路のために利用可能 であり,他のテスト MUX の追加を防ぐことがある. このため,M'を付加しないことで,同じテストセッ ション数を小さいハードウェアオーバヘッドで実現で きるとは限らない.そこで,上記の手法の有効性を実 験的に調査する.そのために,図5において,Mが 前節で述べた例外処理を必要とする組合せ回路要素 である場合, $M(\in \mathcal{M})$ を $\mathcal{M}$ から取り除き,未スケ ジューリング組合せ回路要素とするように変更した場 合についても,実験結果を次節に示す.

ただし,上記の変更によって得られるデータパスは, 変更しない場合と同じテストセッション数をより小さ



図 6 Paulin 元回路 Fig. 6 Paulin original circuit.



図 7 DFT 適用後 (k = 2)Fig. 7 Paulin DFT circuit(k = 2).

いハードウェアオーバヘッドで実現する場合であって も, k 並行可検査の定義を満たすとは限らない.これ は,得られたデータパスの組合せ回路要素が少なくな るために,テストセッション数が [|V<sub>c</sub>|/k] となること を保証できないからである.

4.7 適用例

提案した手法をレジスタ転送レベルベンチマーク 回路 Paulin (図 6)に適用したデータパスを図 7 に 示す.図7は,並行度  $k \in 2$ として得られた単一制 御2並行可検査なデータパスである.図7 における m12, m13, m14, m15, m16, m17, m18は,ステージ1 の処理により加えられた DFT 要素である.m13は, 図6の  $sub1 \ge m2$ を接続する信号線が,4.3で示し たカットエッジであるために加えられた MUX であり, m12もカットエッジ処理によって加えられた MUX で ある.stc,m14, m15, m16, m17, m18は井筒らの手 法[2] に基づいて挿入された MUX である.表1では,

表 1 Paulin に対するステージ 2 の適用過程 (k = 2)Table 1 Application process of the stage 2 in Paulin(k = 2).

| ID | test r  | nodule | DFTelements      |
|----|---------|--------|------------------|
| 1  | m15     | m18    | add.1-r,mult.1-r |
| 2  | m14     | m17    |                  |
| 3  | m1      | m16    | sub.1-r          |
| 4  | m4      | m2     | mult.1-l         |
| 5  | add.1   | sub.1  |                  |
| 6  | m6      | m9     | mult.2-r         |
| 7  | m12     | m11    | mult.2-l         |
| 8  | $m_{5}$ | m13    |                  |
| 9  | m3      | mult.1 |                  |
| 10 | m8      | m10    | MUX(m19)         |
| 11 | m7      | mult.2 | add.1-l          |
| 12 | m19     |        |                  |

ステージ2の適用過程を示す:IDはテストセッション のIDを示し,test moduleは,セッションでテスト される組合せ回路要素を表す.DFTelementsは,セッ ションを行うために付加されたDFT要素を示す.例 えば,add.1-rは,加算器add.1の右入力から出力へ のスルー機能の付加を表す.

#### 5. 実験結果

この章では,提案手法の実験結果を示し,提案手法 と井筒らの手法 [2] を比較する.

実験に使用したレジスタ転送レベルベンチマーク回 路は,Tseng 及び Paulin と 3rd Lattice Wave Filter (LWF)である.なお,井筒らの手法ではTseng での 適用結果について示されていないため,比較について は Paulin と LWF で行う.表 2 にそれらのベンチマー ク回路の特性を示す:#PI,#PO,#Reg,#MUX,#OP は それぞれ PI 数,PO 数,レジスタ数,マルチプ レクサ数,演算モジュール数を表す.回路面積の単位 は gate equivalent で,論理合成ツールとして Auto-LogicII (Mentor Graphics)を用い,ALTERA 社の 論理合成ライブラリを使用して,計算機上で論理合成 を行うことによって得た.

表 3 は, DFT によって付加されるテスト MUX とス ルー機能数を示し,表 4 ではハードウェアオーバヘッ ド(HW/OH)を示す.これらの表において, Modification については 4.6 で示した変更によって得られ た結果である.一般に BIST を実現する場合, PI 及び PO には TPG 及び RA を付加するので,表 4 にそれ らは含まないものとした.ただし,k = 3の場合は, 新たに応答を観測するための LFSR を付加したため,

| Table 2 Circuit characteristics. |     |     |      |      |     |             |              |              |
|----------------------------------|-----|-----|------|------|-----|-------------|--------------|--------------|
|                                  | #PI | #PO | #Reg | #MUX | #OP | Area(8 bit) | Area(16 bit) | Area(32 bit) |
| Tseng                            | 3   | 2   | 6    | 7    | 7   | 858.6       | 2499.4       | 8085.0       |
| Paulin                           | 2   | 2   | 7    | 11   | 4   | 1142.9      | 3818.9       | 13778.9      |
| LWF                              | 2   | 2   | 5    | 5    | 3   | 355.8       | 735.0        | 1493.4       |

| 表 3     | 付加テス          | ⊦ MU | X 及びスJ    | レー機能     |
|---------|---------------|------|-----------|----------|
| Table 2 | ل م ا م ا م ا | MIIV | and there | frenchia |

|         | Table 5 Added MOX and thru function. |                     |       |       |       |             |       |       |          |       |
|---------|--------------------------------------|---------------------|-------|-------|-------|-------------|-------|-------|----------|-------|
|         | our prev                             | our previous method |       |       |       | Our methods |       |       |          |       |
|         | [2]                                  |                     |       |       |       |             |       |       |          |       |
|         | ()                                   | c = 1)              | k = 1 |       | k = 2 |             | k = 3 |       | Modifica | tion  |
|         |                                      |                     |       |       |       |             |       |       | (k = 3)  |       |
| Circuit | #MUX                                 | #THRU               | #MUX  | #THRU | #MUX  | #THRU       | #MUX  | #THRU | #MUX     | #THRU |
| Tseng   |                                      |                     | 8     | 8     | 10    | 11          | 15    | 8     | 14       | 8     |
| Paulin  | 8                                    | 5                   | 7     | 6     | 8     | 7           | 14    | 7     | 12       | 7     |
| LWF     | 4                                    | 3                   | 2     | 4     | 4     | 4           | 11    | 3     | 7        | 2     |

|         |           | our previous method [2] | Our methods |          |          |                        |  |  |
|---------|-----------|-------------------------|-------------|----------|----------|------------------------|--|--|
|         |           | (k = 1)                 | k = 1       | k = 2    | k = 3    | Modification $(k = 3)$ |  |  |
| Circuit | bit width | HW/OH(%)                | HW/OH(%)    | HW/OH(%) | HW/OH(%) | HW/OH(%)               |  |  |
|         | 8         |                         | 33.47       | 41.25    | 64.07    | 61.19                  |  |  |
| Tseng   | 16        |                         | 22.61       | 27.83    | 42.43    | 40.48                  |  |  |
|         | 32        |                         | 13.68       | 17.01    | 25.74    | 24.54                  |  |  |
|         | 8         | 22.50                   | 19.15       | 26.17    | 46.38    | 41.98                  |  |  |
| Paulin  | 16        | 13.23                   | 12.39       | 15.38    | 26.66    | 24.11                  |  |  |
|         | 32        | 7.27                    | 6.80        | 8.66     | 14.48    | 11.00                  |  |  |
| LWF     | 8         | 35.10                   | 23.66       | 37.55    | 109.13   | 78.92                  |  |  |
|         | 16        | 33.32                   | 22.34       | 35.59    | 100.83   | 72.05                  |  |  |
|         | 32        | 32.47                   | 21.71       | 34.66    | 96.87    | 68.78                  |  |  |

表 4 ハードウェアオーバヘッド Table 4 Hardware overhead.

表 5 テストセッション Table 5 Test session.

|         | our previous method [2] | Our methods |         |         |                        |  |  |  |
|---------|-------------------------|-------------|---------|---------|------------------------|--|--|--|
|         | (k = 1)                 | k = 1       | k = 2   | k = 3   | Modification $(k = 3)$ |  |  |  |
| Circuit | session                 | session     | session | session | session                |  |  |  |
| Tseng   |                         | 21          | 12      | 10      | 10                     |  |  |  |
| Paulin  | 23                      | 22          | 12      | 10      | 10                     |  |  |  |
| LWF     | 12                      | 10          | 6       | 7       | 6                      |  |  |  |

そのハードウェアオーバヘッドを加えたものを示して いる.表4より,提案手法の k = 1 の場合, 井筒ら の手法 [2] と比較してハードウェアオーバヘッドが改 善されていることがわかった.これは,今回追加した カットエッジに基づく処理が効果的に働いたためであ る.表5にテストセッション数を示す.表4及び表5 から,ハードウェアオーバヘッドとテスト実行時間の トレードオフがわかる.提案手法のk = 2の場合,以 前に提案した手法[2]よりもテストセッション数が削 減できており,提案手法はテスト実行時間を改善して いる.しかしながら,テスト MUX のテストによって テストセッション数が増加したため,k = 3における テストセッション数は我々が予期していたよりも(組 合せ回路要素数の約1/3)より悪くなった.4.6 で示 した修正 DFT が今回実験した回路に関しては有効に 働いたことが, 表4, 表5から示される. 故障検出率 については示さないが,テスト対象組合せ回路要素に 対して TPG からの値を伝搬し,その応答を RA へ伝 搬する手法は井筒らの手法 [2] と同じであるため,井 筒らの手法と同じ高い故障検出率が達成される.

6. む す び

本論文では, BIST のための RTL データパスの単一 制御並行可検査性とその DFT について提案した.提 案手法の BIST の利点は高い故障検出率,低いハード ウェアオーバヘッド,短いテスト実行時間,システム クロックでテスト可能である.

提案手法は,test per clock 方式に基づき,テスト 対象組合せ回路要素に対して,連続クロックでテスト パターンの生成,応答の解析が可能であるのでシステ ムクロックでテスト可能であると考えている.ただし, システムクロックは,通常動作時の最大遅延だけから 決定するのではなく,テスト動作時の最大遅延も考慮 して決定するものとする.したがって,テスト動作時 の最大遅延が通常動作時の最大遅延よりも大きい場合, 通常動作時の回路性能を犠牲にしていると考えられる. この点を改良するには,テスト動作時の最大遅延が通 常動作時の最大遅延より大きくならないように DFT 要素を付加することが考えられるが,これは今後の課 題である.

また,提案手法では,MUX と演算モジュールを等 価と扱っている.しかし,MUX のテスト系列長は演 算モジュールのものより短い場合が多く,MUX と演 算モジュールのテストセッションを分けることによっ てテスト実行時間を短くすることができると考えられ る.したがって,MUX と演算モジュールを別のテス トセッションでテストするようなスケジューリングの 考案が必要である.更に,提案手法の有効性を明らか にするため,より大規模な回路への提案手法の適用も 必要である.

提案手法は, RTL 回路のデータパスに対する BIST 手法である.したがって, コントローラも含めた RTL 回路全体の BIST 手法の考案が今後の課題である.

謝辞 本研究に際し,多くの貴重な意見を頂いた本 学の井上美智子助教授,大竹哲史助手,情報論理学講 座の皆様方に深く感謝致します.本研究は一部,日本 学術振興会・科学研究費補助金・基盤研究 B(2)(課題 番号 09480054)の研究助成,及び(株)半導体理工 学研究センター(STARC)との共同研究による.

## 献

文

- M. Abramovici, M.A. Breuer, and A.D. Friedman, Digital System Testing and Testable Design, Computer Science Press, 1990.
- [2] 井筒 稔,和田弘樹,増澤利光,藤原秀雄,"単一制御可検 査性に基づくレジスタ転送レベルデータバスの組込み自己 テスト容易化設計法",信学論 (D-I), vol.J84-D-I, no.1, pp.69-77, Jan. 2001.
- [3] B. Koenemann, J. Mucha, and G. Zwiehoff, "Built-in logic block observation techniques," Proc. 1979 IEEE Test Conf., pp.37–41, 1979.
- [4] A.P. Stoele and H.J. Wunderlich, "Hardware-optimal test register insertion," IEEE Trans. Comput. Aided Des. Intergrated Circuits & Syst., vol.17, no.6, pp.531-539, 1998.
- [5] I. Ghosh, A. Raghunathan, and N.K. Jha, "Design for hierarchical testability of RTL circuits obtained by behavioral synthesis," Proc. 1995 IEEE Int. Conf, on Computer Desing, pp.173–179, 1995.
- [6] I. Ghosh, N.K. Jha, and S. Bhawmik, "A BIST scheme for RTL circuits based on symbolic testability analysis," IEEE Trans. Comput. Aided Des. Intergrated Circuits & Syst., vol.19, no.1, pp.111–128, 2000.

(平成 13 年 7 月 11 日受付, 10 月 18 日再受付)



#### 山口 賢一 (学生員)

平 11 奈良高専専攻科・電子情報工学専攻 了.平 13 奈良先端科学技術大学院大学博 士前期課程了.現在同大博士後期課程に在 学中.現在テスト容易化設計の研究に従事.



#### 和田 弘樹 (正員)

平8阪大・工・通信卒.平10奈良先端 大情報科学博士前期課程了.平13同大博 士後期課程了.現在(株)日立製作所中央 研究所に勤務.現在テスト容易化設計の研 究に従事.博士(工学).



#### 增澤 利光 (正員)

昭 57 阪大・基礎工・情報卒.昭 62 同大 大学院博士後期課程了.同年同大情報処理 教育センター助手.同大基礎工助教授を経 て,平6奈良先端科学技術大学院大学情報 科学研究科助教授.平12 阪大基礎工学研 究科教授,現在に至る.平5コーネル大客

員準教授(文部省在外研究員).分散アルゴリズム,並列アル ゴリズム,テスト容易化設計,テスト容易化高位合成に関する 研究に従事.工博.ACM,IEEE,EATCS,情報処理学会各 会員.



# 藤原 秀雄 (正員:フェロー)

昭44 阪大・工・電子卒.昭49 同大大学 院博士課程了.同大・工・電子助手,明治 大・工・電子通信助教授,情報科学教授を経 て,現在奈良先端大・情報科学教授.昭56 年ウォータールー大客員助教授.昭59 年 マッギル大客員準教授.論理設計論,フォー

ルトトレランス,設計自動化,テスト容易化設計,テスト生成,並列処理,計算複雑度に関する研究に従事.著書「Logic Testing and Design for Testability J(MIT Press)など.大 川出版賞, IEEE Computer Society Outstanding Contribution Award, IEEE Computer Society Meritorious Service Award など受賞.情報処理学会会員, IEEE Computer Society Golden Core Member, IEEE Fellow.