sdi - Page: news200

2003年 3月16日

indexing （VSAM 式対 inverted 式）

>> 目次（テーマごと）

　
　インデックスの「leaf」構造として以下の 2つのやりかたがあることを、前回、述べた。

　（1） 1つのキーの値に対して 1つのデータ・アドレスを対応する。（I-SAM 式あるいは VSAM 式）
　（2） 1つのキーの値に対して複数のデータ・アドレスを対応する。（inverted 式）

　いずれのやりかたであれ、「ダイナミック・アロケーション」を前提にしているので、アドレスは「相対アドレス」（開始点から＋α）を使っている。

　以下の 3つのテーブルを使って、2つのやりかたの違いを例示する。

　（1）顧客テーブル
　（2）受注テーブル
　（3）請求テーブル

[ 前提 ]

「顧客」テーブル
顧客番号	従業員名称	データ・アドレス
01	佐藤正美	111
02	稲森いずみ	112
03	佐藤恵美子	113

「受注」テーブル
受注番号	顧客番号	データ・アドレス
001	01	211
002	01	211
003	03	213

「請求」テーブル
請求番号	顧客番号	データ・アドレス
0001	01	311
0002	01	312
0003	03	313

　さて、それぞれのテーブルに対して、「顧客番号」を使って（マスター・キーでもネイティブ・キーでもない）一般キーを定義してインデックスを生成したとする（duplicate-master-key ＝ yes, change-master-key ＝ yes）。

　
1. ISAM 式・VSAM 式

　ISAM 式および VSAM 式は、それぞれのテーブルに対して、それぞれのインデックス・ファイルを生成する。
　つまり、1つの物理データセットに対して 1つのインデックス・ファイルを生成するやりかたである。
　したがって、インデックス・ファイルは、前述の例では 3つになって、以下のような中味となる。

「顧客」のインデックス・ファイル
顧客番号	データ・アドレス
01	111
02	112
03	113

「受注」のインデックス・ファイル
顧客番号	データ・アドレス
01	211
01	212
03	213

「請求」のインデックス・ファイル
顧客番号	データ・アドレス
01	311
01	312
03	313

　さて、以上の構造であれば、顧客を単位として、顧客情報ならびに受注情報および請求情報を一覧表示するとなれば、それぞれのインデックス・ファイルに対してアクセスしなければならない。
　したがって、正規化すればするほど、I/O が多くなってしまうという弊害がある。

　ただ、DB2 も ORACLE も、この構造なので、正規化されたデータ構造を実装するためには、「しかるべき」対応をしなければならない。「しかるべき」対応というのは「非正規化する」などという暴言を吐いているのではなくて、「正当な I/O 削減手段」を使うことを言っている。この点に関しては、後日、記述する。

　
2. inverted 式

　inverted 式は、複数の物理データセットに対して 1つのインデックス・ファイルを生成するやりかたである。
　上述の例で言えば、「顧客」と「受注」と「請求」の 3つのテーブルに対して、1つのインデックス・ファイルが生成される。つまり、以下のように、1つのキーの値に対して、複数のデータ・アドレスを対応する。

inverted 式
顧客番号	データ・アドレス
01	111	211	212	311	312

　つまり、インデックスを使って、テーブルを join しているのと同じ効果がある。
　正規化されて数の多くなったテーブルに対して、インデックスが 1回の I/O を使って join している（統合している）のと同じである。

　ただし、キーに対して削除・追加が多ければ、こういう構造は「揺れる」ことになるので、パフォーマンスが低下する。キーの削除・追加が多いなら、「物理的な I/O を削減するために」パイプライン機能を搭載していなければならない。そうでなければ、こういう構造を使ってはいけない。
　なお、パイプライン機能については、後日、述べる。

　
3. まとめ

（1） VSAM 式
　1つのテーブル（物理データセット）に対して 1つのインデックス・ファイルを生成して、「leaf」の構造は、1つのキーの値に対して 1つのデータ・アドレスを対応するやりかたなので、データの正規形を実装するためには、「I/O を削減する」手段を考慮しなければならない。

（2） inverted 式
　複数のテーブルに対して 1つのインデックス・ファイルを生成して、「leaf」の構造は、1つのキー値に対して複数のデータ・アドレスを対応するので、インデックスを使ってテーブルを join しているのと同じ効果があるが、キーの削除・追加に対しては、「I/O を削減するために」パイプライン機能を搭載したデータベースを使ったほうがよい。

	<< もどる	ベーシックス	すすむ >>
	データベースの基礎知識