sdi - Page: news236

2003年 8月 1日

パイプライン機能

　
● パイプライン機能は更新（UPDATE）のパフォーマンスを高める技術である。

　論理 I/O （プログラムが出す I/O）を削減するために、パイプライン機能（pipeline）を搭載している RDB もある。
　パイプライン機能とは、多数の論理 I/O をメモリー・バッファのなかにホールドしておき、1 回の物理 I/O （EXCP）に変換する機能である。したがって、更新（UPDATE）用の技巧であって、読み込み（READ）には適用されない。

　パイプライン機能は「非同期更新」の一種であるが、トランザクション単位に更新するパフォーマンスに比べても、ほとんど、タイムラグを置かない更新であり、複数の更新トランザクションを 1 回の物理 I/O で済ますのだから、パフォーマンスは良い。通常、100 回の論理 I/O を 1 回の物理 I/O に変換するが、100 という数値は変更することができる。

　
● パイプライン機能の数値を大きくすればするほど、パフォーマンスが良くなる訳ではない。

　100 という数値を高くすればするほど、メモリーのなかでホールドするタイムラグが大きくなるし、ログ・ファイルに対する書き込み（ログ・ファイルの大きさ）も考慮しなければならないので、数値を大きくすればするほどパフォーマンスが良くなるという訳ではない。
　パイプラインのパラメータの最適値はどのくらいなのかを述べることは、システムの環境（CPU のつよさ、メモリーの大きさ、ディスクの数など）にもよるので一概に述べることはできないが、300 から 500 が無難な上限値である、と思う。

　当然ながら、メモリーのなかにホールドする数値に達する以前に、ジョブが終了したり、ログ・ファイルのスピル（spill）が実行されたなら、ホールドの数値に達していなくても、パイプライン機能は完結して、ログ・ファイル、データ・ファイルおよびインデックス・ファイルに対して、順次、書き込みがおこなわれる（ちなみに、書き込みの順序に注意されたい）。

　メモリーのなかにホールドするトランザクションの数が増えれば増えるほど、停電（あるいは、瞬停、電圧の変動など）に対する危険性が高くなるので、無停電装置を導入していないのであれば、パイプライン機能をむやみに使うのは危険である。

　
● 「ADD-only」に対してパイプライン機能を使えば、高パフォーマンスを実現できる。

　パイプライン機能を搭載した RDB を使うときに考慮したい点は、「更新（UPDATE）のパフォーマンスを高めるパラメータは用意されているが、読み込み（READ）のパフォーマンスを高めるパラメータはない」という点である。
　しかも、更新のなかで、ADD が論理 I/O 回数が少ない、という点である。

　したがって、RDB の高パフォーマンスを実現するためには、更新（UPDATE）では「ADD-only」を使い、読み込み（READ）では「INDEX-only」を使う、というのが当然の配慮である。

	<< もどる	ベーシックス	すすむ >>
	データベースの基礎知識