sdi - Page: redbook-55

2009年12月 1日	「実践編-13　セット・アット・ア・タイム法」を読む	>> 目次にもどる
2018年 9月15日補遺

　

　コッド関係モデルは、セット概念と第一階述語論理を前提にして構成されています。そして、そのモデルは、「relational completeness （完備性）」を証明されています。

　コッド関係モデルでは、データ正規形を構成する技術として数学的な関係（関数）が使われています。その一般形は、「直積集合」を使った以下の式です。

　　　　R { s₁ ∈ X₁, s₂ ∈ X₂, ・・・, s_n ∈ X_n ∧ P (s₁, s₂, ・・・, s₁) }.

　すなわち、X₁, X₂, ・・・, X_n のそれぞれの集合（セット）の直積を構成して、それぞれの集合（セット）から選ばれたメンバーの組のなかで、「真」である組を「存在」（ソリューション）としています。ちなみに、それぞれの集合（セット）から選ばれたメンバーを P (s₁, s₂, ・・・, s_n) において並べている点（全順序になっている点）にも注意していてください。

　なお、直積集合は、「選択公理」の観点からも説明できます。すなわち、（空でない）集合──ここでは、X₁, X₂, ・・・, X_n のこと──から、それぞれ、ひとつずつメンバーを選んできて並べたら──ここでは、P (s₁, s₂, ・・・, s_n) のこと──集合になる、ということ。それぞれの集合（セット）からメンバーを選んできて並べて作った集合のことをタプル（tuple）と云います。単純に言えば、タプルとは、「組」のことです。

　数学では、「関係」をふつう 2項で構成します──すなわち、R (a, b) [ 関数としては、f (x, y) ] というふうに。コッド関係モデルでは、「関係」を多項（n-項）で構成している点が特徴です。ちなみに、n-項関係は、推移律を使えば、2項関係として構成することもできます。

　さて、コッド関係モデルは、直積集合を使った n-項関係で（現実的事態に対応する）「個体」を構成している点が特徴です。すなわち、それぞれの集合（セット）として、アトリビュートの集合を構成して、それらの集合のなかからメンバーを選んでタプルを構成して、そのタプルが現実的事態と対比して「真」である組を「実存（ソリューション）」としている、という点が特徴です。たとえば、以下の構成を考えてみます。

　　{ 001 ∈ 番号、A ∈ 名称、56 ∈ 年齢 }.
　　{ 002 ∈ 番号、B ∈ 名称、25 ∈ 年齢 }.
　　{ 003 ∈ 番号、C ∈ 名称、46 ∈ 年齢 }.
　　　　　　　　　　　：
　　　　　　　　　　　：

　この構成では、それぞれのアトリビュートのメンバーは、縦列に列挙されている、という点が特徴です。すなわち、集合（セット）は、縦列で示されているということ。そのために、この構成上、縦列にアクセスするやりかたを「セット・アット・ア・タイム法」と云っています。いっぽうで、それらのアトリビュートで構成される「個体」はタプル（横列）として構成されています。言い換えれば、構文論上、メンバーは縦列に列挙され、意味論上、「個体」は横列で構成されている、ということ。すなわち、事実的な「F-真」は、横列で構成されている、という点が特徴です。

　こういう構成に対して、複合選択条件（OR とか AND を使った複合選択条件）を適用すれば、「同一タプル上のアトリビュートである」ことを検証しなければならない──その点を、本編（「実践編-13」）で説明しています。「同一タプル上のアトリビュートである」ことを検証するためには、traversal table を用意しなければならない。

　そして、こういう構成では、メンバーを縦列に列挙しているので、単一選択条件を適用すれば、縦列のメンバーを順次数え上げなければならない──いわゆる「table-scan」ということ。もし、すべてのメンバーを枚挙しないで並べるのであれば──言い換えれば、order-by を使うのであれば──、メンバーを並べるための作業域（traversal table）を用意しなければならない。

　「セット・アット・ア・タイム法」では、traversal table は「宿命のファイル」です。すなわち、単一選択条件において order-by を適用すれば traversal table を作るし──もし、order-by を使わないのであれば、すべてのメンバーを数え上げるしかないし──、複合選択条件において、「同一タプル上の検証」をするために traversal table を作るということ。したがって、traversal table を作れば、資源を費消してパフォーマンスが悪くなるのは当然の帰結でしょう。

　RDB で高パフォーマンスを実現するのであれば、table-scan （枚挙）をしないで、かつ、traversal table を作らないようにするのがコツです。その点を次回以降で説明します。 □

　

[ 補遺 ] （2018年 9月15日）

　コッド関係モデルの最大の特徴点は、「構文論（演算）は縦列 colomn、意味論（ [ 個体としての ] 真とされる値の充足）は行 row」という点です。このやりかたをセット・アット・ア・タイム法と云います。この特徴点は、従来とは全然違う──従来のやりかたは、構文論も意味論も一つの行 record で扱われていました──このやりかたをレコード・アット・ア・タイム法と云います。

　SQL は関数引き言語ですが、遺憾なことに、SQL の国際基準が indexing、if および配列を認めてしまった（1990年代）。そのために、SQL を使って構造的プログラミングをおこなうということが当たり前のようになってしまって、RDB の長所が活かされないままに RDB を使うことが蔓延しています。どうしてこのような事態になったのかをつらつら思うに、我々の思考法は、構文論と意味論がべつべつに扱われることに慣れていないという結論に帰結するのでないか。

	<< もどる	HOME	すすむ >>
	目次にもどる