sdi - Page: izanai-76

　システム・エンジニアやプログラマがデータベース　に係わる仕事をしていてコッド正規形を知らないなんてことは有り得ないし、コッド正規形は 1970年代に（集合算を前提にして）「一般手続き」となっているので、今さら本節でコッド正規形を説明する必要もないでしょう（コッド正規形の議論は、今から遡れば 50年近く過去の話です）。コッド論文を基底にしてリレーショナル・データベース（RDB）がマーケットに現れたのが 1970年の終わり頃です、そして 1980年代に RDB は世界中に普及しました──ひょんなことから 1980年代前半に私は世界初の RDB を日本に導入普及する仕事に就いた。RDB は日本に先例がなかったので、私は、RDB を世界で初めてつくった ADR 社（米国）にたびたび出張して、RDB の internals を直接指導してもらいました。RDB を日本に普及する際、当初、世間から強烈な抵抗があった（私が勤めていた会社内ですら、RDB に対してスゲー抵抗があった、当時の「思い出」話を綴ればゆうに一冊の書物をかくことができるでしょう-笑）。そして、その後、RDB は世界中で導入された、今更 RDB とあえて言わなくても、現代ではデータベースといえば RDB でしょう。

　コッド氏は数学者です。コッド氏がつくった関係モデルのことをコッドの Set theory （集合論）と云うこともある。コッド氏は、直接集合を使って、n-項（多項）の関係式でもってモノ（現実的世界の事実）を表しました。n-項関係式は次のとおりです──

　　　　R｛ s₁ ∈ X₁, s₂ ∈ X₂,・・・, s_n ∈ X_n ∧ P (s₁, s₂,・・・, s_n) ｝.

　この直積集合の一般式は「選択公理」を使って説明できます──すなわち、「それぞれの『空でない』集合（set）から、それぞれ一つずつ元（element）を選んできて、それらの元を『並べたら』[ P (s₁, s₁,・・・, s_n) で示されている並び ]、それも集合（tuple、タプル）となる」ということ。N-項関係を一組にした式をタプル（tuple）と云います。タプルに値が充足された状態をテーブル（table）と云います、テーブルのそれぞれの項の縦列を column と云い、テーブルの横列（すなわち、行）のことを row と云います。

　正規形はタプルで記述されますが、テーブルとして値が充足されたとき、ひとつの集合の元（メンバー）は縦列に列挙されているので、集合算は構文論として column をひとつの単位（logical view）とします、複数の column を単位として view を構成することもできる。いっぽうで、モノ（現実的世界の事実）としての「意味」は、R｛ s₁ ∈ X₁, s₂ ∈ X₂,・・・, s_n ∈ X_n ∧ P (s₁, s₂,・・・, s_n) ｝が記述しています。すなわち、コッド正規形では、項の演算（構文論）は縦列でおこなわれ、モノの意味（意味論）は横列（行）で記述される、というのが基本です。しかも、数学では、モノが一意であるかどうかをさておいて、モノを一意にするアルゴリズムがあるというのがモノ（すなわち、無定義語としての項）の扱いかたです。したがって、直積集合の全体が一意であればいいということです。コッド正規形では、R｛ s₁ ∈ X₁, s₂ ∈ X₂,・・・, s_n ∈ X_n ∧ P (s₁, s₂,・・・, s_n) ｝が全体として一意であればいいということ。ここで問題となるのがコッドが導入した primary-key です。

　今さら言うまでもないと思うのですが、念のために言っておけば、テーブルは flat file です。数学では、モノに対してキー（index-key）という「データを効率的に検索するための索引情報」は考えない。コッド氏が導入した primary-key は、構文論的にはタプルの関数従属性を検証するための最小値の項であって、意味論的にはタプルをひとつのモノとみなすための個体指定子としての役割なのです。しかも、構文論が先で意味論は後という論理的意味論のおいては、primary-key の値が一意かどうかは正規形が整って値が充足されてみなければわからない、primary-key の値が一意であるという前提（仮定）に立って正規形を作っているだけです。しかも、コッド氏は、「関係」は「関数」 f (x₁, x₂,・・・, x_n) とみなしているので、x₁, x₂,・・・, x_n は大小関係で並んでいなければならないし、それらの項の起点となる primary-key は最小値でなければならないのですが、実際のデータの値は大小関係では並べられない──たとえば、氏名・年齢・住所などの値は、大小関係で並べられない。だから、コッド氏は、正規形では数学的な「関係（relation）」という語を使っているけれど、厳正に言えば、実際のデータは大小関係で並べられないので、「関係」の代わりに日常語の「関連（relationship）」という語を使ってもかまわない、というふうに論文（チューリング賞受賞のときの記念講演を起稿した論文）のなかで言ったのです。単純に言い切ってしまうなら、（数学の論文を執筆するのでないのなら──言い替えれば、実務的には──）「関係」でも「関連」でもどっちでもかまわない、あえて言うなら、データの「並び」を意識していれば「関係」を使えばいい、ということ。「関係」と「関連」について、ぐだぐだ言っている人たちがいるそうだけれど、学問（学術論文）上の議論であればそれらを厳正に使い分けなければならないけれど、実務的には「関係」「関連」のどちらを使っても宜しい。

　さて、primary-key が、意味論上、個体指定子を表すのであれば、直積集合 R｛ s₁ ∈ X₁, s₂ ∈ X₂,・・・, s_n ∈ X_n ∧ P (s₁, s₂,・・・, s_n) ｝において、その他の項すべて（属性値集合のすべて）を包括する項です──たとえば、従業員｛従業員番号、氏名、年齢、住所、・・・｝において、primary-key の従業員番号は、従業員そのものを表していて、｛氏名、年齢、住所、・・・｝を包括する項です、だから従業員番号を使って他の項｛氏名、年齢、住所、・・・｝に対して構文論上「1-対-1」対応（関数従属性）を問うことができる。言い替えれば、R｛ s₁ ∈ X₁, s₂ ∈ X₂,・・・, s_n ∈ X_n } において、primary-key の s₁ は R そのものを指示しているということです──つまり、primary-key は、クラス f (x) なのです。しかし、データ（値）としては、primary-key は他の項と同じ階に属する。この階のズレが意味論では大きな論点になる。

　モデル TM は、コッド正規形の primary-key の役割に注目しました──モデル TM では、コッド正規形をＴ字の記法で記述します、そしてコッド正規形の primary-key を個体指定子とみなして、Ｔ字の左側に記述して、その他の項は（Ｔ字の）右側に記述します。モデル TM では、Ｔ字の右側に定義される項はコッド正規形に準じていればいいと考えています。モデル TM がモデル作成技術として重視したのはＴ字の左側（個体指定子）です。その個体指定子を項にして、現実的事態の「構造」（項と項との関係）を記述することをモデル TM は目的としています。したがって、意味論的には、モデル TM はコッド正規形に比べて、階が一つ上なのです。しかも、項の「並び」──すなわち、事業活動（プロセス）の先行-後続関係──を明らかにして事業構造を写像するので、個体指定子を event （出来事・取引・行為）とその補集合に区分けして、event を「並べる」という関数を使っています。モデル TM では、「関係」を「関数」とみなしていて、「関連」という語を使わない。モデル TM は、コッド正規形を拡張したモデル作成技術なのです。コッド正規形という手本がなければ、モデル TM は決して生まれていなかった、、、コッド博士に感謝しています。 □

	<< もどる	HOME	すすむ >>
	目次にもどる