2003年 9月16日 作成 「理論編第6章 (集合論)」 を読む >> 目次に もどる
2006年 6月16日 更新  




 「構造」は、モノと関係を使って記述される。「構造」を扱うには、「集合」概念が役立つ。
 なぜなら、「集合」概念は、以下の2つを基本概念としているから。

  (1) 集める
  (2) 並べる

 
 第 6章では、以下の諸点をまとめている。

  (1) 「集める」 (同値関係、帰属関係、包含関係)
  (2) 「公理的集合論」 (ZFの公理系、BGの公理系、選択公理)
  (3) 「集合と排中律」 (無限と有限、内的特徴と外的特徴)

 集合論は「無限」を対象とするが、小生の狙いは、「(有限な)構造」を記述する点にあるので、「無限」は、拙著のなかで、ほとんど扱わなかった (「可付番」と「対角線法」を簡単にまとめてある)。ただし、「有限」は、「無限」を前提にしたほうが、記述しやすい。

 「無限」を前提にして、「排中律」を無制限に適用することは疑問点とされている。「集合と排中律」をまとめてみた。というのは、T字形ER手法は、モノを認知する際に、「排中律」を使っているから(「event」と、それ以外)。

 集合論は、「概念の抽象化」に役立つ手法であるが、或る集合の事物に関して、その事物のみに帰属する本質的な性質 (内的特徴)と非本質的な性質 (外的特徴) を判断することができない。任意の性質を使って外延を形成する手法であって、しかじかの性質が、かくかくの事物に帰属するかどうか、という点は解析の対象にはならない。逆に言えば、この点が、集合を前提にして、「意味論」を、どう扱えばよいのか、という悩ましい論点が起こるのである。
 意味論を前提にした(P. チェン氏の)ER手法と、直積集合を前提にした(E.F. コッド氏の)正規形が、烈しく対立した原因も、その点にある (多くの人たちは、直積集合を前提にしたコッド正規形を、チェンER手法を使って記述する、という間違いを犯しているが、、、)。

 第 6章では、集合概念として、(無限集合を、前述したように、対象としないで)以下をまとめている。
  (1) ベキ集合
  (2) 直積集合
  (3) 写像集合

 E.F. コッド氏は、直積集合を使って、データの正規形を提示した。
 ちなみに、概念設計では、(P. チェン氏の提示した) ER手法が題材になるが、日本人が提示した (椿氏・穂高氏の提示なさった) 概念設計手法の1つの公理系がTH法である。T字形ER手法は、ER手法という呼称を付与してあるので、チェン氏流のER手法と同類のように誤解されやすいが、T字形ER手法は、コッド正規形を改善するために作られた手法である。コッド正規形の弱点は、以下の2点にある。
  (1) 並び
  (2) null値

 コッド氏が提示したデータ正規形は、「モデル」として、無矛盾性と完全性を実現している。
 数学では、「集合(モノ)」は、究極的に、アルファベットを使って並べることができるが、事業のなかで使われているデータを対象にした際、「並び」が論点になるデータ (「event」)と、そうではないデータ (「resource」)があるので--排中律を使っている点に注意されたい--、すべてのデータを一律に並べることができるという前提を使うことは oversimplication に陥る。事業のなかで使われているデータを対象にしたとき、「並び」を検証するためには、どうしても、「意味論」(DATE が性質として帰属するモノを「event」として定義すること)を導入せざるを得ないのである。

 第 6章は、「排中律」と「並び」を論点にして、集合論を検討している。
 ちなみに、T字形ER手法は、「並び」を実現するために「関数」を使わない、という前提に立つことになったので、「構造」を構成するために、(「関数」以外の)推論ルールを使うことになった。
 第 6章のなかで集合論を検討した後で、第 7章として、推論ルールを検討することにした。次回は、第 7章(推論ルール)について述べる。 □

 



[ 補遺 ] (2006年 6月16日)

 この エッセー のなかで、コッド 関係 モデル に対して 2つの批判を示しているが--「並び」 と 「null」--、この批判そのものは、読者に誤解を与える危険性が高い--コッド 関係 モデル を不当に (的外れに) 非難することになってしまう。そして、その非難は、私の本意ではない。

 コッド 関係 モデルは、以下の 2点を前提にしている。

 (1) 1つの テーブル のなかでは、関係 モデル を使う。 R{s1 ∈ X1, s2 ∈ X1,...sn ∈ Xn ∧ P (s1, s2,...sn)}.
 (2) 2つの テーブル のあいだでは、包摂関係 (A ⊃ B) を使う。

 まず、「並び」 に関して言えば、1つの テーブル のなかでは、「すべての属性値集合を並べる」 という前提を コッド 関係 モデル は強く適用している訳ではない。また、2つの テーブル のあいだでは、包摂関係が考えられている。  そして、「null」 に関しては、P (s1, s2,...sn) を使って メンバー の存在性を示している。したがって、メンバー が存在しないのであれば--「null」 になるのであれば--、「true」 「false」 および 「null (unknown と undefined)」 を扱うように、コッド 関係 モデル は 4値論理を使っている。

 TM (T字形 ER手法) が コッド 関係 モデル に対して非難している点は、あくまで、「2値論理」 のなかで データ 構成を考えることを前提にしているのであって--したがって、コッド 関係 モデル を実地の データベース 設計のなかで適用することを前提にしているのであって--コッド 関係 モデル そのものを非難している訳ではない点に注意されたい。言いかたを変えれば、TM は、コッド 関係 モデル を 「意味論」 の観点に立って、その (コッド 関係 モデル の) 適用を工夫している。

 「2値論理」 を前提にするのであれば、意味論上、「null」 を除去しなければならない。また、「データ 構成を観れば、意味を理解できる」 が、現実では、その逆であって、「意味がわからなければ、『構成』 を作ることができない」。そのために、コッド 関係 モデルの包摂関係を、データ 構成の 「並び」 の観点から見直さなければならなかった。たとえば、(出荷、請求) という並びと (請求、出荷) という並びの意味構成を考えてみてほしい--ちなみに、TM は 「2項関係」 を前提にしている (コッド 関係 モデル は 「n項関係」 を前提にしている)。

 個体をあつめただけでは 「構成」 にならない。「構成」 を作るには、個体 (あるいは、集合) を並べなければならない。個体 (あるいは、集合) を並べるために、どのような規則を使うかという点が モデル の特徴になる。TM では、事業過程を対象にするなら、「取引が起こった日 (時系列)」 を 「並べる」 規則にしている。
 そして、TM は、関係主義的な 「内包-外延 の論理」 を使わないで、実体主義的な 「個体の認知」 を起点にしている。そして、TM では、関係を関数として考えないで、「resource が event に関与 (ingression) する」 という関係を 「構成」 の基本形にしている。ちなみに、この関係思想は、ホワイトヘッド 氏の哲学を参考にしている。

 





  << もどる HOME すすむ >>
  「論理データベース論考」を読む