sdi - Page: hint-180

　セット・アット・ア・タイム法は（数学の）直積集合を根底にした「データ・アクセスの技術」である。
　E. F. コッド博士が提示した「数理モデル」である。
　それぞれのセット（あるいは、domain）から 1つのメンバーを選んで並べた集合のことを「tuple （集合）」という。この点については、前回（176 ページ）のベーシックス「整列定理と選択公理」のなかで述べた。
　直積集合の一般式は以下の式として記述される。

　R ＝ { s₁, s₂, ..., s_n | s₁ ∈ X₁, s₂ ∈ X₂, ・・・ , s_n ∈ X_n }.

　（s₁, s₂, ・・・ , s_n）が「tuple （集合）」である。
　つまり、relation （関係）のなかから、関数 [ tuple （整列集合）] を生成する。

　さて、従業員番号のセット（集合）と従業員名称のセットを使った直積集合を以下に記述する。

　　R ＝ { 001 ∈ 従業員番号, A ∈ 従業員名称｝.
　　R ＝ { 002 ∈ 従業員番号, B ∈ 従業員名称｝.
　　R ＝ { 003 ∈ 従業員番号, C ∈ 従業員名称｝.

　直積集合では（それぞれのセットから 1つずつメンバーを選んで並べるので）セットは「縦列」として記述されている。
　RDB は、データの定義およびデータの操作に対して、SQL という言語を使う。
　SQL は「I/O 言語」である。4世代言語のような簡易言語ではない。

[ 参考 ]
　データを定義するための言語を DDL （Data Definition Language）という。
　（SQL では、典型的には、「CREATE」文の記述のことをいう。）
　データを操作するための言語を DML （Data Manupulation Language）という。
　（SQL では、典型的には、「SELECT」文の記述のことをいう。）

　直積集合を使って「縦列」にセットが記述されているので、「I/O 言語」である SQL を使ったデータ・アクセスは「縦列（column 単位）」のアクセスとなる。SQL （つまり、RDB）は、一度に 1つのセット（あるいは、view として複数のセット）を走査するので、「セット・アット・ア・タイム（set-at-a-time）法」という。

　ただ、セット・アット・ア・タイム法では、以下の 2点が弱点となっている。
　（1）順序対
　（2） null

　直積集合では、主体は記号化されている、という前提に立っている。たとえば、「従業員」の集合の代わりに、従業員番号の集合、「部門」の集合の代わりに部門コードの集合というふうに考える。属性値集合はアトム的（atomic）でなければならないとされ、属性値として、値のみが対象となる。
　ただ、「関係（ファイル）」-- tuple （レコード）の集まり（テーブル）--は、事業のなかでの「並び」が論点になる。コッド関係モデルでは、テーブルのあいだの関係は「包摂関係」として考えられている（A ⊃ B、あるいは A ⇒ B）。
　たとえば、「従業員」のテーブルと「部門」のテーブルを考えてみれば ] 以下の「並び」には、「意味的な」相違点はない（つまり、同じ意味である）。

　（従業員, 部門）　（部門, 従業員）

　いずれも、「配属」という同じ意味として解釈できる。
　しかし、以下の例では「並び」が相違すれば「意味」も相違する。

　（出荷, 請求）　（請求, 出荷）

　（出荷, 請求）は「出荷してから代金を回収する（後払い）」ことを意味して、（請求, 出荷）は「入金を確認した後、出荷する（前払い）」ことを意味している。1つの「数理モデル」としてデータ構造を提示したセット・アット・ア・タイムでは、（実際の事業過程・管理過程のなかで使われているデータを代入値としたら、）関係（テーブル）の「順序対」が論点になる。

　さて、もう 1つの弱点である「null」は、以下のような例を提示できる。

　R ＝ { 004 ∈ 従業員番号, null ∈ 退職日｝.

　従業員（従業員番号、004）は退職していないので、退職日は null になるが、null は、退職日の集合のメンバーではない──なぜなら、退職日の集合は空集合ではないから。
　コッド関係モデルでは、null は、「値が成立しない」という意味で使われるが、現実の指示関係から判断すれば、null は、unknown と undefined の 2つの意味が成立して、「多義」になる。そのために、コッド関係モデルでは、（null に対応するために） 4値ロジックを使う。4値ロジックを使えば、null を、意味論上、対応できるが、はたして、4値ロジックが実地の演算として使いやすいかどうかは、争点になる。

　以上のようにして、「数理モデル」のセット・アット・ア・タイム法を実地に使おうとするのなら、関係の「順序対」と属性値の「null」に対して、対応策を用意しなければならない。Ｔ字形 ER手法では、「順序対」に対する配慮として「resource と event」という概念を導入して、「null」に対しては、2値ロジックを前提にして、「相違のサブセット」という概念を用意した。

[ 参考 ]
　多価関数は数学では一般に考えない。x ∈ X₁ について、X₂ のメンバー y₁, y₂, ・・・, y_n を対応するのなら、f： X₁ → P (X₂) として、X₁ から P (X₂) への一価関数を考える。つまり、部門コードは従属関数である。以上の考えかたをセットとして記述すれば、{ 従業員番号、従業員名称、・・・, 部門コード (R)、...} となる。
　Ｔ字形 ER手法が、従属関数を「個体と関係は同一レベルにある」と考えて「対照表」を使って記述する理由は、Ｔ字形 ER手法は（述語論理の公理系ではなくて）命題論理を使った体系になっているからである。
　述語論理の公理系も命題論理の公理系も、いずれも、無矛盾性と完全性を証明されているので、いずれを使っても良い。
　ただ、少なくとも、直積集合を使うなら、「順序対」と「null」は、なんらかの対応をしなければならない。

●　QUESTION	テーフ゛ルのなかのカラム（フィールト゛）が null 値であってはいけないのは、どうしてか。
▼　ANSWER	RDB の理論（セット・アット・ア・タイム法）が成立しなくなるから。