sdi - Page: 213

[ 補遺 ] （2008年 5月16日）

　2 値論理を前提にすれば、ヌル（null）は、そもそも、「値」ではないのだから、ヌルを対象にして「等号（＝）」を使うことはできないでしょうね。ヌルのことを「null-value」というふうに言うこともあるので、慣例として「ヌル値」という言いかたをしますが──小生も、「ヌル値」と言うこともありますが──、ヌルは、構文論上、「値なし」のことです。あるいは、意味論上、「多義（undefined および unknown）」です。「undefined」は、「定義されていない」ということで、数学的には、「部分関数」の外（そと）にある、ということで、「unknown」は、「部分関数」の範囲内にあるかもしれない値だが、「未知数」という意味です。すなわち、ヌルは、「付値されない（無意味）」　か「値があるのだが、付値できない（有意味）」といういずれかの意味です。

　コッド関係モデルは、セット概念と第一階述語論理を前提にして、「直積集合」を使って、「テーブル」を作成しますが、「直積集合」を選択公理（あるいは、整列集合）の観点からみれば、それぞれの「空でない」集合（セット）を前提にしています。したがって、テーブル構造では、column として、メンバーを列挙する際に、「いくつかの（∃x）」のメンバーがヌルであることは整列集合に違反します。もし、ヌルを認めるのであれば、コッド氏が提示したように、4 値論理 { true, false, applicable, unapplicable } を使わなければならないでしょう。
　しかしながら、現実には、SQL で 4 値論理を使ってプログラムを作成しているとは想像しがたい。

　もし、3 値論理｛真、偽、ヌル｝を使って、SQL プログラムを作成しているのであれば、ヌルに対して、「not」や「if」を使うことが妥当でないことは明らかでしょう。というのは、ヌルの論理的否定は、ヌルになるから [ 「赤本」 81 ページ参照 ]。したがって、「not exit」とか「not in」を使えば、「想定外の（unexpected）]　の結果が出てきます。ちなみに、ロジックでは、「not」のことを「￢」として記述し、「if」のことを「→」で記述します。ヌルに対して「if」（p → q）を使えば、仮言 [ p → q ] （p ならば q）は、ブール代数では、「￢p ∨ q」（p でないか、または、q）となるので、p がヌルであれば、￢p もヌルになってしまいます。

　「真」概念には、「（導出的な） L-真」と「（事実的な） F-真」があります。「L-真」は、構文論上の概念で、「真とされる」集合を前提にして、文法に従って導かれる構成で、俗に言えば、「不意打ち・飛躍がない」ということです。「F-真」は、意味論上の概念で、語彙および文が、現実的事態に対応しているということです──この「F-真」が「真理条件」と云われている概念です。モデルでは、語彙は、ロジックで使う語彙（OR、AND、NOT、IF やクラス概念など）と「観察述語」から構成されます。「観察述語」というのは、「観察可能な特徴」を記述した語であって、「観察可能な特徴」とは、物理的対象の性質・関係が、適当な条件の下で、与えられた事態の中に現れるか現れないか、という点を直接の観察によって確かめられることを云います。つまり、「観察述語」とは「観察可能な特徴」を指示する語彙です。

　「経験論的な言語 L」というのは、ロジックの語彙・公理を前提にして、事実的対象の観察可能な特徴を記述した言語（モデル）です。TM （Ｔ字形 ER手法の改良版）は、「経験論的な言語 L」の規約を守っています──ただし、文法に関しては、ロジックの公理系を使わないで、（関係の対称性・非対称性を考慮した）独自の文法を使っていますが。

　TM は、2 値論理（｛真、偽｝のふたつの値）を前提にしたモデルです。したがって、ヌルを認めていない。
　ひとつの個体（entity）のなかでヌルが生じるのであれば──つねに付値されるか、つねにヌルのときには──、構文論上、まず、サブセットにするのが基本ですが、たとえば、データ入力では、かならず入力しなければならない（mandatory）項と、入力が任意である（optional）項がありますが、「任意な入力」には──付値されることもあれば、ヌルになることもあるときには──、「みなし概念」を使います。TMD （TM Diagram）上、任意の項は、「みなし概念」を使って、「個体（entity）」から外します。「みなし概念」は、そもそも、意味論上、「個体」に対して適用される概念ですが、構文論上、ヌルがでる項に対しても使っています。したがって、「個体」のなかに、つねに現れる性質と、そうでない性質を切り離しています。それが「観察述語（あるいは、観察可能な特徴）」という意味です。

　なお、「みなし概念」で外だしされた「任意の入力項」は、使用するデータベースの性能を考慮して──たとえば、optimizer が「INDEX-only」を外してしまうとか、join の対象になるテーブル数に制限があるとか──、派生元の「個体」のなかに返して実装することもあります [ それは、データベースが粗悪なのであって、モデルのせいではないので、念のため（笑）]。　

2003年 5月 1日	「相違のサブセット」の実装形（その 1）	>> 目次（作成日順）
●　QUESTION	ヌル（null）を回避して「相違のサブセット」を実装するにはどうすればよいか。
▼　ANSWER	サブセットを、それぞれ、実装して、上位のセット（認知番号のみ）も実装すればよい。
2008年 5月16日補遺

	<< もどる	HOME	すすむ >>
	データ解析に関するＦＡＱ