2002年10月16日 モデル と意味論 >> 目次 (作成日順)
  ● QUESTION   データ 設計法 (法則) と データ 解析法 (事実の記述) は、どうちがうのか。
  ▼ ANSWER   データ 解析では、「意味論 (semantic)」 が対象となる。
2007年11月 1日 補遺  



 T字形 ER手法では、モノ の類として 「resource と event」 を導入して、それらを類別する判断規準として 「DATE」 を導入している。ただし、(純粋な記号操作を前提にしている) 「正規化 (normalization)」 概念では、(「resource」 とか 「event」 とかいう) 「意味論」 を モデル のなかに導入してはいけない (!)

 小生 (佐藤正美) が、ウィトゲンシュタイン 氏の 「真理関数 (主選言標準形)」 を使ってT字形 ER手法の 「原型」 を考えたときに、最大に苦しんだ点が、「モデル (真理関数)」 のなかに 「意味論」 を導入してしまった、という点です。さらに、小生が悩んだ点は、「event」 の定義として、「DATE」 を導入した、という点です。純粋な記号操作のなかでは、モデル の構造のなかに、「時間軸」 を混入してはいけない。「DATE」 は、あくまで、パラメータ の1つであって、構造を構成する判断基準であってはいけない。

 小生はT字形 ER手法を (「真理関数」 を使った) データ 設計法として使っていたけれど、データ 設計法としては、前述した危険性 (「意味論」 の混入) を犯していることを、重々、承知していました。つまり、純粋な モデル 理論として判断すれば、T字形 ER手法は、「論理学」 の ルール を破っている、ということです。

 ただ、直積集合を使った純粋な データ・モデル (セット・アット・ア・タイム 法) が、変数として実 データ を対象にしたとき、完全な 「順序対」 の導入ができなかったことや、null に対して 4値 ロジック を使った ややこしい演算体系になったことを鑑みれば、(法則的な モデル ではないにしても、なんらかの) 構造を構成するためには--しかも、ビジネス のなかで扱われている データ を対象とすれば--「順序対」 を保証する規準として、「並べられる」 データ と 「並べられない (並びが論点にはならない)」 データ を類別することは中核の論点になる。ビジネス (経営過程--少なくとも、正常営業循環 [ 購買過程-生産過程-販売過程] ) のなかでは、時系列が成立する。

 とすれば、ビジネス のなかで使われている実 データ を対象として、時系列 (時間軸) を導入するのであれば、T字形 ER手法を データ 設計法 (モデル 構成法--法則) として使うのではなくて、それぞれの事象の 「事実を記述する」 ための技術として使うというふうにしなければならない。

 とすれば、現実の世界 (実 データ) を対象とすれば、「resource」 と 「event」 という概念も 「DATE」 という概念も、対象を解析する概念として使うことができ、T字形 ER手法を 「データ 解析」 技術として使うことができる(!) つまり、T字形 ER手法は、(設計段階のなかで使われる) 「データ 構造を設計する法則」 (モデル 構成法) から離陸 (take-off) して、(経営と IT の接点である) 「事実を記述する」 ための 「データ 解析法」 へと飛翔できる。

 拙著 「論理 データベース 論考」 は、(ビジネス のなかで使われている データ を対象として) 「関係 R」 として関数を使うかどうか、という点を検証した書物です。小生が、「論理 データベース 論考」 を執筆していたとき、最大の難関だったのが、T字形 ER手法のなかに、「意味論」 を混入してしまったことだった--ちなみに、「意味論」 の混入は、T字形 ER手法を、当初、実地に使いながら、効率的・効果的に使えるように整えてきた (理論的な検証が後回しになってしまった) という点にあった。
 「論理 データベース 論考」 は、aRb を 「関数として扱わない」 という宣言をした--T字形 ER手法を 「事実を記述する」 ための技術として使う第一歩となった--書物です。小生がT字形 ER手法を 「データ 解析法」 法である、と言い出した時点は、「論理 データベース 論考」 を脱稿してからだった (笑)。

 「順序対」 という論点に対して、「DATE」 という意味論を導入したので--そして、いっぽうでは、主選言標準形を 「正規化」 法として使ったので--、T字形 ER手法は、実地に使えるように単純な ルール の体系として集成することができたのですが、初見では、「こんなのが技術なの ?」 と疑われてしまう傾向があるようです(笑)。「データ 構造を導出するための法則」 という意味では、T字形 ER手法は データ 設計法ではない。ただし、「事実を記述する」 技術という意味では、T字形 ER手法は、その目的を達成していることは、拙著「論理 データベース 論考」 のなかで証明しました。そして、解析した事実 (「データ 解析」) を、そのまま [ 若干の調整はしなければならないけれど ]、実装したのが 「データ 設計」 です。

 それぞれの ビジネス には、それぞれ、固有の (one and only) データ 構造が存在するのであって--しかも、それは、つねに、変転するのあって--、すべての事象に適合する モデル はない。ただし、或る構造のなかで扱われている任意の項目が、すべて、前提 (公理、仮定) から証明できる、という証明可能性の意味では、[ データ 構造を記述する ] モデル は存在しなければならない。

 「事実の記述」 というのは、(「データ 設計」 から観れば) どういうことなのかといえば、「データ 設計は、工学技術であって、一人の システム・エンジニア の価値観のために崩れるような モノ ではない。『わたしには、或る データ が見えて、あなたには、それが見えない』 というような、いきなり、だれも知らないような ファイル が飛び出るような不意打ちは、工学技術にはない。作図された データ 構造は、かならず、前提 (公理、仮定) から、すべて、証明されなければならない。それが 『完全性』 ということです。」

 



[ 補遺 ] (2007年11月 1日)

 TM (T字形 ER手法) は、コッド 関係 モデル に対して、「意味論を強く適用して」 作られた モデル です--ただし、数学的に言えば、コッド 関係 モデル が属性値集合を セット としたのに対して、TM は、階を一つ上にして、主体集合を entity として認知の起点にしています。「意味論を強く適用した」 という意味は、本来、変数である項 (term) に対して、以下の 2つの概念を導入したということです。

  (1) event (関係型の項)
  (2) resource (主体型の項)

 これらの概念 (型) を導入した理由は、「関係の対称性・非対称性」 を重視したからです。すなわち、「並び」 が争点になる データ の型と 「並び」 が争点にならない データ の型がある、ということです。項 (entity) を、そういうふうに分類にしたので、entity のあいだの関係を記述するために関数を使うことができなくなったのです。そのために、TM は、関係文法として、数学的な ソリューション ではなくて、哲学的な ソリューション を導入しました。その哲学的 ソリューション というのは、以下の文法を基本形にするということです。

  「resource」 が 「event」 に関与する (侵入する [ ingression ])。

 TM は、当初、ウィトゲンシュタイン 氏が示した 「真理値表」 --事態の成立・不成立を判断する リスト--を基本形に考えていたので、上述した関係文法を導入しやすかった。ちなみに、この関係文法は、ホワイトヘッド 氏の哲学を借用しています。

 コッド 関係 モデル --セット 概念と第一階述語論理を使った モデル--は、数学的に、「完全性 (Relational Completeness)」 を証明されています。TM は、コッド 関係 モデル (数理 モデル) ほどの数学的な厳正さはないですが--というのは、哲学的 ソリューション を導入したので--、以下の 2つの規則を導入しているので、TM を使って構成された 「構造」 は、かならず、「前提」 から すべて 証明できる 「構造」 になっています。

 (1) 指示規則 (語彙 [ 論理定項および観察述語 ])
 (2) 生成規則 (文を生成する規則 [ 構成する規則 ])

 ここで、「観察述語」 というのは、「(事業過程のなかで伝達されている 「情報 (伝票など)」 のなかに記述されている語彙のことです。そして、管理過程のなかで定義されている コード 体系を使って、「合意された」 管理対象 (entity) を、まず、定立します (「真とされる集合」 を作る)。次に、entity に対して、生成規則を適用して、「構造」 を作ります (構文論で構成する)。最後に、「構造」 として構成された 「物」 に対して、指示規則を適用して、現実的事態と対比します (意味論で構成を推敲する)。

 ちなみに、(1) で実現される 「真」 が 「(事実的な) F-真」 で、(2) で実現される 「真」 が 「(導出的な) L-真」 です。TM は、これらの 「真」 を崩さないように、指示規則・生成規則を導入しています。したがって、TM は、「ゆるやかな完全性」 を実現しています--「ゆるやかな」 という意味は、数学的厳正さはないけれど、TM は、指示規則と生成規則に従って構成する 「証明可能性」 を実現している、ということです。




  << もどる HOME すすむ >>
  データ解析に関するFAQ