sdi - Page: redbook-34

2009年 1月16日	「技術編-20　セットとサブセット」を読む	>> 目次にもどる
2017年11月 1日補遺

　

　「セットとサブセット」を TM のなかに導入した理由は、セット（集合）が「正しい集合」になっているかどうかを検証するためでした──「セットとサブセット」は、（TM として改良される前の）Ｔ字形 ER手法にも導入されていました。

　「セットとサブセット」を考える際に、それらの「妥当な」構成として、数学の「分割・細分」概念を使いました──「切断」概念を使ったと言ってもいいでしょう。すなわち、ひとつのセットは、「まじわりのない（共通集合のない）」複数・多数のサブセットに切断されるということです。言い換えれば、サブセットのあいだには、排他的 OR 関係が成立するということです。

　事業過程・管理過程のなかで認知された「個体（entity）」に対して「区分コード」を使って、「個体」をさらに詳細に管理している場合が多い──たとえば、営業所コードを付与された「営業所」の集合に対して、営業所区分コードを導入して、営業所のなかみをさらに詳細に [ 国内営業所なのか海外営業所なのかというふうに ] 管理しているとか、従業員番号を付与された「従業員」の集合に対して、従業員区分コードを導入して、従業員のなかみをさらに詳細に [ 正社員なのかパートなのかというふうに ] 管理しているなど。

　「区分コード」は、或る管理対象に対するさらに詳細な「管理の視点」を示しています。そして、この「区分コード」がその個体の（セット）部分集合（サブセット）を示しています。したがって、「区分コード」を前提にしてサブセットを作れば良いということです。

　サブセットに対して、「切断」概念を適用するので、サブセットのあいだには「まじわりがない」ことを前述しました。TM が「セットとサブセット」を導入した理由は、まさに、サブセットのあいだに「まじわりがない」ことを確認するためにでした──逆に言えば、もし、サブセットのあいだに「まじわり」があれば、「場合分け」を配慮した「区分コード」を構成しなければならないことになるでしょう。たとえば、或る集合において 3つの部分集合 { A, B, C } を考えてみます──もし、「まじわり」を考慮した部分集合を考えれば、以下のように、最大で 8つ（2³）の部分集合を考えなければならないでしょう。

　{ A } { B } { C } { A, B } { A, C } { B, C } { A, B, C } { φ }.

　これらの「すべての場合分け」に対して、「区分コード」を付与することは、まず無いでしょう。というのは、そういう付値は非効率だし、拡張性に乏しいから。

　ところが、「まじわり」が、一見、起こらないように「区分コード」が付値されているようでも、「まじわり」が起こる場合があります。たとえば、「取引先」 entity に対して、「取引先区分コード」を用意しているとしましょう。そして、「取引先区分コード」の付値として、「1」を「納入先」として、「2」を「出荷先」として、「3」を「支払先」としましょう。この状態は、一見、「取引先」を 3つの部分集合に分割しているようにみえるのですが、「納入先かつ支払先」などのように「まじわり」が起こるかもしれない。ちなみに、前述したように、「取引先区分コード」の付値として、「納入先かつ支払先」に対して、（「納入先」「出荷先」および「支払先」のほかに）「4」というふうに値を付与することは下手な対応でしょう。
　もし、この「まじわり」を放っておけば、8つ（2³）の場合分けを考えたアルゴリズムを作成しなければならないので、アプリケーション・プログラムの生産性・保守性・拡張性が悪くなるでしょうね。

　したがって、サブセットのあいだに「まじわり」が起こるのであれば、しかるべき対応をしなければならないということです。事業過程・管理過程で使われている「管理の視点（区分コードの適用）」が、かならずしも、データベースのデータ構造として妥当であるとは限らない。そのために、「区分コード」の妥当性（データベースのなかに実装するデータ構造として、「集合」概念に照らしての妥当性）を調べるのが「セットとサブセット」というテクニックです。ちなみに、サブセットのあいだの「まじわり」を除去すれば、データ演算は、単純な集合論演算で終えることができます（後日に説明します）。

　なお、TM では、「赤本」で示したように、「セットとサブセット」は、以下の 2つのクラスを扱います。

　（1）同一のサブセット
　（2）相違のサブセット

　「同一のサブセット」は全域関数ですが、「相違のサブセット」は部分関数です。言い換えれば、「相違のサブセット」は、サブセットを示すと同時に、 null を除去しています。 □

　

[ 補遺 ] （2017年11月 1日）

　モデル作りを専門にしている或るコンサルタントが、「サブセット間で AND が生じて何が悪い、現実には『区分コード』がそういうふうに使われているではないか」と私を（私の面前で）非難していた。私は、こういう非難を聴くと、ウンザリする──「専門家であるならば、もう少し数学（論理）を学習してください」と皮肉のひとつでも言いたくなる。

　確かに「現実には（『区分コード』で切断される）サブセット間に交わりがある」。しかし、私の言いたいのは、それを「形式的構造（モデル）」──「論理」では、「形式的」という意味は「論理的」ということ──のなかに持ち込むな、ということです。我々システム・エンジニアは、事業をコンピュータに実装することを仕事にしています。そして、コンピュータは「論理」の集積路です。だから、「論理」に反する事態は、「論理」上妥当な形に変換して実装しなければならないのは当然のことでしょう。

　サブセット間に交わりを認めるということは、「同値類」という概念をわかっていない──同値類がわかっていれば、サブセット間に交わりを認めていけないことは、 3行で証明できることです。たとえば、K という集合（セット）を考えて、K(a) と K(b) の 2つのサブセットを考えてみます──もし K(a) と K(b) が共通のメンバー c をもっていれば (すなわち、K(a) と K(b) の境界上に c があれば）、K(a)～c, K(b)～c。対称律を使って、K(a)～c, c～K(b)、ゆえに、K(a)～K(b)。証明終わり。K(a) と K(b) に交わりがあれば、K(a) と K(b) は、形式上、サブセットにならない。

	<< もどる	HOME	すすむ >>
	目次にもどる