sdi - Page: FAQ205

　Ｔ字形 ER手法がクラス概念を使わない理由は、（事業のなかで実地に使われてきたデータを解析するという前提では）クラス図を信用していないからです。

　クラスとセットの違いについては、「ベーシックス」のなかで、すでに記述しているので──同じことを繰り返して言いたくないので──、「ベーシックス」を参照されたい（32 ページと 36 ページ）。

　事業のなかで実地に使われたデータを対象としてデータ構造を構成するやりかたには以下の特徴がある。

　（1）日常言語（自然言語）を使っている。
　（2）データはコード化される（コード体系）。
　（3）データは（伝票会計を前提にしているので）同一フォーマットのくり返し構造になる。

　（1）および（2）が「分析工程」のなかで解析対象とされ──いわゆる「業務分析」の対象とされ──、（3）が「設計工程」のなかでデータ構造およびプロセス構成の対象とされる。そして、分析工程と設計工程ではべつべつの「方法」が使われていて、分析工程のアウトプットをシステム・エンジニアが「翻訳」して設計工程のインプットとして変形しなければならない。

　つまり、解析の精度はシステム・エンジニアの力量次第ということになる。網羅性と検証可能性が保証されていない杜撰なやりかたに陥っているので、そういうやりかたが、はたして、工学技法と言えるのかどうか、、、。言い換えれば、「書きっぱなし」という、およそ、工学技法とは程遠いやりかたである。

　Ｔ字形 ER手法が、最初に狙った点は、一人のシステム・エンジニアの価値観に左右されないで、全員が「合意する」構造を構成することであった。そのために、Ｔ字形 ER手法は、以下の 5つのルール（規約）を導入した。

　（1）データの認知（データ集合を生成するための判断規準）
　（2）データの類別（データ集合のなかに帰属する性質の判断規準）
　（3）データの関係（網羅性と検証可能性を保証するリレーションシップの判断規準）
　（4）データの周延（生成されたデータ集合が正しい正規形かどうかを判断する規準）
　（5）データの多義（データ──アトリビュート──の多義を排除する規準）

　事業のなかで実地に使われているデータは日常言語を使いコード化されているので、Ｔ字形 ER手法は、コードを解析しながらデータ構造を構成する「言語の形態論」として完成した。

　次に、Ｔ字形 ER手法が狙った点は「分析工程と設計工程の溝を埋めて、事業戦略（事業の『環境適応能力』）を思考する」ということであった。事業戦略の検討は以下の 2つの段階から構成される。

　（1）現状の調査（「事実」を記述する。）
　（2）改善案の提言（代替案を提示する。）

　Ｔ字形 ER手法は「言語の形態論」として、前述した 5つのルールを前提にして、まず、事業を記述してデータ構造を生成する。そして、データ構造を解析しながら、コード化の良し悪しやデータ（「resource」と「event」）のアトリビュートの是非を検討する。さらには、「resource」間のリレーションシップを変更して、新たな対照表（「event」）を生成することもできる。つまり、「事業解析 ⇔ データ構造」（事業を解析しながら、そのまま、データ構造を生成すること）ができる。とすれば、現時点のデータ構造が環境の変化に対して即応できるのかどうかも判断できる。

　実地に使われているデータを言語の形態論の観点に立って解析して、生成されたデータ集合が正しい集合かどうか（周延しているかどうか）という点は集合論（セット概念）を使って検証できる。

　数学的な正しさというのは、（無矛盾性と完全性を備えている）「統一的なモデル」を構成することにあるが、エンジニアリング的な正しさというのは、「それぞれの目的に合う」　技術を組み合わせて 1つのシステムを構成するという点にある。

　1つのシステムは「モジュール」を単位として編成されるが、「モジュール」として編成する理由は、環境の変化に対応することと「再利用」することの 2つだと思う。

　「モジュール」を編成するときに注意しなければならない点は、「類似性」を対象とするのではなくて「相違点」を対象にしたほうが良いという点である。
　クラスは「類似性」を前提にして類を形成するが、「類似性」を判断するときに、選んだ「述語」が曖昧（広い概念）であれば、概念の一般化が曖昧になる。

　たとえば、正社員とパートは「従業員」というクラスになるのは正しいが、正社員とパートでは「相違点」があるので適用されるアルゴリズムが違う。ところが、「類似性」を使って 1つのクラスとして包括してしまうと、そのクラスが使うアルゴリズムが多岐になる。この時点で、「アルゴリズムの再利用」が怪しくなる。
　述語論理には「一般的な検証手続き」はない。1つの 1つの論理を証明しなければならない。したがって、「アルゴリズムのクラス」を生成するというのは非常にむずかしい。

　逆に、「従業員」というセットを形成してから、「相違点」を意識して、サブセットにしたほうが、1つのセットのなかで、アルゴリズムの適用が違うことを判断することができる。

　クラスは概念を整理する（再体系化）には最適なのだが、「事実」を記述するには危険である。クラスというのはエンジニアの教養として習得しておけばよいのであって、クラスを使って事実を記述してはいけない。

　小生（佐藤正美）は体系化すること（モデルを構成すること）を嫌っているので、「事実の記述」を主眼として物事を観る気質だから、「クラス」を扱うことを躊躇っている。小生がクラス概念を使うのは、せいぜい、「概念的スーパーセット」として、描かれた（事実を記述した）Ｔ字形 ER図を解析するときぐらいだから。

　たとえば、新人教育と社員教育とセカンド・キャリア教育という 3つの「event」があったら、「概念的スーパーセット」として「教育」を考えて、「教育」という観点から判断して、その 3つの「event」でよいのか、という使いかたをするが、それ以上の使いかた（再利用を目的としたクラスの生成）をやらない。

　小生が使うクラスは、あくまで、概念の整理（再体系化）であって、再利用ではないから、Ｔ字形 ER手法がクラスを対象にすることは、まず、あり得ない。

　技術的に言っても、Ｔ字形 ER手法は、認知番号（××番号、××コード）を使ってセット（集合）を限定（措定）してから、区分コードを使ってサブセット（部分集合）を検証している。Ｔ字形 ER手法がセット概念を使っているといっても、けっして、「述定」している（述語を使って外延を生成している）訳ではない。

[ 参考 ]
　クラス図では、Ｔ字形 ER手法の特徴点である「アルゴリズムの I/O 化（一撃必殺の I/O）」を使うことができない。ただし、Ｔ字形 ER手法はデータ構造を対象とした手法であって、データ構造が吸収できるアルゴリズムは（コード体系が効果的・効率的に用意されていても） 70 ％程度である。アルゴリズムを作成することを対象にしている技法ではない。つまり、Ｔ字形 ER手法を使っても、「アルゴリズムの 30 ％以上」を作成しなければならない。

　生産性を高めるために「再利用」することを狙ってアルゴリズムのクラスを生成しようとしているのなら、生産性を高める最大のやり方は非常に単純であって、アルゴリズムを I/O 化してしまってアルゴリズムを作成しないようにすればよい。

2003年 3月16日	言語の形態論とクラス概念	>> 目次（テーマごと）
●　QUESTION	Ｔ字形 ER手法は、どうして、クラス概念を使わないのか。
▼　ANSWER	クラスの生成が恣意的になるから。
2008年 4月16日補遺

	<< もどる	HOME	すすむ >>
	データ解析に関するＦＡＱ