2001年 6月24日 サフ゛セット の検証 >> 目次 (作成日順)
  ● QUESTION   サフ゛セット (テ゛ータ の周延) を、どのように検証すればよいか。
  ▼ ANSWER   サフ゛セット 間には排他的 OR が成立する。 OR は、算術的には、加算と同値である。
2006年 8月 1日 補遺  




 サフ゛セット 間には 「OR (排他的関係)」 が成立する。しかし、「OR」 を使った検証だけでは完全な検証にはならない。

 論理定項の「OR」 は、算術式の 「+ (足し算)」 と同値である。したがって、サフ゛セット (の テ゛ータ 数) をすべて加算すれば、上位の セット (の テ゛ータ 数)と同じになる。「+」 を検証手段として使えばよい。




▼ サフ゛セット 間に 「AND」 が成立する具体例

 ┌───────────────────────┐
 │          取引先         R│
 ├───────────┬───────────┤
 │取引先コード     │取引先名称      │
 │           │住所コード(R)   │
 │           │番地         │
 │           │           │
 │           │           │
 └───────────┴───────────┘

 ┌───────────────────────┐
 │     取引先. 取引先区分. 対照表     │
 ├───────────┬───────────┤
 │取引先コード(R)  │           │
 │取引先区分コード(R)│           │
 │           │           │
 └───────────┴───────────┘

 ┌───────────────────────┐
 │         取引先区分        R│
 ├───────────┬───────────┤
 │取引先区分コード(R)│           │
 │           │           │
 └───────────┴───────────┘



[ 前提 ]

(1) 取引先区分 コート゛ は、例えば、以下の内訳とする。
   出荷先、 支払先、納入先、などなど。

(2) 1つの取引先には、複数の 「区分」 が並立する。
   たとえば、取引先 A 社は、出荷先で もあり、支払先でもあり、納入先でもある。
   つまり、区分 コート゛ のなかで、2つ以上の区分が 「AND」 (連言) として 成立する。

(3) したがって、「取引先区分 コート゛」 は、サフ゛セット ではない。
   すなわち、取引先の 「部分集合」 にはならない。

(4) 「取引先区分 コート゛」 は、「区分 コート゛」 になっているが、「分類 コート゛」 として作用している。





▼ サフ゛セット 間に 「+」 を使って検証する具体例

             ┌─────────────────┐
             │       顧 客      R│
             ├────────┬────────┤
             │顧客番号    │顧客名称    │
             │        │年齢層区分コード│
             │        │        │
             └────────┼────────┘
                      |
                      = 年齢層区分コード
                      |
          ┌───────────┴───────────┐
          |                       |
 ┌────────┴────────┐     ┌────────┴────────┐
 │       10代        │     │       20代        │
 ├────────┬────────┤     ├────────┬────────┤
 │顧客番号    │顧客名称    │     │顧客番号    │顧客名称    │
 │        │年齢層区分コード│     │        │年齢層区分コード│
 │        │        │     │        │        │
 │        │        │     │        │        │
 │        │        │     │         │        │
 └────────┴────────┘     └────────┴────────┘



[ 前提 ]

 (1) 顧客番号を附番された テ゛ータ として、10代・20代・30代・40代の テ゛ータ がある。
    それぞれ、20人・50人・80人・30人がいる。

 (2) 年齢層区分 コート゛ には、以下 の2つの値がある。
    「1」 は 10代、「2」 は 20代。

 (3) 10代および 20代のほかの テ゛ータ は区分 コート゛ のなかに記述されていない。

 (4) サフ゛セット 間 (10代と 20代) には 「OR」 が成立する。
    しかし、サフ゛セット の全てが表現されていない。

 (5) 10代の 20人と 20代の 50人を足し算しても、顧客全員の 180人にはならない。

 
  この年齢層区分 コート゛ は、テ゛ータ 構造を記述しているのではなくて、テ゛ータ を抽出する条件 (アルコ゛リス゛ム) を表現している。もし、10代と 20代のほかに、「その他」 (例えば、区分 コート゛ = 9) が用意されていれば、顧客全体を表現することになる。



[ 補遺 ] (2006年 8月 1日)

 サブセット は、作図上、上下の階として描かれるが、数学上、「同値類」 です。すなわち、セット のなかを 「仕切った 部分集合」 です。したがって、サブセット の基数 (データ 個数) と セット の基数は等しいはずです。そして、1つの セット を仕切れば、最低限、2つの部分集合が生じます。

 以上のことを前提にすれば、サブセット が周延しているかどうか (正しい集合になっているかどうか) という検証では、以下の諸点を考えることができるでしょう。

 (1) 1つの セット は、2つ以上の サブセット から構成される。

 (2) それぞれの サブセット は、排他関係にある (「排他的 OR」関係にある)。

 (3) それぞれの サブセット の個体数を合計した数は、セット の個体数と同じになる。

 もし、1つの セット のなかに 1つの サブセット しかないなら、それは、同じ 「外延 (集合)」 を指示しているのであって、セット と サブセット との関係にはならない。たとえば、商品のなかで、以下の 2つの区分を考えてみます。

 (1) 良品・不良品区分コード (1: 良品、2: 不良品)

 (2) 等級区分コード (1: 一級品、2: 二級品、3: 三級品)

 (3)良品は一級品であり、不良品は二級品・三級品である。

 商品に対して、2つの管理視点 (「良品・不良品」 と 「等級」) が導入されていますが、サブセット 構成は以下のようになります。

   商品{商品番号、商品名称、...}
     │
     = 良品・不良品区分コード
     │
     ├ 良品
     │  │
     │  = 等級区分コード
     │  |
     │  └ 一級品
     │
     └ 不良品
        │
        = 等級区分コード
        │
        ├ 二級品
        │
        └ 三級品

 
 この構成では、「良品 --> 一級品」 の構成が妥当ではないでしょうね。というのは、良品も一級品も同じ 「外延」 を指示しているから、サブセット 構成にならない。したがって、この構成では、「良品・不良品区分コード」 は冗長でしょうね (ムダ でしょうね)。




  << もどる HOME すすむ >>
  データ解析に関するFAQ