データのカテゴリの選択¶
データのカテゴリ(測定尺度)を選択します。選択肢は、
- 名義尺度
- 順序尺度
- 間隔尺度
- 比例尺度
- 日付/時間
カテゴリの説明¶
名義尺度
順序が定義できない非数値的概念を表す尺度。 地名や種名、性別など。
順序尺度
順序が定義できる非数値的概念を表す尺度。 「高木・亜高木・低木」や「熱帯・温帯・寒帯」などは 順序が定義できるので順序尺度になる。
間隔尺度
一定量の単位を用いて数値化された量的概念を表す尺度。 数値が等間隔に割り振られているため加減算は有効だが、 ゼロ点が便宜的に定義されているため、 乗除算には意味がない。 セ氏温度や経度など。
比例尺度
等間隔であることに加えて、意味的なゼロにゼロ点が 定義されている量的概念を表す尺度。四則演算が有効。 ほとんどの数値データはこれに当てはまる。 絶対温度や重量や濃度など。
日付/時間
日付と時間を表すために EML で特別に定義されている尺度。
解説¶
‘EML Best Practices 2’ から引用。
名義尺度は名義カテゴリを表現するのに使用する。 値は他の観測値から区別できるように割り当てられる。 これには符号化された値のリスト(たとえば 1=男性、2=女性)や、 平文の説明が含まれるだろう。文字列や単純な文章を含む列は 名義的である。たとえば、plot1, plot2, plot3。
順序尺度は、互いに論理的または順序的な関係性を持っている カテゴリであるが、値同士の違いの大きさは定義されないか、意味がない。 例: 低、中、高
間隔尺度は順序的である。しかしそれに加えて 値と値の間に同じ大きさの単位を用いる。 開始点は恣意的であり、そのためゼロ値には意味がない。 例: セ氏温度尺度は等間隔の「度」を用いるが、このゼロは 「絶対零度」(つまり分子運動が停止する温度)を表現しない。 そしてセ氏20度は10度よりも「2倍熱い」わけではない。
比例尺度は意味のあるゼロ点をもち、値と値の比率を比較することが 理にかなっている。たとえば、ケルビン尺度は物質の運動エネルギーの 総量を反映している(すなわち、ゼロは、物質がまったく熱エネルギー を伝達しない点である)。 そしてそれゆえ、ケルビン単位で計測された温度は比例尺度の測定値である。 濃度もまた比例尺度の測定値である。なぜなら、10mmol/l の溶液は 5mmol/l の溶液よりも2倍の物質を持っているからである。