データのカテゴリの選択 ======================= データのカテゴリ(測定尺度)を選択します。選択肢は、 * 名義尺度 * 順序尺度 * 間隔尺度 * 比例尺度 * 日付/時間 カテゴリの説明 ---------------- * 名義尺度 順序が定義できない非数値的概念を表す尺度。 地名や種名、性別など。 * 順序尺度 順序が定義できる非数値的概念を表す尺度。 「高木・亜高木・低木」や「熱帯・温帯・寒帯」などは 順序が定義できるので順序尺度になる。 * 間隔尺度 一定量の単位を用いて数値化された量的概念を表す尺度。 数値が等間隔に割り振られているため加減算は有効だが、 ゼロ点が便宜的に定義されているため、 乗除算には意味がない。 セ氏温度や経度など。 * 比例尺度 等間隔であることに加えて、意味的なゼロにゼロ点が 定義されている量的概念を表す尺度。四則演算が有効。 ほとんどの数値データはこれに当てはまる。 絶対温度や重量や濃度など。 * 日付/時間 日付と時間を表すために EML で特別に定義されている尺度。 解説 -------- 'EML Best Practices 2' から引用。 名義尺度は名義カテゴリを表現するのに使用する。 値は他の観測値から区別できるように割り当てられる。 これには符号化された値のリスト(たとえば 1=男性、2=女性)や、 平文の説明が含まれるだろう。文字列や単純な文章を含む列は 名義的である。たとえば、plot1, plot2, plot3。 順序尺度は、互いに論理的または順序的な関係性を持っている カテゴリであるが、値同士の違いの大きさは定義されないか、意味がない。 例: 低、中、高 間隔尺度は順序的である。しかしそれに加えて 値と値の間に同じ大きさの単位を用いる。 開始点は恣意的であり、そのためゼロ値には意味がない。 例: セ氏温度尺度は等間隔の「度」を用いるが、このゼロは 「絶対零度」(つまり分子運動が停止する温度)を表現しない。 そしてセ氏20度は10度よりも「2倍熱い」わけではない。 比例尺度は意味のあるゼロ点をもち、値と値の比率を比較することが 理にかなっている。たとえば、ケルビン尺度は物質の運動エネルギーの 総量を反映している(すなわち、ゼロは、物質がまったく熱エネルギー を伝達しない点である)。 そしてそれゆえ、ケルビン単位で計測された温度は比例尺度の測定値である。 濃度もまた比例尺度の測定値である。なぜなら、10mmol/l の溶液は 5mmol/l の溶液よりも2倍の物質を持っているからである。