データサイエンス

製造データの変数と尺度の種類

データ(変数)は大きく数値で示される量的データカテゴリで示される質的データに分かれます。

その中でも量的データは比例尺度と間隔尺度に、質的データは名義尺度と順序尺度に分かれます。

各尺度は表現可能な内容が異なります。

尺度の種類まとめ

詳しい解説は目次から項目をクリックしてご確認ください。

尺度の種類

まず比例尺度、間隔尺度、名義尺度、順序尺度の関係性について整理します。

数値変数と非数値変数、その中でも連続変数、離散変数、名目変数、順序変数などと表現する場合もありますが意味は同じです。

図で表すと以下のような構造になっています。

尺度の種類

量的データ(数値変数)

データが数値で示されるようなものを量的データと呼びます。

その中でも比例尺度と間隔尺度の2種類に分類されています。

これらには0という値が絶対的な意味を持つかどうかの違いがあります。

比例尺度(連続変数)

連続的な数値データです。

その間隔だけでなく比率に意味を持ち、数値間で計算することができます。

また原点0が絶対的な意味を持ちます。

製造データとして以下の例が挙げられます。

比例尺度の例

  • 寸法
  • 重量
  • 液面高さ
  • 売り上げ金額
  • 絶対温度
  • 絶対圧力

絶対温度は分子の振動が無くなる温度を0Kと定めているため比例尺度です。

一方、摂氏温度や華氏温度は任意でゼロ点を決めるため間隔尺度となります。

間隔尺度(離散変数)

目盛りを等間隔に設定された飛び飛びの数値データです。

その間隔自体に意味があるのであり、数値間の比率には意味がありません。

例えば温度が10℃から15℃に上がったとしても50%の上昇という比率に意味は無く、5℃という間隔に意味があります。

また0という数値は相対的な意味しか持ちません。

製造データとして以下の例が挙げられます。

間隔尺度の例

  • 摂氏温度、華氏温度
  • ゲージ圧力
  • 日付
  • 時刻
  • 年齢

質的データ(非数値変数)

データがカテゴリで示されるようなものを質的データと呼びます。

その中でも順序尺度と名義尺度の2種類に分類されています。

これらには大小関係に意味を持つかどうかの違いがあります。

順序尺度(順序変数)

各テーマごとに順位がつけられているデータです。

数値(順位)には大小関係がありますが、数値の間隔には意味がありません。

製造データとして以下の例が挙げられます。

順序尺度の例

  • 製造順序
  • ロット番号
  • 直勤務者の勤務区分
  • 製品グレード
  • 製品売り上げランキング

名義尺度(名目変数)

カテゴリーごとに分類されているデータです。

それぞれのカテゴリー間に意味は無く、大小関係はありません。

製造データとして以下の例が挙げられます。

名義尺度の例

  • 検査合否
  • 改善効果有無
  • 不良の種類
  • 製品名
  • 材料名
  • 部署

尺度水準

それぞれの尺度には統計学的に定められた水準があります。

水準が高い方から比例尺度、間隔尺度、順序尺度、名義尺度となります。

水準が高い尺度は水準が低い尺度の要素を含んでいることを表します。

また水準が高い尺度は水準が低い尺度を用いて表現しなおすことが出来ます。

例えば製品の重さという比例尺度で表現されたデータを、一定範囲の重さごとに製品数を数えることで順序尺度に表現しなおすことが出来ます。

これがヒストグラムです。

関連記事

データ分析の基本的な進め方
2値で表すデータもある
データサイエンティストに必要な知識
記事への問い合わせはこちらから

-データサイエンス