医学生の解釈(ブログ)

学生が医学部に入って得た視点など。医者の世界をのぞいた非医療人のブログ。

データのばらつき・正確度と精度・確率変数とバラツキ~学部生から論文を書く

今回は、「実験で収集したデータの扱い」「データのばらつきとバイアス」を勉強します。

 

正確度と精度

まずは、言葉の意味を知りましょう。「セイカクドとセイド」音は似ていますが、内容は違います。

正確度

正確度accuracyが高いとは、平均をとると真の値に一致すること、妥当性が高いという事です。具体的に書くと、「理論上この値になるはずだ!」と決定された数値と、実験で出てくる実験の値が同じという事です。例えば、サイコロを6回ふると、出た目の平均は3.5になるはずです。ここで出た目の数が{1・2・3・4・5・6}の場合と{6・6・6・6・6・6}の場合では、前者の方が「正確度が高い」と言います。

精度

精度precisionが高いという事は、データのばらつきが少ないという事です。ほとんどのデータが、実験の値に近い値になります。具体的に書くと、{1・2・3・4・5・6・7・8・9}{5・5・5・5・5・5・5・5・5}以上二つのデータの平均は5で同じですが、ばらつきが全然違います。下の数値の方がばらつきが少なく、「精度が高い」と言います。サイコロの例で書くと、サイコロを6回ふったとき、出た目の数が{1・2・3・4・5・6}の場合と{6・6・6・6・6・6}の場合では、後者の方が「精度が高い」と言います。

 

データを集める際には、より正確に、より精密に調べることになります。(正確度と精度を上げていく)

 

正確度と精度の指標

正確度と精度を数値で表現することを考えます。

正確度は

  • 絶対的正確度:平均値meanー真値
  • 相対的正確度:(平均値ー真値)/真値

精度は

  • 絶対的精度:分散・標準偏差(SD)
  • 相対的精度:標準偏差/平均値 ×100 (SD/mean *100)

以上の評価の仕方があります。

確率変数

確率変数とはランダムな誤差を伴う変数です。実験においては、監察結果が変動します。例えば血圧は、1日の間で変動します。「あなたの検察の観察結果」は1日を通して、ばらつくのです。(日内変動のため)

このようなデータのばらつきは実験を進めるうえで、邪魔なものとなります。これを統計的に解決することが大切です。

では、例えば、血圧のばらつきと言えば

  • 測定誤差
  • 個人間のばらつき(性別・年齢)
  • 個人内のばらつき(季節変動・日内変動)

これらのばらつきが計測で見られます。

原因不明のばらつきもあります。これは制御できず、「誤差的なバラツキ」と見なされます。実験においては、このような、「原因不明なバラツキ」をどう減らしていくかが課題となります。客観的思考で、「バラツキの理由」を探ることが大切です。化学的なプロセスとは、「ばらつき」を制御可能な要因にしていくことのことを指すのです。

 

にほんブログ村 大学生日記ブログ 医大生へ