〜知識の貯金箱〜  ※旧オトコスメ

超・雑記ブログ

未分類

美ルルの測定値ってどれくらい正確なの? 本気でデータ取りしたい方のための誤差の考え方

投稿日:





どうも理系アラフォー男子のゆんゆんです。本日はかなりの自己満足記事になっていますので興味がない方は別の人気記事をご覧ください(笑)。

本日は私が愛用していますスキンチェッカー美ルルの測定値がどれくらい正確なのかを統計的に確認してみたいと思います。

例えば美ルルでお肌の水分を2回連続で測定して、45%、42%とという数値がでるけど、これって正しいの?そして何回測れば正確なデータがとれるの?といった疑問にお答えする回になります。こんなこと気にする方は少ないかと思いますが、インターネットで検索してもだれも情報を出していないのでとりあえず自分で計算してみました。これから説明してみようと思います。

 

何はともあれまずはデータ取り

今回は美ルルを使用して、おでこの水分量を測定しました。測定は26℃くらいの部屋で、右手で適当におでこに美ルルを当ててチェックするといった感じです。

そして、1回測定、2回連続測定、3回連続測定、、、という感じで10回連続測定まで計55個のデータを採取しました。集めたデータは以下になります。

どうです、これを見ても「で?なに?」って感じですよね。ここからいろいろと数値遊びをしていきたいと思います。

まずは上の表の55個のデータの平均は46.4%なので、ひとまず真値を46.4%としています。




真値と誤差について

皆さんのお肌の水分量というのは、その場所、その瞬間はおおむね1つの数値に決まるはずです。本当に同じような場所を同じ機械で測定すれば、同じ数値が出るはずです。で、その本当の数値を「真値」といいます。でもこの「真値」を1回で測定するのは実はすごく難しいんですね。なぜなら測定値にはいつも「誤差」が含まれるからです。

例えば今回の場合は、

  • 本当に同じ場所が測れているのか
  • 時間がたったら水分量が変わるんじゃないのか
  • 美ルルがそもそも正確じゃないんじゃないか
  • 測定データの入力間違いがあるんじゃないか

などなど、いろんな要因で誤差が出る可能性があります。

じゃあ誤差が出るから「真値」は絶対にわからないのかというと、そうでもありません。とにかく回数を重ねて測れば、限りなく「真値」に近い値が出せるのです。

一般的に測定回数n回(nは1~∞の数字)測定すれば、1/√nだけ誤差が減ると考えられます(中心極限定理)。専門用語だとわかりにくいので簡単に説明すると、

1回測定の場合は誤差が思いっきり影響するけど、4回測ったら誤差は半分(50%)くらいになるよ。という感じです。

例えば40%の数値が真値として、誤差が4%出るとしたら、1回測定すると44%とかになってしまうけど、4回測った平均をとれば、たぶん42%くらいの数値が出るよ。1回測定より4回測定の平均のほうが真値に近いね。という感じです。

で、もしデータを10000回とることができれば、誤差は1/100まで減らすことができます。40%に4%の1/100の誤差が出ても、40.04%。このくらいまで来ればこれはもうほぼ真値といえるでしょう。でも実際に毎回1万回測ってたら時間がいくらあっても足りないし、実際1万回測る時間は数時間かかるだろうからお肌のコンディションも変わってしまうでしょう。

ということで、多くの場合はできるだけ少ない回数で、なるべく正確な値が出せたらいいなという回数を探ることになります。

 

じゃあ何回測定すればいいの?

これは個人のセンスによるところもあるのですが、私は6回測定した平均値を使用しています。

上の説明でいうと、6回測定すると、誤差は約40%くらいになるはずです。

そして、今回の測定データで「標準偏差」という数値を出しています。それをグラフにしたものがこちら。

今回の場合の標準偏差は何かというと、

真値から±標準偏差の数値の中に、68%の確率で数字が出るよ。そして、±標準偏差の2倍の数値の中に、95%の確率で数字が出るよ。という意味です。

上のグラフで、n=6の時、標準偏差は1.7ぐらいでしょうか。なので、±1.7の範囲に68%の確率で数字が出て、±3.4の範囲に95%の確率で数値が出るよ。という意味です。

ざっくりいうと、n=6で測った平均値は真値から±3%の数値が95%の確率で出るよ。という意味になります。

もっと簡単に言うと、美ルルで6回測定した平均値は、真値から±3%の数値だよ。という感じです。ちなみに10回測定すると±2%に収まります。逆に4回測定だと、±5%になります。

この辺はもう自分がどれくらいの精度を求めるかによりますが、私は「なるべく手間をかけずにそこそこいいデータをとる」という目標のもと、6回測定を選んでます。

 

まとめ

どうでしょうか。私がブログの記事を書くときに「6回測定した平均値を使っています。」と記載していますが、それは測定回数と真値からの誤差がちょうどいいところをとって測定しているということがわかりましたでしょうか。

正直どうでもいいと思う人が大半だと思いますが、気になる理系女子がいるかもしれませんので記事にしてみました。

上記の記載についていろいろと突っ込みたいデータサイエンティストの方もいるかもしれませんが、もしコメントいただければいろいろと考えてみたいと思います。

またほかにも上のような感じで別の疑問をお持ちの方はご連絡いただければ可能な範囲で調査をしてみたいと思います。

以上本日も最後まで読んでいただきありがとうございました。今後ともよろしくお願いします。




-未分類

Copyright© 超・雑記ブログ , 2020 All Rights Reserved Powered by STINGER.