そもそもデータとは何なのか?を図解してみた

こんにちは、おちです。

ここ最近、データ分析でよく使う平均値や標準偏差についてお話ししてきましたが、データってそもそも何?というお話をするのを忘れていました。

そこで、今回はそもそもデータって何者なのか、どうしてデータが今の社会で大事に扱われているのかについてお話しします。その後、データを使うときの注意点を簡単にご紹介します。

よろしくお願いします。

目次(読みたい項目をタップ)

データとは観測記録

辞書的な意味から外れますが、誤解を恐れず私のイメージをお伝えすると、データとは観測記録です。

記録として残るなら数字も文字も、音声も画像も全部データです。

観測記録を分析して、適切な判断をするのに役立つ情報を引き出すことがデータ分析です。

データが価値ある情報に変わるまでの流れ

自分が思うデータが価値ある情報に変わるまでの流れは以下のイメージです。

  1. 事実や心象、仮想モデルを観察・観測して、数値や文字、画像などのデータを生成
  2. 生成したデータをPCやAIで集計、データの特徴や傾向を見出しやすい状態に加工
  3. データの特徴や傾向を分析して、原因や法則を見出すなど解釈を加えデータを価値化
  4. 周知・伝達して判断材料にし、具体的な行動や自動化の手順に落とし込む

上の4ステップ全てが適切に実施されて、はじめてデータは価値ある情報として活用されます。

最近話題に上がっているAIが担っているのは集計・加工の部分です。

そのためデータの質や量が足りないと優秀なAIでも価値ある情報にできません。

また、AIが出した結果を価値を感じてもらえる形に解釈して行動に落とし込まないと価値を発揮しません。

AIと言うビックワードに踊らされず、AIができることできないことを見極めてうまく役割分担をしたいところです。

どうして今データが重要視されているのか?

昨今データが重要視されるようになった理由は大きく2つと考えています。

ひとつはスマホやPC、AIなどのテクノロジーの発達、もうひとつは人は思った以上に思い込み(バイアス)にとらわれて判断を誤ることがわかってきたためです。

順番に説明していきます。

①スマホやPC、AIなどのテクノロジーの発達

これはイメージしやすいかもしれません。

多くの人がスマホやSNSを利用するようになった結果、昔ならわざわざ調査しないと手に入らなかったデータを大量に低コストで入手できるようになりました。

先ほど紹介した流れに沿うと、観察・観測が簡単に安くできるようになったわけですね。

さらにPCやAIの発達で大量のデータを自動で高速に処理することができるようになりました。

集計・加工も昔と比べたらはるかに簡単に安くできるようになりました。

さらにはネットの発達で価値を感じてもらえそうな人にピンポイントで届けることも簡単になりました。ネット広告が良い例ですね。

先ほど紹介したデータを価値ある情報に加工して届けるまでの流れがテクノロジーの発達で簡単になったことが大きいです。

②人は思い込み(バイアス)にとらわれて判断を誤る

生活は判断の連続です。

朝何を食べようか、服は何を着ようか、家に何時に出れば目的地に着くのかのような簡単な判断から、今の交際相手と結婚して大丈夫なのか、今の職場で働き続けていて大丈夫なのかなど人生に大きな影響がある判断など様々です。

重要な判断であればあるほど、誤った判断をしたくないですよね。

この判断を狂わせるのが思い込み、バイアスです。人は客観的に判断するのが得意ではないのです。

恋は盲目というのが良い例です。

周りは結婚に反対したけど押し切って結婚して後々後悔するという話をたまに耳にします。

これは恋愛感情という思い込みに飲み込まれ、結婚相手の悪い部分を過小評価したり見逃したりするためです。

データは扱い方さえ間違えなければ、思い込みを極力取り除くことができます。思い込みによる間違いを避け、適切な判断をする上で強力なサポートをしてくれるのです。

データを使うときの注意点

ここまでデータがそもそも何者で、なんで重要視されているかについてお話ししてきました。

データはちゃんと取り扱えば適切な判断・行動をサポートしてくれる強力なツールです。

ただ、取扱いを間違うとデータに騙されたり、誤った判断にもつながってしまうので注意が必要です。

先ほどデータが価値ある情報に変わるまでの流れを再度おさらいしてみましょう。

上記の流れの中に落とし穴が含まれています。以下の部分に注意です。

詳細な解説は長くなるので今回は控えますが、データを生み出して価値ある情報として活用するまでにはこれだけの落とし穴があります。

データは万能ではなく扱う際に落とし穴があることに注意していただけますと嬉しいです。

最後に

データはそもそも何者なのか、どうして昨今データが重要視されているのかについてお話ししてきました。

また、ざっとではありますが、データを扱うときの落とし穴についても紹介しました。

落とし穴については別の記事で詳しく扱いたいと思います。

疑問点やご要望などございましたらコメントやお問合せにてご連絡いただけますと嬉しいです。

今回は以上です。最後までお付き合いくださりありがとうございました。

目次(読みたい項目をタップ)