top of page

行政書士とデータサイエンティスト18

  • ezily5
  • 2022年5月10日
  • 読了時間: 2分

行政書士とデータサイエンティスト18 主張したい仮説がなりたたない場合も、たまたま仮説を支持するデータが得られる場合もある。  統計学検定では、主張した仮説が成り立たないことを「帰無仮説」とする。有意水準を5%にした場合、主張したい仮説が5%の確率で得られる。  論文等で公表されるデータには、データのばらつきのために生じたたまたまうまくいったケースを発表する場合がある。公表のバイアスという。有意にならなかった研究数がわからないので、公表のバイアスわからないことが多い。  問題なのは、論文の再現性である。再現可能性については、データばらつきによる公表のバイアスよりも大きなバイアスがあるのではないかと思われる。   データの再現性の問題は、「結論ありき」という研究姿勢から生じる。つまり、事前に結論はなく、データを見てからデータに合う結論を探す場合に生ずる。  「結論ありき」のバイアスを「確証バイアス」という。このようなバイアスがあるため、統計的検定行うは有意水準の調整が必要になるのである。  「確証バイアス」避けるためには、①どのような項目についてデータを取るか②どの項目を評価の対象とするか③有効と無効の判断基準にあらかじめ決めておく必要がある。いわゆる確認的データ解析が必要になる。  一方、ビックデータは自然に集まってくるデータある。そのため、ビックデータ解析は論文データとは異なり、探索的データ解析になる。いわゆるデータマイニングである。ただし、ビックデータにより情報が溢れていると言っても、知りたいことについてデータが得られない場合もある。  最近のインターネットの発展による特有の問題がある。いわゆるステレスマーケッティング(消費者に宣伝と気づかれないように宣伝行為をすること。)やフェイクニュースの問題もある。

 
 
 

最新記事

すべて表示
行政書士とみんなが支持するSDGs⑭

行政書士とみんなが支持するSDGs⑭ 海の豊かさを守ろう 目標14 海洋と海洋資源を持続可能な開発に向けて保存し、持続可能形で利用する。 「2025年までに、陸上活動による海洋体積物や冨栄養化をはじめ、あらゆる種類の海洋汚染を防止し、大幅に減少させる」など、10のターゲット...

 
 
 
行政書士とみんなが支持するSDGs⑬

行政書士とみんなが支持するSDGs⑬ 気候変動に具体的な対策を 目標13 気候変動とその影響に立ち向かうため、緊急対策を散る 「気候変動対策を国別の政策、戦略および計画に盛り込む」など、5つのターゲットからなる目標です。小さな企業や組織としてできることは限られるかもしれませ...

 
 
 
行政書士とみんなが支持するSDGs⑫

行政書士とみんなが支持するSDGs⑫ 目標12 つくる責任 つかう責任 持続可能な消費と生産のパターンを確保する。 「大企業や多国籍企業をはじめとする企業に対し、持続可能な慣行を導入し、定期報告に持続可能性に関する情報を取り込むよう奨励する」など11のターゲットからなる目標...

 
 
 

コメント


bottom of page