行政書士とデータサイエンティスト22
- ezily5
- 2022年5月14日
- 読了時間: 1分
更新日:2022年5月15日
行政書士とデータサイエンティスト22 エクセルは気軽にデータをの分析を行うことのできるソフトウェアであり、最近では大きなサイズの表も扱えるようになった。しかし、エクセルに向いてない処理もある。例えば、動作の再現がしにくい。
データの整合性を保つ機能ソフトウェアが関係データベースである。商用では、Oracle、IBMDB2、オープンソースでMySQLなどがある。
データベースを操作する言語がSQLである。SQL習得すれば、さまざまなデータベースを扱うことができる。最近では、NoSQLというデータベースを用いて、関係データベース以外のデータベースを扱うことができる。
データから予測モデルを構成するには、統計的なモデルリングが必要とされる。よく利用されるモデルや分析法は ①品質を他の変数から予測あるいは説明する回帰分析 ②食品が良品か不良品を判断する判別分析 ③似た個体をまとめてデータをいくつかの群に分けるクラスター分析などがある。
回帰分析において説明変数の線形関数を用いる「線形モデル」が一般的であるが、説明変数の領域を順次区間に分けていく方法を「決定木」モデルという、神経情報伝達を模した関数を用いる方法を「ニュートラルワーク」という。
コメント