事業復活支援金事前確認④
事業復活支援金事前確認始末記④ 事業復活支援金事前確認始末記事業復活支援金申請の重要なポイントは、確定申告書青色決算報告書第第二表月例金額、基準月の収入、と通帳に入金されている金額、請求書(領収書)が一致しなければならない。...
事業復活支援金事前確認始末記④ 事業復活支援金事前確認始末記事業復活支援金申請の重要なポイントは、確定申告書青色決算報告書第第二表月例金額、基準月の収入、と通帳に入金されている金額、請求書(領収書)が一致しなければならない。...
事業復活支援金事前確認始末記③ 私の事務所に事前確認のためやってくる客は決まって「国の申請要領を読めば読むほどわからなくなる。」 と私に不満を言う。私に言われても仕方がないのだが・・・ 客の不満を理解できないこともないが。...
事業復活支援金始末記② 5月20日で事前確認を終えようと思っていたが、事前確認の客がやって来た。5月26日まで事前確認を続けなければならないので対応する羽目に。 「個人事業主?」客がソファーに腰おろすと言った。 「いえ、中小法人です。」客の若者は驚いたような顔して言った。...
行政書士とデータサイエンティスト27 データサイエンスにとって重要な統計学の歴史であるが、史実に残っているのは、紀元前にエジプトでピラミッドを建設するために統計調査が行われている。 17世紀半ばには、ドイツの統計学派によって統計学が整備されている。イギリスでは、グラントと...
行政書士とデータサイエンティスト26 現在の人工知能ブームは、従来までの人工知能ブームとは異なって、ビックデータを用いて真似ることを主眼においている。つまり、現在の人工知能ブームは、ビックデータに大きく依存している。 現在、人工知能で注目されているのは、「深層学習」である...
行政書士とデータサイエンティスト25 最近では、画像データや音声データがインターネット上び大量に蓄積されるようになった。 これらのデータは関係データベースとは相性が悪い。 最近では、NoSQLなどの非構造化データを扱うさまざまなデータベースが開発されている。...
行性書士とデータサイエンティスト24 インタネット上のデータは速い速度で増加している。そのため、メインフレームを使用する必要があるが、メインフレームは費用上の問題がある。 そこで開発されたのが通常コンピュータとハードディスクを組み合わせて使用する分散処理の仕組みである。...
行政書士とデータサイエンティスト23 時系列データを分析する方法を時系列解析、複数の変数を扱う手法を多変量解析、モデルのパラメータを確率変数として扱う方法をベイズ法という。 上記ののような解析が、実装されているソフトウェア(統計解析システムR)がある。だだし、線形モデルよ...
行政書士とデータサイエンティスト22 エクセルは気軽にデータをの分析を行うことのできるソフトウェアであり、最近では大きなサイズの表も扱えるようになった。しかし、エクセルに向いてない処理もある。例えば、動作の再現がしにくい。...
行政書士とデータサイエンス21 30年位前は事務作業は紙ベースだった。 最近は、文書はパソコンアプリで作成し、計算はアプリでする。つまり、データが自然にデジタルで保存されるようになった。よく使用するのはエクセルである。 ピボットテーブルで項目ごとの集計や頻度を簡単に求めるこ...
行政書士とデータサイエンティスト20 データサイエンスの基礎は情報学と統計学である。データサイエンスに必要な数学、統計学、コンピューターを学ぶ必要がある。 データサイエンスのの実際の計算作業はパッケージやライブラリーのソフトウェアで行う。ツールを使えばデータサイエンスを実践...
行政書士とデータサイエンティスト19 ビックデータ時代における個人情報の扱いであるが、個人情報は人にあまり知られたくないものではあるが、反面社会的価値やジネス的及び社会的価値がある。 個人情報保護法は個人の権利利益の保護と有用性との間のバランスを取る法律であるが、最近では、...
行政書士とデータサイエンティスト18 主張したい仮説がなりたたない場合も、たまたま仮説を支持するデータが得られる場合もある。 統計学検定では、主張した仮説が成り立たないことを「帰無仮説」とする。有意水準を5%にした場合、主張したい仮説が5%の確率で得られる。...
行政書士とデータサイエンティスト17 意志決定には、必ず不確実性が伴う。不確実性を扱う理論が確率論である。しかし、確率論で扱える不確実性は一部分しかないのが現状である。確率論が有効なのは①サイコロの目の出方のように最初から起こり得る結果がわかっている。②それぞれの結果がわか...
行政書士とデータサイエンティスト16 データサイエンスの目的は、データから価値を引き出すことにある。 データサイエンティストは意思決定者であると限らない。データサイエンティストの役割は意志決定者にデータに基づく事実や知見を伝えることである。...
統計には「平均への回帰」という現象がある。 「平均への回帰」とは、簡単に説明すると、背が非常に高い父親の息子はそれほど背が高くない傾向があるということである。 平均への回帰が何代も続くとやがて身長が平均値に収束してしまうように思われるが、身長の中庸の父親からも、非常に背の...
ヒストグラムが正規分布のように曲線で表せる場合「密度関数」あるいは「確率密度関数」と呼ばれる。 密度関数とX軸で囲まれる面積は1となる。確実な事象の確率が1であることを対応している。 ヒストグラムであるが、ピークが2山あるヒストグラムは異質の集団混在している可能性がある...
行政書士とデータサイエンティスト13 実験によって得られるデータを実験データ、観測によって得られるデータを観測データと呼ぶが、観測データでは、観測のデータと他の要因の効果を区別することができないという問題があるのである。つまり、観測データから因果関係を導きだすことは困難と...
行政書士とデータサイエンティスト12 データには、観測しやすいデータと観測しにくいデータがある。 もちろんのことであるが、観測しにくいデータにはコストがかかる。当然、コストに見合う価値があるかどうかが問題になる。 例えば、天文学のデータが我々の暮らしや経済活動にとって...
行政書士とデータサイエンティスト11 根本的な話になるが、データの定義はどうなるだろうか? 一般的に、データとはさまざま計測や観察によって主として数値の形で得られる情報をいう。測定される情報を変数と呼ぶことが多い。 体温や体重は連続的な値をとるので連続的な変数と呼ばれる。...