E資格のシラバスに入っている応用数学の確率・統計を学習しよう

E資格のシラバスに入っている応用数学の確率・統計を学習しよう

E資格はディープラーニングの理論を理解して実装するための知識を有している方が取得できる検定です。

E資格のシラバスを見ると、試験には統計・確率や応用数学などの問題が出るため幅広い知識も必要とされます。IT分野の知識だけでなく応用数学における知識もいくつか必要とされます。

E資格取得を目指すなら深層学習に求められる確率・統計について詳しく理解しておきましょう。

確率と統計とはどんなものなのか

確率はあることがどれくらいで起こり得るのかを調べる方法

ITエンジニアとして活動をするだけなら統計や確率などの知識は必要ありませんが、深層学習を学ぶときは統計や確率といった応用数学の勉強が必要になるので注意しておきましょう。

確率とは、ある出来事がどれくらい起こり得るのかを推測する計算です。数字に%をつけて、あることが起こり得る確率を表示します。機械学習においてはAIが予測した数値の信用度を計算するときに使います。

例えばあるコインを3回投げて表が出る確率を計算するときに、コインを投げる回数や条件などの情報をコンピューターに与えます。

確率や統計といった応用数学は、AIの処理を簡略化するために使用されます。また効率化を行い無駄な作業を省くためのものです。

統計はあるデータから別の結果を予測する

統計は、記述統計と推測統計が用意されています。

記述統計では集めたデータの分散具合から平均値を割り出して、データの性質などを解析します。推測統計は収集したデータから一部だけを分析して全体の予想を行います。

例えばケーキショップの1日の売り上げを分析して、近場にあるケーキショップの1日の売り上げを予測するといったことが可能です。

統計を用いれば今あるデータを使い他のデータを予測できるため、今後の行動において参考にすることが可能です。

確率分布はいくつかあるので知っておこう

ベルヌーイの分布はシンプルな内容

一般的な確率分布にはベルヌーイの分布というものがあります。「成功するのか失敗するのか」のような2種の結果しか得られない実験を行うもので、結果は0と1で表現します。

ちなみにベルヌーイの分布は、1である確率をp(とするとき0である確率は1-p)としています。例えばコイントスの表か裏かの結果を表すときに使います。

マルチヌーイの分布は3つ以上の結果を出すときに使うもの

深層学習ではマルチヌーイの分布というものも扱っています。ベルヌーイの分布が2つの確率を表すときに使うものなら、マルチヌーイの分布は3つ以上の確率で表す必要のある確率分布に該当します。

マルチヌーイの分布は別名カテゴリカル分布とも呼ばれているもので、ベルヌーイの分布を一般化したものです。

ガウス分布はある条件において平均部分を調べるときに使う

ガウス分布は日本語で正規分布とも呼ばれているものです。線グラフにすると真ん中が一番高く左右端は平行線になっています。

ガウス分布は、平均が必ず0で標準偏差が1になります。標準偏差は分散(数値データのばらつき)に平方根をつけることによって計算される数値です。

例えば大学生500人の身長分布は平均が175cmとします。身長180cm以上の大学生は全体の何%で、どれくらいいるのか中心(平均)部分を調べるときにガウス分布を使います。

ベイズ法則はある条件下のもとに今後何かが起こる確率を調べることができる

ベイズ則は、ベイズの定理とも呼ばれているもので、ある条件において確率を考えるときに使用します。

例えば箱の中に5枚の紙があって3枚は白、残りの2枚は赤色だったとしましょう。A君が先に箱に入っている紙を引いた後、B君が紙を引きます。このときにA君が赤い紙を引いた後に、B君が赤い紙を引く確率はどれくらいなのか求めるときにベイズ則を使います。

基本的にベイズ則を使用する場合はある事柄が起こった状態でないといけません。前提条件があって、その条件下で次に起こる可能性を調べる計算なので覚えておきましょう。

またベイズ則は、応用が利きやすいという利点があります。条件付きの確率がどのような部分で役立っているのか知っておくと損はありません。

例えばメールサービスを利用していると稀に迷惑メールが送られてきます。迷惑メールをコンピューターが自動的に発見して分類してくれる技術にもベイズ則は使用されています。

過去の受信した迷惑メールの件名に「お買い得」という文字列が入っていたとします。過去の条件から、今後送られてくるメールの件名に「お買い得」の文字が入っていると迷惑メール判定を行い別フォルダに移動をさせます。

また他のキーワードがメールの件名に入っていたときには、最初の「お買い得」のキーワードから更に更新を行い迷惑メールを判定します。条件を付け足すことで学習を行い迷惑メールを見極めるための精度を上げることができます。

深層学習やディープラーニングの基本になるものなので覚えておこう

E資格取得をするのならAIでも使われている確率・統計を学習する必要があります。また一般的な確率分布としてベルヌーイの分布やガウス分布なども学習をしないといけません。

ベイズ則もAIや深層学習において重要なもので、ある条件下で次に起こり得る現象の確率を測定するときに使います。

確率・統計を理解しておけば受験突破率を上げることができるので参考書を活用したり、JDLA(日本ディープラーニング協会)認定講座などでしっかり学習して合格しましょう。