目次
機械学習とは、コンピューターがデータを分析する方法の1つでMachine Learning(=ML)とも呼ばれています。大量のデータを学習する際に、一定のルールやパターンを見つけ出し、今回と同じような課題に直面した際に以前学習したルールやパターンを用いることでより良い予測や判断をすることができます。
人間も過去の経験や傾向から次を予測することができますが、コンピューターが処理する情報量は人間の比ではありません。そして一度記憶したルールやパターンは忘れることがありませんので、過去何十年分のデータ分析や予測は私たちの生活を助けてくれています。
機械学習の種類
機械学習の手法を大きく分けると「教師あり学習」と「教師なし学習」、「強化学習」の3種類があります。これらは目的や扱うデータ、効率良く学習させるためにも適切に使い分ける必要があります。
教師あり学習
教師あり学習は、人間が事前に正解のデータ(ラベル)を入力し、その正解のデータと比較して正しいかどうかを判断させます。その特性上、コンピューターにとって判断基準が明確であるため、「正しいか、間違っているか」の問題を解決するのに適しています。また、教師あり学習のアルゴリズムとしては、「回帰」と「分類」が代表的なものになります。
教師なし学習
教師あり学習と対をなすのが「教師なし学習」です。明確な答えがあった教師あり学習に対して、教師なし学習には答えがありませんので「教師なし」といわれています。そのため、AI自身で答えを見つける必要がありますが、AIが答えを見つけるという高度な処理はできません。そこでAIは与えられたデータに対して規則性や法則性を見つけようとします。明確な答えがないデータ群に対し、規則性や法則性を探すときに教師なし学習を使います。規則や法則によってカテゴライズする際のアルゴリズムの代表的なものとして「次元削減」と「クラスタリング」があります。
強化学習
教師あり学習、教師なし学習は基本的に人間がデータの入力や一定の指示を出していました。それに対し、強化学習は人間が報酬(目標)を指定すると、コンピューター自身が最大限の報酬を得られるよう自律して判断・試行錯誤を繰り返します。ということで、強化学習はコンピューター自身が試行錯誤を繰り返し、最適なシステムを見つけ実現する手法のことをいいます。
では、強化学習の流れについて説明します。
強化学習の流れ
①プロセスー1
動作するコンピュータ環境を用意します。
②プロセスー2
目標を設定します。言い方を変えれば、報酬を決めます。
③プロセスー3
どのアルゴリズムを使うかを選択・決定します。
④プロセスー4
準備したコンピュータが検証を開始します。
このように、かなり大まかな流れになりますが、教師あり学習、教師なし学習と比較すると人間が介入する工程が少ないことがわかります。この検証によって明らかになった結果や、試行錯誤した経験はコンピューターの中で蓄積されていきますので、次回似たような課題に直面した場合は前回の経験を活かした検証をおこないます。これらを繰り返していくことで検証の速さや精度が向上していき、様々な場面で活躍することができます。
ということで、この強化学習自体は元々あった手法ですが、後述するディープラーニングと併用することで性能も精度も飛躍的に上昇したため、再度注目を集めている手法です。
代表的な機械学習のアルゴリズムについて、紹介します。機械学習には教師あり学習、教師なし学習、強化学習と3つの手法があり、それぞれで用いるアルゴリズムが存在します。その中でも、現在主流になっているのは
★ニューラルネットワーク
★ディープラーニング
の2つです。その他にも、代表的なアルゴリズムとして以下のアルゴリズムががピックアップされています。モデルが軽量で解釈しやすいことから、ケースによって使い分けられています。
★k近傍法
★決定木
★ランダムフォレスト
★XGBoost
★サポートベクトルマシン
ニューラルネットワーク、ディープランニングについては次回、または次々回の予定です。
[…] 機械学習 ニューラルネットワーク ディープランニング その1 […]
[…] 機械学習 ニューラルネットワーク ディープランニング その1 […]