注目キーワード

【人工知能】機械学習の教師あり学習とは?【AI】

教師あり学習とは?

人工知能(AI)の学習(機械学習)は大きく分けて3種類の方法があります。

  1. 教師あり学習(←本記事のテーマ)
  2. 教師なし学習
  3. 強化学習

ビジネスの現場で1番活用されているAIの機械学習の手法は「教師あり学習」で70%を程度と言われています。

また、教師なし学習よりも一般的に高精度で、強化学習よりも一般的に学習速度が早いです。

教師あり学習は、「与えられたデータ(入力)を元に、そのデータがどんなパターン(出力)になるかを識別・予測する」学習方法です。

教師あり学習では、大きく分けて次の2つの問題を解くことがでけいます。

  • 回帰問題
  • 分類問題

回帰問題

回帰問題は連続値を予測する問題のことです。

  • 「過去の売上」から「将来の売上」を予測する。
  • 「過去の株価」から「将来の株価」を予測する。
  • 「体型と生活習慣」などから「寿命」を予測する。

回帰問題の予測は数値で表すことができます。

分類問題

分類問題はカテゴリ分けを行い、どのカテゴリに分類されるか予測する問題のことです。

  • 動物の写真を見て「犬」か「猫」を分類する。
  • レントゲンに映っている影が「炎症」か「がん」かを判定する。
  • 声から「男性」か「女性」を判断する。

分類問題の予測どのカテゴリに当てはまるかを選択することになります。

教師あり学習の手法

教師あり学習をするための手法はいくつかあります。手法ごとにメリットとデメリットがあるので、何をするかによって採用する手法は変わってきます。

どの手法を試せばよいか分からない時は、複数の手法を試して良い結果が得られた手法を採用することになります。

ニューラルネットワーク

ニューラルネットワークは「回帰問題」と「分類問題」のどちらでも使うことができるモデルです。現在、最も人気のある手法の1つです。

この手法は人間の脳の中の構造を模擬したアルゴリズムです。

ニューラルネットワーク

ニューラルネットワーク
引用:https://ja.wikipedia.org/wiki/ニューラルネットワーク

表現力が非常に高いので複雑な問題も解くことが可能です。

ただし、学習には少なくとも1万以上のデータが正確な予測が困難です。

用途は何でも使うことができます。画像認識や音声認識などの複雑な問題にも対処することができます。

ランダムフォレスト

ランダムフォレストは「回帰問題」と「分類問題」のどちらでも使うことができるモデルです。現在、よく使われる手法の一つです。

学習データから特徴量をランダムに選び出し、複数の決定木を作成します。各決定木の結果から多数決で最終的な結果を予測します。

決定木とは
決定理論の分野において 決定を行うためのグラフであり、計画を立案して目標に到達するのに用いられる。 決定木は、意志決定を助けることを目的として作られる。 決定木は木構造の特別な形である。
特徴としては、予測に対して重要項目の順位をつけることができます。
用途は比較的幅広く使うことができます。

サポートベクターマシーン

サポートベクターマシンは、「回帰問題」と「分類問題」のどちらでも使うことができるモデルです。

各データ点との距離が最大となるような境界線を求めることでパターンの分類を行うことができます。

ディープラーニングが考えられる前は人気のある手法の1つでしたが、最近は少しずつ利用が減ってきています。

サポートベクターマシーン
H3 は二つのクラスのいくつかの点を正しく分類していない。
H1 と H2 は二つのクラスのいくつかの点を分類するのに、H2 が H1 よりもっと大きいマージンを持って分類することを確認することができる。

サポートベクターマシン
引用:https://ja.wikipedia.org/wiki/サポートベクターマシン

扱うデータが高次元であるため、データ数が多いと計算に時間がかかるという問題があります。

しかし、ランダムフォレストと同様に幅広い用途で利用することができます。

線形回帰

線形回帰は「回帰問題」のためのシンプルな学習モデルです。線形は雑に言ってしまうと「グラフが直線になる」関数です。

教師あり学習でよく使われるモデルとしては、線形回帰に正則化項というものを加えた次の2つがよく使われます。

  • ラッソ回帰
  • リッジ回帰

線形回帰の特徴としては「単純なデータ」で高精度で予測ができることです。

ロジステック回帰

ロジスティック回帰は「分類問題」に用いる駿府ルナ学習モデルです。

シグモンド関数をモデルの出力(予測)に使います。シグモンド関数は任意の値を0~1に写像する関数で、例えば、出力値が0.5以上なら「OK」0.5以下なら「NG」と設定しておけば分類することができます。2種類より多い分類を行いたい場合は、ソフトマックス関数を用います。

シグモンド関数

シグモンド関数
引用:https://ja.wikipedia.org/wiki/シグモイド関数

ロジスティック回帰の特徴は「単純なデータ」で高精度で分類ができることです。

まとめ

いかがでしたでしょうか?

今回は少しAIの専門的な話となりましたが、実際にAIをビジネスに導入するためには基礎知識として知っておく必要があります。

どのような原理でAIが学習するのかを理解できれば、スムーズに導入・活用ができるようになります。

概要が理解できれば、AIを導入・活用するのに必要なことも理解ができスムーズに進めることができるでしょう。