教師あり学習とは?具体例を挙げてわかりやすく解説!
こんにちは!
現役Webエンジニアの今井(@ima_maru)です。
今回は、機械学習の手法の「教師あり学習」について解説していこうと思います。
教師あり学習は機械学習の手法の1つであり、よりイメージしやすい学習方法だと思います。
そんな教師あり学習について、以下のようなことを解説します。
- 教師あり学習とは
- 教師あり学習の特徴
- 教師あり学習の具体例・活用例
- 教師あり学習と教師なし学習との違い
- 教師あり学習と強化学習との違い
それでは見ていきましょう。
教師あり学習とは?特徴を紹介!
教師あり学習(Supervised Learning)とは、その名の通り「教師データのある学習方法」で、機械学習の手法の1つです。
教師あり学習の特徴①:人間がAIに教えるスタイル
教師あり学習は、人間がAIに教えるような学習方法をとります。
そのため、教師あり学習の主な目的は「意図した働きをするAIを作る」ということになるでしょう。
逆に、教師なし学習や強化学習は、AIが自ら学ぶイメージに近いと思います。
教師あり学習の特徴②:教師データが必要になる
教師あり学習では、学習の際に教師データというものが必要になります。
「教師データ」とは何かというと、正解ラベルの付いたデータというように言われます。例えば、
- 「犬の画像」+「これは犬です」
- 「猫の画像」+「これは猫です」
このように、正解ラベルとデータがセットになったデータのことです。
教師あり学習の特徴③:学習用に大量の教師データが必要になる場合も
教師あり学習は、学習の際に大量の教師データが必要になる場合が多いです。(ディープラーニングなど)
教師データ数が十分でないと、AIがデータの特徴量などをうまく抽出できなかったり、特定の特徴量に過敏に反応してしまったりするようになりうまく機能しません。
例えば、犬の画像1枚を教師データとして学習させても、よほど似ている画像しか犬と判別できません。
もしくは、その画像と似ているただの背景画像などを犬と判別してしまうこともあります。
では、大量の犬の画像を教師データとして学習したらどうなるでしょうか。
この時、AIは大量の画像に共通する特徴量を抽出し学習します。
そのため、犬種や角度違い、背景などを考慮しつつ、犬が写っている画像を判別できるようになるのです。
教師データの不足に対応するために、教師データを水増しする技術もあります。
教師あり学習の特徴④:あらかじめ正解がわかっていないといけない
教師あり学習は、かみ砕いていえば、あらかじめ正解がわかっているデータを学習させる方法です。
そのため、人間が気付かない関係性を見出すような分析系のタスクには向いていません。(そういったものは教師なし学習が有効)
教師あり学習の特徴⑤:学習と予測から成り立つ
教師あり学習は、教師データによる学習を終えた後に、正解ラベルのない未知のデータを入力し予測するという使い方をします。
要は、学習が終われば、正解ラベルのない画像も判断できる(予測できる)ようになるということです。
教師あり学習の具体例や活用例を7個紹介!
教師あり学習の枠組みが分かったところで、実際に「どのようなことを行うのに適しているか?」「どんな活用事例があるのか?」についてみていきましょう。
- 画像認識
- 音声認識
- 機械翻訳
- 自然言語処理
- 株価予測
- 故障品の検知・異常予測
- 迷惑メールのフィルタリング
教師あり学習の具体例①:画像認識
画像認識とは、画像の中に何が写っているのかをコンピュータに判別させる技術です。
コンピューターからすると画像データはただの画素値の羅列でしかありませんが、画像認識の技術を用いれば、そこに何が写っているのかを判別することができるようになります。
例えば、カメラによる物体検知や文字認識(OCR)は教師あり学習による画像認識技術として有名です。
物体検知であれば、物体の写真と物体の名称のセットを大量に学習させます。そして、学習後のモデルに新しい写真を見せると、その物体が何であるかを検知するようになります。(教師なし学習による物体検知もあります)
まだまだ発展途上の技術ではありますが、がん細胞の検出や不良品の検出など、さまざまな分野で人間の目よりも高い性能を発揮するなど、今後の活躍に目が離せない技術です。
教師あり学習の具体例②:音声認識
音声認識とは、人間の声などをコンピューターに認識させる技術です。
話し言葉をテキストデータに変換したり、話している人が誰なのかを判別したりします。
例えば、スマートスピーカーとして有名なAmazonの「Alexa」にも、教師あり学習による音声認識技術が使われています。(半教師学習なんてものもあるらしい)
教師あり学習の具体例③:機械翻訳
機械翻訳とは、言語の翻訳をコンピュータにより行う技術です。
例えば、Google翻訳やDeepL翻訳などに教師あり学習による機械翻訳技術が使われています。
教師あり学習の具体例④:自然言語処理
自然言語処理とは、人間が話す言語をコンピュータに処理させる技術の総称です。
音声認識や機械翻訳との関係が深い技術であり、AI技術の中でも特に注目を集めている技術の1つです。
詳しく知りたい方は、以下の記事をご覧ください。
教師あり学習の具体例⑤:株価予測
株価予測とは、その名の通り将来の株価を予測することです。
過去のデータを学習データとして使えるため、教師あり学習が活用できます。
株価のみならず外国為替(≒FX)などにも適用できるため、FXの自動売買ツールにこの技術が使われてることも多いですね。
また、証券会社も機械学習による株価予測を活用しています。
AIを使って株価予測をする仕組みは以下の記事で解説しています。
教師あり学習の具体例⑥:故障品の検知・異常予測
教師あり学習は、故障品の検知や異常予測にも使われています。
ですが、過去の故障品とは全く異なる故障や異常の場合、それらを検知することは難しいですし、十分な故障品のデータを集めることも難しい場合があるでしょう。
そのため、故障品の検知においては、教師データの要らない教師なし学習が使われることもあるため注意が必要です。
教師あり学習の具体例⑦:迷惑メールのフィルタリング
教師あり学習は、迷惑メールのフィルタリングにも使われています。
過去の迷惑メールを教師データとして学習させることで、新しいメールに対して迷惑メールなのかそうでないのかを判別することができるようになります。
教師あり学習と教師なし学習と強化学習の違いとは?
最後に、教師あり学習・教師なし学習・強化学習の違いざっくりと説明して終わります。
手法 | 概要 |
---|---|
教師あり学習 | 正解ラベルの付いたデータを学習する |
教師なし学習 | 正解ラベルのないデータを学習(分析)する |
強化学習 | 現在の状況から将来的に一番価値のある行動を選択するように学習する |
それぞれ、学習させる方法が明確に違います。
まず、教師あり学習と教師なし学習は、正解ラベルの付いたデータを学習させるのかさせないのかの違いがあります。
教師あり学習は、正解ラベルの付いたデータを学習させる、「人間がAIに教える」パターンです。その学習工程において、人間が意図した出力をAIが出せるように調整します。
一方、教師なし学習は、正解ラベルの付いたデータが必要ありません。AIがデータを、いくつかの似ているもののグループに分けたり、重要な情報を見つけ出したりします。
つまり、「AIが人間に気づかせてくれる」パターンといってもよいかもしれません。
実際、人間が見つけられないような隠れた本質的な部分をAIは見つけ出してくれます。なので、分析・マーケティングの分野で多く用いられています。
そして、強化学習は、少し異色の存在です。
その学習方法は、「報酬」によって説明され、より多くの報酬を得られるような行動をAIが学習していきます。
強化学習だけは、説明がぱっとできるものではないので、興味のある方は以下の記事をご覧ください。
最後までお読みいただきありがとうございます。