機械学習には教師あり学習、教師なし学習、強化学習の3種類があります。
今回はそれぞれの意味とプラントでの使い方について解説します。
そもそも機械学習とは
今まではデータと条件を入力し判断させていました。
これをルールベースと呼びます。
一方で機械学習はデータと答えを入力して条件から考えさせます。
人が教えなくても自動的に機械が条件を学習するため機械学習と呼ばれます。
機械学習の分類
ここから教師あり学習、教師なし学習、強化学習それぞれについて解説します。
教師あり学習
教師あり学習は判断材料データと判断結果データを与え、それらの関係性を学習させます。
判断材料データは特徴量と呼ばれます。
特徴量は製造温度、流量、圧力、材料性状、製造時間など何でも使用可能です。
他にも設備から出る音や電流値なども重要なデータです。
また判断結果データは密度○○ g/cm3のように数値だけではなく品管OK/NGのような2値でも使用可能です。
2値の場合はダミー変数に変換することで利用できるようになります。
プラントにおいては以下のような使用例が挙げられます。
教師なし学習
教師なし学習は判断結果データを与えず判断材料データ(特徴量)のみを与え、データの特徴を学習させます。
判断結果データが1種類ばかりの場合、学習したのと違う状況を検知する用途で有用です。
プラントにおいては以下のような使用例が挙げられます。
強化学習
強化学習はある操作に対する結果に点数(報酬)をつけ、その点数が最大になるような条件を学習させます。
教師あり学習、教師なし学習とは少し違った考え方です。
よく大量の製造条件からコストを最小化するような条件を導き出すようなときに活用されています。
特に強化学習は近年プラントの自動制御運転に応用されています。
例えば横河電機とJSRは蒸留塔を35日間に渡り自動運転することに成功しました。
その他にもいくつかAIを使った事例はあり、以下の記事で解説しています。
ディープラーニングはどの分野?
かなり有名になった言葉としてディープラーニング(深層学習)が挙げられます。
これは先に挙げた3つの分野のどこに属するのでしょうか?
実は、ディープラーニングは3種類すべての学習に使用される更に細かい要素の1つです。
それを表すように、例えば深層強化学習という言葉もあります。
そこにAIも併せて「AIの要素として機械学習があり、機械学習の要素としてディープラーニングがある」 と表現することができます。
AI、機械学習、ディープラーニングの違いについては以下の記事で解説しています。
オススメ書籍
・データ分析のための数理モデル入門
データ分析で用いられる様々な手法が紹介されており、それぞれが表す意味をよく理解できます。
どのような手法があるのか体系的に学んでおきたいときにオススメの書籍です。
-
データ分析のための数理モデル入門 本質をとらえた分析のために
www.amazon.co.jp
・化学のためのPythonによるデータ解析・機械学習入門
データ分析に必要な最低限の知識を解説したうえで、化学プラントで得られるデータの扱い方が紹介されています。
脱ブタン塔や排煙脱硝装置を例に取り上げられておりイメージしやすくなっています。
-
化学のためのPythonによるデータ解析・機械学習入門
www.amazon.co.jp
・化学、化学工学のための実践データサイエンス
化学プロセスで得られるデータの前処理や変数選択、可視化、機械学習と1冊で体系的に学べる書籍です。
少しデータ分析を実施したことがある中級者向けの書籍ですが、化学はじめプロセス製造に携わる方なら是非とも読んでおきたい書籍です。
-
化学・化学工学のための実践データサイエンス ―Pythonによるデータ解析・機械学習
www.amazon.co.jp
まとめ
今回は機械学習の分類とプラントでの使い方について解説しました。
まずは違いと使い道を理解したうえで、どこかで使えないか考えてみてはいかがでしょうか。
教師あり学習で取り上げたダミー変数の作り方については以下の記事で解説しています。