最強のアシスタント!!ChatGPTについて調べてみた

2023年1月31日

広告を含みます





ChatGPTの基本情報

ChatGPT大量の文章を学習し新たな文章が生成できるようになったAIツールで、チャットボットに該当します。

とにかく会話形式で何でも助けてくれる代物です。

その文章がよく出来過ぎてて人とやり取りしている感覚があります。

ChatGPTはOpenAIによって開発されました。

ChatGPTの利用画面

ベースの学習モデルはGPT-3

ChatGPTのベースはGPT-3というOpenAIが開発した自然言語処理用のAIモデルです。

正確にはGPT-3.5が使われています。

GPT-3は570GB以上の文章と1750億個のパラメータをもつモデルで、要は桁違いに膨大な文章を学習したAIです。

ただし学習にはインターネット上のデータを利用しており、学習データに差別的・暴力的な表現が含まれることも多々ありました。

それを解決するためにInstructGPTが利用されています。

InstructGPTの活用

GPT-3の不適切表現を是正するためにRLHF(Reinforcement Learning from Human Feedback) という手法が用いられています。

簡単に説明すると、人間がGPT-3の生成する文章に対してOK/NGをフィードバックすることで、正しい表現をするように学習させる手法です。

これは強化学習に該当します。

大きく以下の3つの流れを繰り返すことで学習していきます。

  1. GPT-3が生成した文章に対して理想の表現をフィードバックする
  2. GPT-3が同じテーマで生成した複数の文章に対して善し悪しの順位をフィードバックする
  3. フィードバック内容を基に再学習する
ChatGPTのフィードバック方法(OpenAIより参照

(補足)自然言語処理モデルTransformer

ChatGPTのベースモデルとなるGPT-3のGPTはGenerative Pre-trained Transformerの略で、3は2018→2019→2020年と発表し3代目を表します。

そのGPTのうちT(Transformer)が鍵となる部分です。

せっかくなのでChatGPTに解説してもらいました。

Transformerは、自然言語などの連続データを処理するために使用されるニューラルネットワークのアーキテクチャの一種です。2017年の論文「Attention is All You Need」で導入され、その後多くのNLPタスクで広く使用されるようになりました。Transformerアーキテクチャは、入力シーケンスを処理するために自己注目メカニズムを使用し、再帰や畳み込みを使用しないため、並列計算に適しています。

ChatGPTより生成

人間の文章は単語同士に繋がりがあったり、単語の省略があったりと少々機械には扱いが難しい領域です。

Transformerが出現するまでは再帰構造(RNN)や畳み込み構造(CNN)といった別の手法が用いられており、過去の情報との依存関係を学習していました。

ただし計算時間がかかったり長い文章に対応できなかったりと課題もありました。

対してTransformerは文章中の各単語同士の関係の強さを学習しており、並列計算も可能なことから速いのに精度が高いという圧倒的な性能をもちます。

Transformerの専門的な解説はアイシア=ソリッドさんの説明が分かりやすいです。

ここが凄い!

これまで使った中で、個人的に良いと思った部分をまとめました。

チャット形式

"Chat"GPTという名前の通り、チャット形式で会話しながらAIを利用できます。

また一連の会話を覚えており、まさに会話をするように不自由なくやり取りすることができます。

聞けば大抵のことは答えてくれる

キャビテーション、応力腐食割れ、MCCBなど様々なジャンルで文章を打ち込んでみました。

Google検索よりも圧倒的に早い速度で回答が得られます。

ただし後述しますが、ごく自然に誤った内容が混ざっているため鵜呑みにはできません。

それでもGoogle検索する際の単語に目星がつくため非常に有用です。

プログラミングは相当頼りになる

やりたい操作に加え「Pythonでの書き方」や「VBAでの書き方」などを付け加えることでみるみるうちにコードが生成されていきます。

実はPLCについても試した方がいらっしゃいまして、ST言語なら自動化できるかもしれません。

その他にもラダーを試していますが、それは難しそうでした。

ただしPLCのプログラムはインターネット上に公開されている情報が少なく、ChatGPTが学習するのにも時間がかかりそうです。

文章の要約や翻訳はお手の物

かなりの長文を入力しても「要約して」と伝えればすぐに要約してくれます。

「日本語で」と伝えれば英語の文章もすぐに翻訳してくれます。

更に文章の誤りも指示してくれるようで、特に多くの方々が英語学習において活用できると述べています(例:ChatGPTを英語学習に活用してみた)。

利用にあたっての注意点

ChatGPTは最強の能力をもつ反面、中身を理解し使い方に注意しないと痛い目を見る可能性があります。

機密情報は絶対に入力しないように!!

入力されたデータは今後のChatGPTの学習に使われます。

絶対に機密情報を入力してはいけません。

ChatGPTに何かを入力するということは、それが世界中に公開されることを意味します。

既に生成されるプログラムコードの中にはAmazonの機密情報に近いような内容も生成されている模様です。

アマゾン社員が業務でChatGPTを利用する事案が発生。

情報ソースが分からない

ChatGPTは毎回Google検索しているわけではなく、あくまでも学習した言語データの中から、それらしい文章を作り上げているに過ぎません。

回答の中に間違ったデータも当然含まれ、個人的には”堂々と知ったかぶりをする人”という印象です。

得られた回答を鵜吞みにせず、必ず「本当にそれが正しいのか?」と疑わなければなりません。

そのためChatGPTから出力される内容に対し、ある程度の知識を持つ人にとっては有用であると考えられます。

学習データには偏りがある

ChatGPTは私たちが利用するデータを活用して更に学習します。

つまり今後は利用者に偏りがあると学習データが偏ってしまう側面があります。

計算は苦手

あくまで自然言語処理のAIです。

簡単な加減乗除も含め計算には向いていません

仮に計算が合っていたとしても、過去の単語から可能性の高い次の単語を生成しているだけに過ぎません。

ただし、計算のためのExcel関数やマクロ、Pythonコードを綺麗に書くことはできます。

また1つの解決策として入力データに表形式を使うことが良いようです。

関連ニュース

ChatGPTに関連するニュースを紹介します。

5日間で100万人登録

公開から5日で登録者数100万人を突破したとOpenAIのサム・アルトマンCEOがツイートしています。

ちなみに維持コストが泣くほどかかっている模様で、いずれ有料化することも示唆しています。

Microsoftが100億ドル投資

MicrosoftはChatGPTを手掛けるOpenAIに100億ドルを投資すると言われています。

実は2019年と2021年にも投資を行っており、継続的に関係を築いています。

OpenAIは他にも画像生成AIツールなども手掛けており、これらAI学習をMicrosoftのクラウドサービスAzureで行うことを発表しています。

また既にAzure上ではOpenAI開発のAIモデルを使える「Azure OpenAI Service」のサービスが提供されています。

マイクロソフト、ChatGPTのオープンAIに複数年で100億ドル投資(ブルームバーグ)

OpenAI and Microsoft Extend Partnership(OpenAI)

Googleが対抗AI「Bard」を発表

2023年2月7日にGoogleからChatGPTに似た会話型AIであるBardが発表されました。

Bardは自然言語処理モデルTransformerが使われているのですが、ベースの学習モデルはGPT-3ではなくLaMDAが使われています。

LaMDAはGoogleが発表したモデルです。

BardはChatGPTと違い2021年以降のデータも含めて学習しています。

しかしBardのプロモーションビデオにおいて、生成された文章に誤りがあることが指摘されました。

これが原因でGoogleの親会社Alphabetの株価が前日から約8%下落しました。

AI の次の重要な一歩

オススメ書籍

・大規模言語モデルは新たな知能か――ChatGPTが変えた世界

ChatGPTを始めとした大規模言語モデルの登場により世の中はどのように変わるのか?
AI研究の第一人者である株式会社Preferred Networks 共同創業者である岡野原さんが解説されています。
専門的でありながらも分かりやすくまとめられた書籍です。

大規模言語モデルは新たな知能か――ChatGPTが変えた世界
大規模言語モデルは新たな知能か――ChatGPTが変えた世界

www.amazon.co.jp

・生成AI導入の教科書

生成AIをどのようにビジネスで活用するか?に焦点を当てて解説された書籍です。
今後AIは作る時代から使う時代へ移っていきます。
技術的に理解しつつも、どのようにビジネスへ利用して効果を上げるか考えるのにオススメです。

生成AI導入の教科書
生成AI導入の教科書

www.amazon.co.jp

・ChatGPT API×Pythonで始める対話型AI実装入門

ChatGPTを用いたアプリケーションを作りたいときはAPIという機能を使います。
APIの仕組みのような基本要素からTwitter botを作る実践の部分まで詳細に分かりやすく解説されています。

ChatGPT API×Pythonで始める対話型AI実装入門(GPT-3.5&GPT-4 対応)
ChatGPT API×Pythonで始める対話型AI実装入門(GPT-3.5&GPT-4 対応)

www.amazon.co.jp







記事への問い合わせはこちら

-データサイエンス