本記事では、言語モデル「GPT-4(英語)」について詳しく解説しています。
※出典は基本的に明記していますが、開発が海外のため日本語に対応していない場合があります。
※リンク先の情報は変更される場合があります。
GPT-4とは
GPT-4(ジーピーティーフォー、Generative Pre-trained Transformer 4)は、人工知能を研究し展開するアメリカ合衆国カリフォルニア州サンフランシスコの会社Open AIによって開発された言語モデルです。
「GPTの第4世代で、NLPタスクにおいて、高い性能を示すことで有名です。」とGPT-4が搭載されたChat GPTは、回答を生成しています。
現在、GPT-4は、ChatGPTとAPIで利用可能です。
ただし、GPT-4を利用するためには、ChatGPT Plus(月20ドル)に加入する必要があり、利用に制限があります。具体的には、ChatGPT(GPT-4)は、3時間ごとに25件のメッセージの上限※があります。
API(Application Programming Interface)は主に開発者向けに設計されているため、一般ユーザーが直接利用することはほとんどありません。
※2023年3月31日時点
※当初100件/4時間のメッセージ上限が、25件/3時間に変更
2023年3月9日にドイツのイベントで発表
マイクロソフトドイツのCTOであるAndreas Braun(アンドレアス ブラウン)氏が、報道機関Heise が出席してドイツで開催されたAi in Focus – Digital Kickoff イベント(ドイツ語)で2023年3月9日に発表しました。
「来週GPT-4を紹介します。そこでは、ビデオなど、まったく異なる可能性を提供するマルチモーダルモデルがあります」
以下、GPT-4についてイベントでの発言をまとめたものです。
- マルチモーダルモデルAI
- 基本的に全ての言語で機能する
- 顧客のデータを利用してモデルをトレーニングしていない ※後述
「Chat GPT-4は、テキストだけでなく動画を提供し、ドイツ語で質問してイタリア語で回答を得ることができるなど、ゲームチェンジャー(世の中の動向を大きく変える)存在になる」とAndreas Braun氏はイベントで語ったと上記の記事で紹介されています。
Chat GPT(GPT-4)はGPT-4について正確に答えることができない
驚くべきことに、GPT-4が搭載されたChat GPT(GPT-4)は自身について正確に答えることができません。
なぜなら、「GPT-4の知識は2021年9月までのものであり、その時点ではGPT-4が存在しないから」です。
よって、Chat GPT(GPT-4)は、最新の話題について古いデータをもとに推測をするという手法で回答を生成します。
GPT-4関連用語
GPT-4に関連する用語をまとめています。
マルチモーダルAI
マルチモーダルAIとは、ビデオ、画像、音声など、複数の種類の入力内で動作できることを意味します。
参照:OpenAI GPT-4 Arriving Mid-March 2023
言語モデル
言語モデリング(LM)は、様々な統計的および確立論的手法を使用して、特定の一連の単語が文内で発生する確率を決定します。言語モデルは、テキストデータの本体を分析して、単語予測の基礎を提供します。
つまり、言語モデルは、与えられたテキストデータの本体を分析して、単語予測の基礎を提供します。
分かりやすく言うと、「人間の言語を分析し、単語が文内で出現する確率を用いてモデル化したもの」が言語モデルです。
NLPタスク
自然言語処理は、機械をトレーニングしてテキストや音声を理解し、翻訳、要約、分類、抽出などの自動化されたタスクを実行することで、言語ベースのデータを分析してやり取りする方法を変革しています。
参照:Natural Language Processing (NLP): What Is It & How Does it Work?
分かりやすく言うと、NLP(自然言語処理)とはコンピューターが人間が使う言語(自然言語)を理解し、処理する技術のことです。
これによって、コンピューターは文章を読んだり、書いたり、話したり、聞いたりすることができます。
GPT-4についてよくある質問
GPT-4についてよくある質問をまとめています。
GPTの後ろの数値は何?
GPTの後ろの数値は、言語モデルのバージョンで、数値が高いほど性能が高くなります。
GPT-4の性能について、数値では言及されていません。 ※2023年3月15日時点
つまり、パラメータ数を公開していません。
以前、いくつかのメディアでGPT-4は100兆個のパラメータを持つと報じられましたが、OpenAIのCEOであるサム・アルトマンは、それらに関する噂をTwitterで見て「GPT-4.0の噂はばかげているようです」とStrictlyVC とのインタビューでコメント(Youtube、英語)しています。
過去のバージョンについて興味がある方は、「GPT-3.0とGPT3.5の違い」を併せてご覧ください。
顧客のデータを利用してモデルをトレーニングしていないとは?
Chat GPTについてよくある質問によると、調査パートナーのOpen AIには適用されない(2023年3月15日時点)
私の会話をトレーニングに使用しますか?
翻訳:ChatGPT General FAQ | OpenAI Help Center
はい。 あなたの会話は、システムを改善するために AI トレーナーによって確認される場合があります。
つまり、Chat GPTに入力した文章は、第三者に確認される場合があります。
インサイダーが見た同社からの内部通信によると、アマゾンの弁護士は従業員にAIチャットボットとコードを共有しないように促した。
参照:Amazon Warns Employees to Beware of ChatGPT
GPT-4の性能は?
Open AIの説明は、下記の通りです。
- GPT-4 は、これまで以上に創造的で協力的
- 曲の作曲、脚本の執筆、ユーザーの執筆スタイルの学習など、創造的および技術的な執筆タスクを生成、編集、および反復することができる。
- GPT-4 は、画像を入力として受け入れ、キャプション、分類、および分析を生成可能
- GPT-4 は 25,000 語を超えるテキストを処理できるため、長い形式のコンテンツの作成、拡張された会話、ドキュメントの検索と分析などのユース ケースが可能。
より詳しくは、GPT-4(英語)をご覧ください。
GPT-4は安全に使える?
Open AIに記載されている内容をまとめると、下記3点から、前のバージョンより安全性やセキュリティが高くなっています。
- 人間的なフィードバックを取り入れ、専門家と協力
- 実世界での使用から得た教訓をGPT-4の安全研究および監視システムに適用
- GPT-4 の高度な推論機能と指示に従う機能により、安全作業が迅速化
それぞれ公式情報をもとに紹介しています。
人間のフィードバックによるトレーニング
GPT-4 の動作を改善するために、ChatGPT ユーザーから送信されたフィードバックを含む、より人間的なフィードバックを取り入れました。 また、AI の安全性やセキュリティなどの分野で早期にフィードバックを得るために、50 人を超える専門家と協力しました。
50人を超える専門家は誰かは記載されていませんでした。
実際の使用からの継続的な改善
以前のモデルの実世界での使用から得た教訓を、GPT-4 の安全研究および監視システムに適用しました。 ChatGPT と同様に、GPT-4 はより多くの人が使用するように定期的に更新および改善されます。
GPT-4 を利用した安全性研究
GPT-4 の高度な推論機能と指示に従う機能により、安全作業が迅速化されました。 GPT-4 を使用して、モデルの微調整用のトレーニング データを作成し、トレーニング、評価、モニタリング全体で分類子を反復処理しました。
Chat GPTとGPT-4の違いは?
Open AIの説明は下記の通りです。
GPT-4はより高度な推論機能を持つ
GPT-4 は、高度な推論機能で ChatGPT を上回ります。
公式サイトでは、具体例として、以下の文章が紹介されています。
Andrew は午前 11 時から午後 3 時まで、Joanne は正午から午後 2 時まで、その後は午後 3 時 30 分から午後 5 時まで無料です。 Hannah は正午に 30 分間、その後は午後 4 時から 6 時までご利用いただけます。 Andrew、Hannah、および Joanne の 30 分間の会議の開始時間のオプションはどれですか?
インプット(質問文)
Chat GPT | GPT-4 | |
生成された回答 | それらの可用性のリストは次のとおりです。 アンドリュー: 午前 11 時~午後 3 時 ジョアン:正午~午後2時、午後3時30分~午後5時 ハンナ: 正午から午後 12 時 30 分まで、午後 4 時から午後 6 時まで 空き状況に応じて、午後 4 時から午後 4 時 30 分まで、3 つすべてを利用できる 30 分間のウィンドウがあります。 したがって、会議は午後 4 時にスケジュールできます。 | アンドリュー: 午前 11 時~午後 3 時 ジョアン: 午後 12 時~午後 2 時、午後 3 時 30 分~午後 5 時 ハンナ: 午後 12 時~午後 12 時 30 分、午後 4 時~午後 6 時 30 分間の会議の一般的な空き時間: 午後 12 時~午後 12 時 30 分 |
回答が簡潔になっているのが分かります。
GPT-4は模擬司法試験の結果がChatGPTよりも優れている
また、Open AIは下記のように説明しています。
GPT-4 は、受験者の間でより高いおおよそのパーセンタイルで得点することにより、ChatGPT よりも優れています。
具体的にどの程度スコアが変わるかも記載されています。
たとえば、模擬司法試験に受験者の上位 10% 程度のスコアで合格します。 対照的に、GPT-3.5 のスコアは下位 10% 前後でした。
GPT-3.5とGPT-4の違いは?
Open AIは、GPT-3.5とGPT-4の違いについて下記のように説明しています。
カジュアルな会話では、GPT-3.5 と GPT-4 の違いは微妙です。
タスクの複雑さが十分なしきい値に達すると、違いが現れます。GPT-4 は、GPT-3.5 よりも信頼性が高く、創造的であり、はるかに微妙な指示を処理できます。
つまり、一般的な内容に使う場合は、違いが分かりにくいと言えるでしょう。
GPT-4はいつリリースされた?
Andreas Braun氏の発言によると、GPT-4は2023年3月16日までにリリース予定です。
→ GPT-4(英語)は、2023年3月14日にリリースされました。
しかし、GPT-4のテキスト入力機能が搭載されたChat GPTは、現在満員で繋がらない場合があります※。
※制限あり、詳しくは関連記事「ChatGPT (GPT-4)を始める前に知っておいた方がいいこと」で解説
ChatGPT と API を介して GPT-4 のテキスト入力機能をリリースしています (待機リストあり)。 より広く利用できるように画像入力機能を準備するために、1 つのパートナーと緊密に協力して開始します。 また、AI モデルのパフォーマンスを自動評価するためのフレームワークである OpenAI Evals をオープンソース化しており、誰でもモデルの欠点を報告してさらなる改善を導くことができます。
まとめ
最後に、本記事の内容を箇条書きでまとめています。
- GPT-4(ジーピーティーフォー、Generative Pre-trained Transformer 4)は、人工知能を研究し展開するアメリカ合衆国カリフォルニア州サンフランシスコの会社Open AIによって開発された言語モデル
- 2023年3月14日リリース、GPT-4のテキスト入力機能が搭載されたChat GPTで利用可能
- GPT-4が搭載されたChat GPT(GPT-4)は自身について正確に答えることができない
- 詳しいスペックは明らかにされていないが、テキストだけでなく動画を提供し、言語の壁を超えて回答する
- 顧客のデータを利用してモデルをトレーニングしていないとOpen AI公式サイトに記載がある
詳しくは、本文をご覧ください。
AI関連記事
-
スマホ
「Google Pixel 8」が10月12日発売!搭載されているAI機能
-
テクノロジー
【速報】Chat GPT 日本語版で利用可能な「アルファ」がスタート
-
デザイン
機能が豊富!AIいらすとやレビュー。率直な感想7つ
-
テクノロジー
Google Bard の最新機能![G]ボタンとは?使い方を解説
-
ブログ
AIの創造力は人間を上回るのか?身体性を伴う先に待つ未来
-
テクノロジー
Google 検索で生成AIを使うには?SGE利用に必要なものと利用手順
-
テクノロジー
Adobeの生成AI「Adobe Firefly」の料金プランと機能を解説
-
テクノロジー
MLモデル(機械学習モデル)とは?アルゴリズムの具体例
-
テクノロジー
反実仮想機械学習とは?メリット・デメリット