カテゴリ

GPT-4とは何か詳しく解説、2023年3月14日リリース

GPT-4とは

本記事では、言語モデル「GPT-4(英語)」について詳しく解説しています。

※出典は基本的に明記していますが、開発が海外のため日本語に対応していない場合があります。
※リンク先の情報は変更される場合があります。

目次

GPT-4とは

2023/3/16

GPT-4(ジーピーティーフォー、Generative Pre-trained Transformer 4)は、人工知能を研究し展開するアメリカ合衆国カリフォルニア州サンフランシスコの会社Open AIによって開発された言語モデルです。

「GPTの第4世代で、NLPタスクにおいて、高い性能を示すことで有名です。」とGPT-4が搭載されたChat GPTは、回答を生成しています。

現在、GPT-4は、ChatGPTとAPIで利用可能です。

ただし、GPT-4を利用するためには、ChatGPT Plus(月20ドル)に加入する必要があり、利用に制限があります。具体的には、ChatGPT(GPT-4)は、3時間ごとに25件のメッセージの上限があります。

API(Application Programming Interface)は主に開発者向けに設計されているため、一般ユーザーが直接利用することはほとんどありません。

※2023年3月31日時点
※当初100件/4時間のメッセージ上限が、25件/3時間に変更

2023年3月9日にドイツのイベントで発表

マイクロソフトドイツのCTOであるAndreas  Braun(アンドレアス ブラウン)氏が、報道機関Heise が出席してドイツで開催されたAi in Focus – Digital Kickoff イベント(ドイツ語)で2023年3月9日に発表しました。

「来週GPT-4を紹介します。そこでは、ビデオなど、まったく異なる可能性を提供するマルチモーダルモデルがあります」

以下、GPT-4についてイベントでの発言をまとめたものです。

  • マルチモーダルモデルAI
  • 基本的に全ての言語で機能する
  • 顧客のデータを利用してモデルをトレーニングしていない ※後述

「Chat GPT-4は、テキストだけでなく動画を提供し、ドイツ語で質問してイタリア語で回答を得ることができるなど、ゲームチェンジャー(世の中の動向を大きく変える)存在になる」とAndreas  Braun氏はイベントで語ったと上記の記事で紹介されています。

Chat GPT(GPT-4)はGPT-4について正確に答えることができない

2023/3/16

驚くべきことに、GPT-4が搭載されたChat GPT(GPT-4)は自身について正確に答えることができません。

なぜなら、「GPT-4の知識は2021年9月までのものであり、その時点ではGPT-4が存在しないから」です。

よって、Chat GPT(GPT-4)は、最新の話題について古いデータをもとに推測をするという手法で回答を生成します。

GPT-4関連用語

GPT-4に関連する用語をまとめています。

マルチモーダルAI

マルチモーダルAIとは、ビデオ、画像、音声など、複数の種類の入力内で動作できることを意味します。

参照:OpenAI GPT-4 Arriving Mid-March 2023

言語モデル

言語モデリング(LM)は、様々な統計的および確立論的手法を使用して、特定の一連の単語が文内で発生する確率を決定します。言語モデルは、テキストデータの本体を分析して、単語予測の基礎を提供します。

参照:What is Language Modeling?

つまり、言語モデルは、与えられたテキストデータの本体を分析して、単語予測の基礎を提供します。

分かりやすく言うと、「人間の言語を分析し、単語が文内で出現する確率を用いてモデル化したもの」が言語モデルです。

NLPタスク

自然言語処理は、機械をトレーニングしてテキストや音声を理解し、翻訳、要約、分類、抽出などの自動化されたタスクを実行することで、言語ベースのデータを分析してやり取りする方法を変革しています。

参照:Natural Language Processing (NLP): What Is It & How Does it Work?

分かりやすく言うと、NLP(自然言語処理)とはコンピューターが人間が使う言語(自然言語)を理解し、処理する技術のことです。

これによって、コンピューターは文章を読んだり、書いたり、話したり、聞いたりすることができます。

GPT-4についてよくある質問

GPT-4についてよくある質問をまとめています。

GPTの後ろの数値は何?

GPTの後ろの数値は、言語モデルのバージョンで、数値が高いほど性能が高くなります。

GPT-4の性能について、数値では言及されていません。 ※2023年3月15日時点

つまり、パラメータ数を公開していません。

以前、いくつかのメディアでGPT-4は100兆個のパラメータを持つと報じられましたが、OpenAIのCEOであるサム・アルトマンは、それらに関する噂をTwitterで見て「GPT-4.0の噂はばかげているようです」とStrictlyVC とのインタビューでコメント(Youtube、英語)しています。

過去のバージョンについて興味がある方は、「GPT-3.0とGPT3.5の違い」を併せてご覧ください。

顧客のデータを利用してモデルをトレーニングしていないとは?

Chat GPTについてよくある質問によると、調査パートナーのOpen AIには適用されない(2023年3月15日時点)

私の会話をトレーニングに使用しますか?
はい。 あなたの会話は、システムを改善するために AI トレーナーによって確認される場合があります。

翻訳:ChatGPT General FAQ | OpenAI Help Center

つまり、Chat GPTに入力した文章は、第三者に確認される場合があります。

個人情報や会社の機密情報など知られては困る内容について入力する場合は、細心の注意が必要です。
実際、一部の企業では、Chat GPTの利用を禁止しています。

インサイダーが見た同社からの内部通信によると、アマゾンの弁護士は従業員にAIチャットボットとコードを共有しないように促した。

参照:Amazon Warns Employees to Beware of ChatGPT

GPT-4の性能は?

Open AIの説明は、下記の通りです。

  • GPT-4 は、これまで以上に創造的で協力的
    • 曲の作曲、脚本の執筆、ユーザーの執筆スタイルの学習など、創造的および技術的な執筆タスクを生成、編集、および反復することができる。
  • GPT-4 は、画像を入力として受け入れ、キャプション、分類、および分析を生成可能
  • GPT-4 は 25,000 語を超えるテキストを処理できるため、長い形式のコンテンツの作成、拡張された会話、ドキュメントの検索と分析などのユース ケースが可能。

より詳しくは、GPT-4(英語)をご覧ください。

GPT-4は安全に使える?

Open AIに記載されている内容をまとめると、下記3点から、前のバージョンより安全性やセキュリティが高くなっています。

  • 人間的なフィードバックを取り入れ、専門家と協力
  • 実世界での使用から得た教訓をGPT-4の安全研究および監視システムに適用
  • GPT-4 の高度な推論機能と指示に従う機能により、安全作業が迅速化

それぞれ公式情報をもとに紹介しています。

人間のフィードバックによるトレーニング

GPT-4 の動作を改善するために、ChatGPT ユーザーから送信されたフィードバックを含む、より人間的なフィードバックを取り入れました。 また、AI の安全性やセキュリティなどの分野で早期にフィードバックを得るために、50 人を超える専門家と協力しました。

50人を超える専門家は誰かは記載されていませんでした。

実際の使用からの継続的な改善

以前のモデルの実世界での使用から得た教訓を、GPT-4 の安全研究および監視システムに適用しました。 ChatGPT と同様に、GPT-4 はより多くの人が使用するように定期的に更新および改善されます。

GPT-4 を利用した安全性研究

GPT-4 の高度な推論機能と指示に従う機能により、安全作業が迅速化されました。 GPT-4 を使用して、モデルの微調整用のトレーニング データを作成し、トレーニング、評価、モニタリング全体で分類子を反復処理しました。

Chat GPTとGPT-4の違いは?

Open AIの説明は下記の通りです。

GPT-4はより高度な推論機能を持つ

GPT-4 は、高度な推論機能で ChatGPT を上回ります。

公式サイトでは、具体例として、以下の文章が紹介されています。

Andrew は午前 11 時から午後 3 時まで、Joanne は正午から午後 2 時まで、その後は午後 3 時 30 分から午後 5 時まで無料です。 Hannah は正午に 30 分間、その後は午後 4 時から 6 時までご利用いただけます。 Andrew、Hannah、および Joanne の 30 分間の会議の開始時間のオプションはどれですか?

インプット(質問文)
Chat GPTGPT-4
生成された回答それらの可用性のリストは次のとおりです。
アンドリュー: 午前 11 時~午後 3 時
ジョアン:正午~午後2時、午後3時30分~午後5時
ハンナ: 正午から午後 12 時 30 分まで、午後 4 時から午後 6 時まで
空き状況に応じて、午後 4 時から午後 4 時 30 分まで、3 つすべてを利用できる 30 分間のウィンドウがあります。 したがって、会議は午後 4 時にスケジュールできます。
アンドリュー: 午前 11 時~午後 3 時
ジョアン: 午後 12 時~午後 2 時、午後 3 時 30 分~午後 5 時
ハンナ: 午後 12 時~午後 12 時 30 分、午後 4 時~午後 6 時
30 分間の会議の一般的な空き時間: 午後 12 時~午後 12 時 30 分

回答が簡潔になっているのが分かります。

GPT-4は模擬司法試験の結果がChatGPTよりも優れている

また、Open AIは下記のように説明しています。

GPT-4 は、受験者の間でより高いおおよそのパーセンタイルで得点することにより、ChatGPT よりも優れています。

具体的にどの程度スコアが変わるかも記載されています。

たとえば、模擬司法試験に受験者の上位 10% 程度のスコアで合格します。 対照的に、GPT-3.5 のスコアは下位 10% 前後でした。

GPT-3.5とGPT-4の違いは?

Open AIは、GPT-3.5とGPT-4の違いについて下記のように説明しています。

カジュアルな会話では、GPT-3.5 と GPT-4 の違いは微妙です。
タスクの複雑さが十分なしきい値に達すると、違いが現れます。GPT-4 は、GPT-3.5 よりも信頼性が高く、創造的であり、はるかに微妙な指示を処理できます。

つまり、一般的な内容に使う場合は、違いが分かりにくいと言えるでしょう。

GPT-4はいつリリースされた?

Andreas  Braun氏の発言によると、GPT-4は2023年3月16日までにリリース予定です。

GPT-4(英語)は、2023年3月14日にリリースされました。

しかし、GPT-4のテキスト入力機能が搭載されたChat GPTは、現在満員で繋がらない場合があります

※制限あり、詳しくは関連記事「ChatGPT (GPT-4)を始める前に知っておいた方がいいこと」で解説

ChatGPT と API を介して GPT-4 のテキスト入力機能をリリースしています (待機リストあり)。 より広く利用できるように画像入力機能を準備するために、1 つのパートナーと緊密に協力して開始します。 また、AI モデルのパフォーマンスを自動評価するためのフレームワークである OpenAI Evals をオープンソース化しており、誰でもモデルの欠点を報告してさらなる改善を導くことができます。

まとめ

最後に、本記事の内容を箇条書きでまとめています。

  • GPT-4(ジーピーティーフォー、Generative Pre-trained Transformer 4)は、人工知能を研究し展開するアメリカ合衆国カリフォルニア州サンフランシスコの会社Open AIによって開発された言語モデル
  • 2023年3月14日リリース、GPT-4のテキスト入力機能が搭載されたChat GPTで利用可能
  • GPT-4が搭載されたChat GPT(GPT-4)は自身について正確に答えることができない
  • 詳しいスペックは明らかにされていないが、テキストだけでなく動画を提供し、言語の壁を超えて回答する
  • 顧客のデータを利用してモデルをトレーニングしていないとOpen AI公式サイトに記載がある

詳しくは、本文をご覧ください。

AI関連記事

目次