さまざまな企業が、AI技術をさまざまなアイデアや形で存分に活用しています。とくにアメリカのスタートアップ企業「OpenAI」はまさにその筆頭で、ChatGPTをはじめシンギュラリティを感じさせてくれるサービスを次々とリリースし、世界中の人々を驚かせています。
今回の記事は、そんなOpenAIが取り扱うAIモデルである「GPT-3」について紹介したものです。「GPT-3 API」という、他のサービスにGPT-3の機能を組み込める機能の使い方も解説します。
本記事を読むことでOpenAIのサービスの理解を深められ、公私ともに活用の幅が広がるでしょう。
GPT-3とは?
GPT-3とは、OpenAI社が開発・運営を行う言語モデルのバージョン名のことです。「3」という数字は3代目のモデルであることが由来となっており、リリースされたのは2020年6月です。
OpenAIが運営するモデルはGPT-3以降だと、他に
- Moderation
- Codex
- Embeddings
- DALL-E
- GPT-3.5
- GPT-4
といったモデルがリリースされています。
現状モデルでは「GPT-4」が最新
2024年4月現在、OpenAIの言語モデルでもっとも新しいのが「GPT-4」です。GPT-3.5以前に比べて、大きく以下のような進化を遂げています。
- 誤字脱字の軽減
- 複数指示への対応
- 画像や音声データからの文字生成
- 翻訳、コード生成
- 長文会話のやりとりの実現
またGPT-3.5までは無料で使うことができますが、GPT-4を使う場合はChatGPTの有料プラン「ChatGPT Plus」に登録しなければなりません。
GPT-3の特徴・強み
GPT-3の特徴や強みは多岐にわたります。この章では、以下の3つに絞ってご紹介します。
- 膨大なパラメータ数による精度の高さ
- 圧倒的なデータ処理スピード
- API活用でAI機能を自身のサービスに組み込める
膨大なパラメータ数による精度の高さ
まずGPT-3はその膨大なパラメータ数によって、精度を大きく向上している点が特徴です。パラメータというのは、システムがテキスト予測モデルを生成する際に用いられる変数のことで、この数が多いほど高い精度が期待されます。
そしてGPT-3の場合、その数は約1800億個と言われています。従来のGPT-2と比較して利便性と精度が格段に向上し、人が書いたものとは思えないような正確な文章を生成できる様になりました。
圧倒的なデータ処理スピード
圧倒的な処理スピードの実現も、GPT-3の大きな特徴・強みのひとつです。
これまでのモデルでは「時系列でのデータ処理」を採用していましたが、GPT-3では「並列処理アルゴリズム」を実装・採用することで、その圧倒的な速度の差を実現しています。
API活用でAI機能を自身のサービスに組み込める
本記事で後に紹介する「GPT-3 API」というAPIを用いることで、自身の任意のサービスに自由に高性能AIを組み込むことが可能になります。
優れたプロのAIエンジニア達が作った高性能なシステムを自身のサービスに自由に反映することは、大きな利便性アップを図れるので大きなメリットです。
GPT-3の料金
GPT-3を使用する際にかかる料金は、文章生成モデルによって異なります。一覧にまとめると、以下のようになります。
モデル | 質問文の入力 | 回答文の出力 |
text-davinci-003 | 0.02ドル(約3.03円)/1000トークン | 12ドル(約1,816円) |
Curie | 0.002ドル(約0.3円)/1000トークン | 1.28ドル(約190円) |
Babbage | 0.0005ドル(約0.07円)/1000トークン | 0.32ドル(約48円) |
Ada | 0.0004ドル(約0.06円)/1000トークン | 0.25ドル(約37円) |
表中の「トークン」とは、「1キーワード」のことです。
英語の場合だと1キーワード、そしてピリオドやカンマ、クエスチョンも1トークンとして扱われます。しかし日本語の場合だと漢字やカタカナ、英語が入り混じっているのでトークンの計算方法はやや難解となっているのが現状です。
このようにOpenAIの生成サービスでは、文字数や実行回数ではなく、テキストや単語の量で計算されます。そしてもうひとつ念頭に置いておきたいのが、「質問文の入力」と「回答文の生成」両方に料金がかかることです。
text-davinci-003の料金
例としてtext-davinci-003の料金を紹介していきます。前述の表でも紹介しているとおり、text-davinci-003にて文章生成を利用する際にかかる料金は、質問文の入力で1000トークン0.02ドル(2024年4月時点で約3.03円)、回答文の出力で12ドル(2024年4月時点で約1816円)となっています。
圧倒的な文章精度を誇るとはいえ、OpenAIのモデルの中でももっとも安い「Ada」と比較すると、質問入力・回答出力ともに約50倍の料金となっていることから、決して安いとはいえないのが現状です。
なおChatGPTに関するAPI料金に関しては、以下の記事も参考になるので、ぜひご一読ください。
GPT-3 APIとは?
GPT-3 APIとは、OpenAIが運営・提供を行うAPIのひとつです。そもそもAPIとは何かというとソフトウェア同士が情報や機能をやり取り・共有するための仕組みを指します。
なお似た言葉に「ChatGPT API」というものがありますが別物です。違いは以下のようになります。
搭載モデル | パラメータ数 | 料金 | |
GPT-3 API | GPT-3 | 約1,800個 | 1,000トークン0.0200ドル |
ChatGPT API | GPT-3.5-turbo | 約3,600億 | 1,000トークン0.002ドル |
なおOpenAIが運営する「ChatGPT」向けのAPIについて興味のある方は、以下の記事もぜひ参考にしてみてください。
GPT-3 APIの使い方
GPT-3 APIを使う歳の主な手順は、以下のとおりになります。
- OpenAIアカウントの作成・ログイン
- OpenAIライブラリのインストール
- APIキーの作成・取得
- モジュールのインポート・APIキー入力
- 変数の定義・プロンプト入力
それぞれ、順を追ってご紹介します。
手順①:OpenAIアカウントの作成・ログイン
まずはOpenAIのアカウントを作成のうえ、ログインを済ませておきましょう。とくに特別な操作は必要なく、一般的なサイト同様にメールアドレスとパスワードを入力し、アドレスに届いた認証コードを入力すればアカウント作成が完了します。
Googleアカウントを持っている方であれば、OpenAIアカウントの新規登録行わなくてもログイン可能です。
手順②:OpenAIライブラリのインストール
GPT-3 APIを使うには、「OpenAIライブラリ」というものをインストールする必要があります。
ターミナルを開き、以下を入力して実行してください。
pip install openai
手順③:APIキーの作成・取得
自身のアカウントとAPIを紐付けするには、「APIキー」というものが必要になります。
まずはAPIメイン画面に遷移し、画面左上「API reference」タブをクリックします。
その後「Authentication」内の文中のテキストリンク「API Keys」をクリックします。
以下画像の赤い部分にAPIキーが表示されているので、コピーして控えればOKです。
手順④:モジュールのインポート・APIキー入力
ターミナルで以下を入力し、モジュールをインポートします。
import openai
続いてターミナルで以下を入力し「”ここにAPIキー入力”」の部分に上記手順③で取得したAPIキーを入力します。
openai.api_key = “ここにAPIキー入力”
手順⑤:プロンプト入力
あとは以下のようにプロンプトを入力することで、GPT-3 APIを使用できます。
prompt : ”質問を入力”
入力例としては、以下のようになります。
prompt = ‘Hi! How are you today?’
response = openai.Completion.create(engine = ‘text-ada-001’, prompt = prompt, max_tokens = 50, n = 1, temperature = 0.5)
print(response.choices[0].text)
上記の問いに対し、GPT-3 APIは以下のような答えを返してくれます。
I’m doing well, thank you! How about you?
引用:みんなのらくらくマガジン
GPT-3の欠点・デメリット
ここではGPT-3の欠点・デメリットとして、以下3つをご紹介します。
- テキストの意味や意図までは読み取れない
- 世間的な常識や法則に基づく回答が苦手
- 別表現や誤情報を生成する可能性がある
テキストの意味や意図までは読み取れない
GPT-3は文章の一部を見ただけでは文脈や背景を理解できず、誤った情報を生成する可能性があるのが欠点です。
とくに長い文章や複雑な文脈となればなお正確性が低下する傾向があるため、詳細なプロンプトの入力や、回答の正確性を確認するなど慎重な対策が必要になります。
世間的な常識や法則に基づく回答が苦手
GPT-3は世間的な常識や法則までは理解していないため、これについては誤った回答を行う可能性も否めません。
ChatGPTの回答は内容や背景を理解して作られているのではなく、あくまで文学的な表現や関連性の高い単語を組み合わせてそれらしい回答を生成しているためです。
人間でも専門的な知識を要するような質問には不向きでしょう。
別表現や誤情報を生成する可能性がある
ChatGPTは不確かなことを「不確か」と表示してくれるといいのですが、ときに別表現や誤情報を生成してしまう可能性があることは大きなデメリットといっていいでしょう。
前述でも述べたように、GPT-3は世間的な常識に基づく回答が苦手だからです。共通の単語の羅列でそれらしい回答を作っているだけなので、情報の正誤チェックはなるべく怠らないようにしましょう。
GPT-3に日本語版はある?
GPT-3には日本語版が存在します。またそれ以降の各モデル、そして現在最新のGPT-4に関しても日本語に対応しています。
そしてGPT-3 APIも日本語に対応しているものの、こちらはあまり日本語の精度が高くないのが現状です。これから改良が進み、より日本語で使いやすいAPIにアップデートされていくことが期待されています。
GPT-3についてまとめ
GPT-3はアメリカのOpenAI社がリリースしている、自然言語処理モデルのバージョンの名称を指します。記事構成のアイデア出しや、ライティングにおける下書きのみならず、プログラムコードやデザインの生成、チャットボットなど幅広い分野で重宝されています。
さらにGPT-3はオープンソースで公開されているAPIを用いれば、優れたプロのAIエンジニア達が作った高性能なシステムを、自身のサービスなどに自由に組み込むことが可能です。ぜひGPT-3およびAPIの使い方をマスターし、自身の仕事やサービスの利便性向上を図ってみてはいかがでしょうか。
また、AI研究所が運営する「AIプロフェッショナル人材育成コース」では、最速でAIプログラミングのプロになるための講座を運営しています。
プログラミングの基礎から応用的なアルゴリズムまでじっくり学べるカリキュラムを用意しており、GPT-3の実装に関する理解も深められるでしょう。初めてでもAIのプロを目指して安心して学べる環境も整っているので、ぜひご検討ください。