2023.08.04
2024.09.21

【はじめてのChatGPT】GPT-4は本当にバカになったのか？

もうすぐお盆休みが始まります。今さらですが、旅行計画を立てることにしました。とはいえ、この時期だと飛行機や新幹線、フェリーのチケットはとれないし、ホテルも予約できません。

ということで、関東近辺でバンワークすることにしました（いつもと同じやんというツッコミが聞こえてきそう）。

ところで、最近「GPT-4がバカになった」という噂があります。そこで、本当にGPT-4がバカになったのかどうかを調べてみることにしました。GPT-3.5とGPT-4に旅行計画を立ててもらい、その結果を比較してみます。

まずは両方に「8月の長期休暇を利用して旅行したいと考えています。車で行く予定です。できれば東京から200km以内で行ける場所がいいのですが、おすすめ観光スポットはありますか」という質問を投げてみます。すると3.5からは以下の回答がありました。

GPT-4の回答は以下の通り。 GPT-4には「WebPilot」というプラグインを入れているので、インターネット情報を検索します。最新情報を調べてその結果を導き出すことができれば、回答の精度は上がるはずですが……。

なんと富士山が候補に挙げられました。一瞬「富士山に登れるわけないやん！」と叫びそうになりましたが、よく見ると登山するわけではなさそう。河口湖や富士急ハイランドと書かれていますから、「富士山」ではなく「富士エリア」を推薦しているのでしょう。だったらそう書けばいいのに。

次に「このなかで涼しい場所はどこですか」と尋ねてみたら、こんな回答が返ってきました。まずGPT-3.5から。

次にGPT-4の回答を。

やっぱり富士山に登るんかーい！　さっきは河口湖だの富士急ハイランドだの優しいことを言っていたのに、本音は富士山登山だったのか。まったく、油断も隙もない…。

両方とも「日光」を勧めているので、さらに日光のグルメ情報を聞いてみます。まずはGPT-3.5から。

次にGPT-4の回答を。

GPT-4はインターネットが使えるため、具体的な店の名前まで出してくれますが、この様子だと口コミ情報だけを頼りにしているような。比べてGPT-3.5は、お店の名前こそないものの、日光の特産品などが挙げられているのでわかりやすいですね。店の名前は、それこそインターネットで調べればいいんだし。

ということで、この程度の調べものであれば、むしろGPT-3.5のほうがよいのではないかと思いました。調べるスピードも、圧倒的に3.5のほうが早いし。

今回の調査で「バカになったか」どうかはわかりませんでしたが、少なくともあまり賢こくなさそう。質問内容によってはインターネットで最新情報を取得する必要はなさそうと言うこともわかりましたし。そりゃそうですよね。だってChatGPTが出た当初は最新情報なんて扱えなかったけど、それでも便利に使えていましたから。

これから旅の計画を立てようと考えている方は、ChatGPTに相談してみてはいかがでしょうか。無料版の3.5でも結構使えますよ。

【コラム】データ消失事故について考える

【買い物上手】くっつかないキッチン用品

井上真花（いのうえみか）

有限会社マイカ代表取締役。PDA博物館の初代館長。長崎県に生まれ、大阪、東京、三重を転々とし、現在は東京都台東区に在住。1994年にHP100LXと出会ったのをきかっけに、フリーライターとして雑誌、書籍などで執筆するようになり、1997年に上京して技術評論社に入社。その後再び独立し、2001年に「マイカ」を設立。主な業務は、一般誌や専門誌、業界紙や新聞、Web媒体などBtoCコンテンツ、および広告やカタログ、導入事例などBtoBコンテンツの制作。プライベートでは、井上円了哲学塾の第一期修了生として「哲学カフェ＠神保町」の世話人、2020年以降は「なごテツ」のオンラインカフェの世話人を務める。趣味は考えること。

https://www.inouemica.work/

【はじめてのChatGPT】GPT-4は本当にバカになったのか？

井上真花（いのうえみか）

関連記事

【はじめてのChatGPT】 ObsidianでClaude 3を使う

【はじめてのChatGPT】生成AIで文章のわかりにくさをチェックする

【日経パソコン】（5/22号）特集1「AI時代の新ネット検索術」

【はじめてのChatGPT】ChatGPTでアウフヘーベン

【はじめてのChatGPT】 ChatGPTの回答が改憲議論にも使われる！？

【はじめてのChatGPT】チャットを育てる

マイカのニュースレターに登録

【日経パソコン】（9/23号）特集2「デジタル時代の遠隔支援」

【日経パソコン】（8/26号）特集1「無料＆割安で生成AI活用」

【日経パソコン】（6/24号）【生成AIで日常が劇的変化最終回】 AI時代のアプリケーション／サービス

【書籍】ゼロからはじめるなるほど！Copilot活用術（技術評論社）

「タレントパワーランキング2024」（日経エンタテインメント！）

【日経パソコン】（5/27号）【生成AIで日常が劇的変化第4回】 AI時代の趣味・エンターテインメント

【日経パソコン】（5/13号）【生成AIで日常が劇的変化第3回】 AI時代の家計管理術

【日経パソコン】（4/22号）【生成AIで日常が劇的変化第2回】AIの力でオンライン会議をアップデート

お問い合わせ

お問い合わせ

【はじめてのChatGPT】GPT-4は本当にバカになったのか？

井上 真花（いのうえみか）

関連記事

【はじめてのChatGPT】 ObsidianでClaude 3を使う

【はじめてのChatGPT】 生成AIで文章のわかりにくさをチェックする

【日経パソコン】（5/22号）特集1「AI時代の新ネット検索術」

【はじめてのChatGPT】ChatGPTでアウフヘーベン

【はじめてのChatGPT】 ChatGPTの回答が改憲議論にも使われる！？

【はじめてのChatGPT】 チャットを育てる

マイカのニュースレターに登録

【日経パソコン】（9/23号）特集2「デジタル時代の遠隔支援」

【日経パソコン】（8/26号）特集1「無料＆割安で生成AI活用」

【日経パソコン】（6/24号）【生成AIで日常が劇的変化 最終回】 AI時代のアプリケーション／サービス

【書籍】ゼロからはじめる なるほど！Copilot活用術（技術評論社）

「タレントパワーランキング2024」（日経エンタテインメント！）

【日経パソコン】（5/27号）【生成AIで日常が劇的変化 第4回】 AI時代の趣味・エンターテインメント

【日経パソコン】（5/13号）【生成AIで日常が劇的変化 第3回】 AI時代の家計管理術

【日経パソコン】（4/22号）【生成AIで日常が劇的変化 第2回】AIの力でオンライン会議をアップデート

お問い合わせ

お問い合わせ

井上真花（いのうえみか）

【はじめてのChatGPT】生成AIで文章のわかりにくさをチェックする

【はじめてのChatGPT】チャットを育てる

【日経パソコン】（6/24号）【生成AIで日常が劇的変化最終回】 AI時代のアプリケーション／サービス

【書籍】ゼロからはじめるなるほど！Copilot活用術（技術評論社）

【日経パソコン】（5/27号）【生成AIで日常が劇的変化第4回】 AI時代の趣味・エンターテインメント

【日経パソコン】（5/13号）【生成AIで日常が劇的変化第3回】 AI時代の家計管理術

【日経パソコン】（4/22号）【生成AIで日常が劇的変化第2回】AIの力でオンライン会議をアップデート