もうすぐお盆休みが始まります。今さらですが、旅行計画を立てることにしました。とはいえ、この時期だと飛行機や新幹線、フェリーのチケットはとれないし、ホテルも予約できません。
ということで、関東近辺でバンワークすることにしました(いつもと同じやんというツッコミが聞こえてきそう)。
ところで、最近「GPT-4がバカになった」という噂があります。そこで、本当にGPT-4がバカになったのかどうかを調べてみることにしました。GPT-3.5とGPT-4に旅行計画を立ててもらい、その結果を比較してみます。
まずは両方に「8月の長期休暇を利用して旅行したいと考えています。車で行く予定です。できれば東京から200km以内で行ける場所がいいのですが、おすすめ観光スポットはありますか」という質問を投げてみます。すると3.5からは以下の回答がありました。

GPT-4の回答は以下の通り。 GPT-4には「WebPilot」というプラグインを入れているので、インターネット情報を検索します。最新情報を調べてその結果を導き出すことができれば、回答の精度は上がるはずですが……。

なんと富士山が候補に挙げられました。一瞬「富士山に登れるわけないやん!」と叫びそうになりましたが、よく見ると登山するわけではなさそう。河口湖や富士急ハイランドと書かれていますから、「富士山」ではなく「富士エリア」を推薦しているのでしょう。だったらそう書けばいいのに。
次に「このなかで涼しい場所はどこですか」と尋ねてみたら、こんな回答が返ってきました。まずGPT-3.5から。

次にGPT-4の回答を。

やっぱり富士山に登るんかーい! さっきは河口湖だの富士急ハイランドだの優しいことを言っていたのに、本音は富士山登山だったのか。まったく、油断も隙もない…。
両方とも「日光」を勧めているので、さらに日光のグルメ情報を聞いてみます。まずはGPT-3.5から。

次にGPT-4の回答を。

GPT-4はインターネットが使えるため、具体的な店の名前まで出してくれますが、この様子だと口コミ情報だけを頼りにしているような。比べてGPT-3.5は、お店の名前こそないものの、日光の特産品などが挙げられているのでわかりやすいですね。店の名前は、それこそインターネットで調べればいいんだし。
ということで、この程度の調べものであれば、むしろGPT-3.5のほうがよいのではないかと思いました。調べるスピードも、圧倒的に3.5のほうが早いし。
今回の調査で「バカになったか」どうかはわかりませんでしたが、少なくともあまり賢こくなさそう。質問内容によってはインターネットで最新情報を取得する必要はなさそうと言うこともわかりましたし。そりゃそうですよね。だってChatGPTが出た当初は最新情報なんて扱えなかったけど、それでも便利に使えていましたから。
これから旅の計画を立てようと考えている方は、ChatGPTに相談してみてはいかがでしょうか。無料版の3.5でも結構使えますよ。