本能ブログ【大人の物欲全開ブログ】

■物欲全開メディア”本能ブログ”■ブロガー/コラムニスト■メンズファッション/カメラ/時計/猫/ヘルスケア/ガジェット/レビュー/投資/

CHATGPTが”GPT-4V”にアップデート!絵やイメージを書いてくれる新機能がやばい

CHATGPTに昨年1年間でどれだけの機能が追加されたのでしょうか。末恐ろしく感じます、さじゃんです。以前はメンバーのホッピーが英会話スクール的利用法をご提案しました。

すでにAIを利用した英会話や多言語学習アプリは様々登場しておりますが、CHATGPTが音声入力に対応したため英会話のラリーが可能に。本当に勉強になりますしレスポンスが非常に早いのと発音が上手く出来なかったり文法が間違っていても人間が相手ではないで気兼ねなく壁打ち練習が出来るのは大きなメリットかなと感じています。

そんな万能感があるCHATGPTですが、昨年末(2023年)なんと画像生成機能が搭載されました。GPT-4Vと呼ばれる最新バージョンはテキスト指示によって画像を生成する機能を搭載しました。

例えば”日本の名所を海外の人間に紹介する絵を書いて!”というプロンプトを投げるとこのような画像を1分足らずで排出します。

富士山、京都の五重塔、日本庭園、桜、神社のような社などなど確かに日本に関する名称が散りばめられているような絵になっています。エモーショナルかと言われたらそんな感じはしませんが、海外向けのパンフレットの表紙レベルではあるような気がしますw

画像生成だけではなく写真アレンジも可能

昨年末に行われたRIZIN45の観戦記をメンバーのホッピーが届けてくれていますが、

自分が撮った座席からリングを見たときの写真をCHATGPTに読み込ませ説明をさせたり、画像を元にアレンジすることが出来るのです。早速やってみます。

”これは何の大会ですか?と聞くと、

この写真は、総合格闘技イベント「RIZIN」の会場と思われます。写真には「RIZIN 45」というテキストが見えるため、それがイベントの名称である可能性が高いです。RIZINは日本の総合格闘技プロモーションで、年に数回の大きなイベントを開催しています。

と正確に画像を認識しています、正直この時で相当驚いたのですが更にこの画像を元に”この画像をディズニー風にして”とプロンプトを出すと

さっきの画像を元にピクサー作品風に変換してくれます。絵の完成度は置いておいてもなんとなくそれっぽく見えるから不思議ですw

さらに”この画像をマーベルヒーロー、アメコミ風に”という指定でプロンプトを出すと

一気に作風が変わりました。リングに複数人居たりバレーボールの線審みたいな人が居たりと突っ込みどころは少なくないですがタッチは確かにアメコミになったのですごい進化だと思います。

商用画像は今後はAI任せになる?

CHATGPTに書かせたSONYのヘッドホンsony wh-1000xm5とアップルのAirPods MAXですが、ディテールが完全に違っていますwしかし、このような状態からAIが驚くべきスピードで進化しているのは昨年からの肌感覚で理解できているので、来年の今頃にはもっと精密で人の手によって作成された画像のような精度になると思われます。個人的には芸能人の写真を使わず地上波番組で似顔絵で誤魔化しているような”に著作権侵害”になりえそうな対象物のイメージ映像化はほぼ今後AI化していくような気がしています。

昨年の本能ブログアクセスランキングで上位になったこちらのヘッドホン比較記事ですが実はCHATGPTに要約させて記事を完成させています。ところどころ自分が補正すればほぼ人が書いたかAIが書いたか分からない記事になります。(簡単なライターが居なくなるかもw)今後も目が話せないCHATGPTですが、今のとこ描画機能を備えたGPT-4Vは有料会員限定の機能となっております。

CHATGPTアナタ自身をイメージ化してくださいとプロンプトを投げたらこのような画像を吐き出しました。めっちゃ分かる!と思わせるイメージで人間が思うイメージをすでに構築できているのかもしれないとさえ感じる一枚でした。