OpenAI、ChatGPTで画像分析機能を可能にするGPT-4Vを発表、マルチモーダルに。

ありがとうございます!
OpenAIは2023年9月25日(現地時間)、ユーザがアップロードした画像入力の解析する能力を持つ、最新の大規模言語モデル「GPT-4V」を発表しました。これは、従来のテキストベースのAIとは一歩進んだもので、画像を解析する能力を持つことが特徴です。
近年、AI研究として注目されているのが、言語だけでなく画像などの他のモダリティを取り入れたマルチモーダル(多モーダル)なAIの開発です。GPT-4Vは、このマルチモーダルAIの最新版として、テキストだけでなく画像入力も解析できる能力を持つことで、新しいタスクの解決やユーザ体験の拡大を目指しています。
OpenAIは、GPT-4Vのリリースにあたり、その安全性に関する詳細な分析を公開しています。これは、前モデルGPT-4の安全性に関する研究を基に、画像入力に特化した評価や対策が行われているとのこと。
OpenAIは、ユーザーに安全で信頼性の高いAI体験を提供するための努力を続けており、GPT-4Vもその一環としてリリースされたと言えるでしょう。
今後のAIの進化とともに、テキストだけでなく、画像や他のモダリティを統合したマルチモーダルなAIの可能性がさらに広がることが期待されます。GPT-4Vの登場は、その新たなステップとして大きな注目を集めることでしょう。
前後の記事
関連記事
-
ECサイト大手「Shopify」から約18万件分の顧客データが流出か 海外メディアが報じる
-
NTTデータ、ルーマニア拠点への不正アクセスを認める 使用していないドメイン環境への攻撃
-
OpenAI、ChatGPTに対し画像生成が可能な「DALL·E 3」の展開を開始したと発表、テキストから思い通りの画像を作成可能に
-
【事態に変化か】ニコニコを襲ったBlack Suitの犯行リストから「KADOKAWA」が削除される
-
KADOKAWA、サイバー攻撃により情報の流出を認める ハッカー集団Black Suitが公開したデータについてダウンロードしないよう要請
-
ランサムウェア集団Black Suit、KADOKAWAから盗み取ったデータを再度漏洩
-
OpenAI、ChatGPTに「カスタム指示」(Custom instructions)機能を導入
-
日本政府、新法「特定ソフトウェアに係る競争の促進に関する法律」が可決 – AppleとGoogleに第三者アプリストアの許可を義務付け
コメントを残す