OpenAI、ChatGPTで画像分析機能を可能にするGPT-4Vを発表、マルチモーダルに。
ありがとうございます!
OpenAIは2023年9月25日(現地時間)、ユーザがアップロードした画像入力の解析する能力を持つ、最新の大規模言語モデル「GPT-4V」を発表しました。これは、従来のテキストベースのAIとは一歩進んだもので、画像を解析する能力を持つことが特徴です。
近年、AI研究として注目されているのが、言語だけでなく画像などの他のモダリティを取り入れたマルチモーダル(多モーダル)なAIの開発です。GPT-4Vは、このマルチモーダルAIの最新版として、テキストだけでなく画像入力も解析できる能力を持つことで、新しいタスクの解決やユーザ体験の拡大を目指しています。
OpenAIは、GPT-4Vのリリースにあたり、その安全性に関する詳細な分析を公開しています。これは、前モデルGPT-4の安全性に関する研究を基に、画像入力に特化した評価や対策が行われているとのこと。
OpenAIは、ユーザーに安全で信頼性の高いAI体験を提供するための努力を続けており、GPT-4Vもその一環としてリリースされたと言えるでしょう。
今後のAIの進化とともに、テキストだけでなく、画像や他のモダリティを統合したマルチモーダルなAIの可能性がさらに広がることが期待されます。GPT-4Vの登場は、その新たなステップとして大きな注目を集めることでしょう。
前後の記事
関連記事
-
OpenAI、ChatGPTに音声と画像の機能を新たに搭載すると発表
-
KADOKAWA/ニコニコへのサイバー攻撃 東ヨーロッパ系ハッカー集団BlackSuitが犯行声明をダークウェブに公開
-
KADOKAWA、ダークウェブ上に流出したデータの拡散行為に法的措置の準備
-
日本政府、新法「特定ソフトウェアに係る競争の促進に関する法律」が可決 – AppleとGoogleに第三者アプリストアの許可を義務付け
-
ニコニコ、復旧までに1ヶ月以上の見込みと発表 ニコニコ(Re:仮)が提供開始
-
KADOKAWAグループが大規模サイバー攻撃を受け、ニコニコを含む複数のウェブサイトが停止 10日時点でもサイバー攻撃が続く
-
Microsoftが検索エンジンに「Prometheusモデル」を搭載した新バージョンを発表
-
X対抗馬「Bluesky」が招待制が廃止、ただし登録に電話番号が必要
コメントを残す