OpenAI、ChatGPTで画像分析機能を可能にするGPT-4Vを発表、マルチモーダルに。
ありがとうございます!
OpenAIは2023年9月25日(現地時間)、ユーザがアップロードした画像入力の解析する能力を持つ、最新の大規模言語モデル「GPT-4V」を発表しました。これは、従来のテキストベースのAIとは一歩進んだもので、画像を解析する能力を持つことが特徴です。
近年、AI研究として注目されているのが、言語だけでなく画像などの他のモダリティを取り入れたマルチモーダル(多モーダル)なAIの開発です。GPT-4Vは、このマルチモーダルAIの最新版として、テキストだけでなく画像入力も解析できる能力を持つことで、新しいタスクの解決やユーザ体験の拡大を目指しています。
OpenAIは、GPT-4Vのリリースにあたり、その安全性に関する詳細な分析を公開しています。これは、前モデルGPT-4の安全性に関する研究を基に、画像入力に特化した評価や対策が行われているとのこと。
OpenAIは、ユーザーに安全で信頼性の高いAI体験を提供するための努力を続けており、GPT-4Vもその一環としてリリースされたと言えるでしょう。
今後のAIの進化とともに、テキストだけでなく、画像や他のモダリティを統合したマルチモーダルなAIの可能性がさらに広がることが期待されます。GPT-4Vの登場は、その新たなステップとして大きな注目を集めることでしょう。
前後の記事
関連記事
-
NTTデータ、ルーマニア拠点への不正アクセスを認める 使用していないドメイン環境への攻撃
-
KADOKAWA社長 夏野氏のXアカウントが乗っ取られる 原因にはNewsPicksの報道という指摘も 両社の対立深く
-
KADOKAWAグループが大規模サイバー攻撃を受け、ニコニコを含む複数のウェブサイトが停止 10日時点でもサイバー攻撃が続く
-
OpenAI、ChatGPTに対し画像生成が可能な「DALL·E 3」の展開を開始したと発表、テキストから思い通りの画像を作成可能に
-
【全文和訳】KADOKAWAとニコニコを襲ったBlack Suitの犯行声明は一体どんな内容だったのか 証拠として機密情報の一部も公開か
-
【サーバー攻撃】小説投稿サイト「ハーメルン」と「小説家になろう」にDDoS攻撃「カクヨム」でも一時障害
-
KADOKAWAが明かす事業活動の回復状況について
-
OpenAI、ChatGPTに「カスタム指示」(Custom instructions)機能を導入




コメントを残す