GoogleがGemini 1.5 Proを正式リリース！Vertex AI Studioで音声 & 動画処理をテストする

TL;DR

– Gemini 1.5 Proは、音声、動画、テキスト、コードのマルチモーダル処理が可能なLLM
– Vertex AI Studioには、Gemini 1.5 Pro向けのテストサンプル（動画や音声ファイル）が複数用意されている

　Gemini 1.5 Proは、Gemini Advanced（有料）に搭載されており、Geminiアプリ、Geminiモバイルアプリの両方で使用可能です。

　Gemini 1.5 Proは、Vertex AI StudioやGoogle AI Studioでテストすることができます。

　Vertex AI Studioには、動画や音声のテストサンプルが複数用意されており、私は動画サンプルを使ってテストしました。

　「オープン」をクリックすると、プロンプト入力済みのchatが開きます。

　結果は以下の通り。

　動画と音声に関する質問に対して、概ね正しく回答しています（「やきとり」とは書いてないような・・）。

　Gemini 1.5 Proの正式リリースにより、マルチモーダルLLMへのアクセスは更に容易になりました。

　Vertex AI Studioでは、その性能を簡単にテストすることができます。

関連記事はこちら //