「Gemini」リリースとAssistant with Bardへの影響: ProとNanoが持つ役割とは?

音声ニュースのイメージ図 最新リリース・アナウンス
This image was created with DALL·E3
最新リリース・アナウンス
この記事は約4分で読めます。

TL;DR

– Googleは、BardのAIエンジンを「Gemini」に変更すると発表
– Assistant with Bardが関係するのは「Pro」と「Nano」、特に「Nano」はon-deviceタスク向けのAIエンジンとして、サービス提供の要になる可能性

「Gemini」リリースとAssistant with Bardへの影響: ProとNanoが持つ役割とは?

GoogleがBardのベースモデルを変更

 Googleは現在試験運用中であるBardのAIエンジンを、現行のPaLM2から「Gemini」に変更すると発表しました。英語版の先行リリースを皮切りに、対象言語や地域を順次拡大していく予定と伝えています。

(Update 2024/3/12)

2024/2/1より、対象言語に日本語が追加されています。

Geminiの言語対象拡大

Geminiの概要 

 Geminiには、サイズの異なる「Ultra」「Pro」「Nano」の3モデルが用意されています。

各モデルの説明

  • Gemini Ultra — our largest and most capable model for highly complex tasks
  • Gemini Pro — our best model for scaling across a wide range of tasks
  • Gemini Nano — our most efficient model for on-device tasks
引用元: blog.google

 この中からGoogleは、「 Pro」をBardの新エンジンに、そして「Nano」をAndroid端末向けのAIエンジンに採用しました。

(※. 本稿執筆時点での対象端末は、Pixel 8 Proのみ)

 なお、「Ultra」については、「Bard Advanced」の形で、来年以降のリリースが予定されています。

Assistant with Bardはどうなる?

 新AIモデル「Gemini」の正式リリースを受けて、少しずつ「Assistant with Bard」の全容が見え始めました。

ProとNanoの役割

 Assistant with Bardは音声アシスタントであるため、当然ながら汎用性の高いLLMが求められます。

 今回、Bardの新エンジンとなったGemini Proが our best model for scaling across a wide range of tasks であるなら、Assistant with Bardの主力エンジンはProと考えるのが妥当です。

 一方のGemini Nanoは、on-deviceタスク向けのAIエンジンとして、要約・生成機能を提供します。

 開発者ブログによると、Gemini Nanoは「Android AICore」上での使用が前提となっていますが、これは端末やネット環境に依存せず、かつ安全にAIエンジンを提供するための設計であり、Googleの拘りが垣間見える部分です。

GeminiNanoの説明図
引用元: android-developers.googleblog.com

Nanoが生み出す効果 

 これまでAssistant with Bardは、Gmail、Docs、Lensなど、基幹アプリとの連携を強調してきましたが、他のアプリやサービスとの連携をGemini Nanoで拡充できるなら、UXは格段に向上する可能性があります。

 開発方法については未知数ですが、個人的な予想ではAssitant with Bardから音声で各アプリのAI機能にアクセスする仕組み、つまり現在のApp Actionsのようなフローが引き継がれることを想定しています。

Gemini Nanoの新AI機能

 Gemini Nanoを使った新AI機能は、以下のようなサービスを提供できます。

1. Recorderの録音内容を要約する

 Recorder appで収録した会話、インタビュー、プレゼンなどの内容を、要約して出力することができます。

 オフラインでも使用可能です。

2. Gboardを使ってWhatsAppの返答メッセージを自動生成する

 チャットの返答メッセージ候補を、Gboard上に自動生成することができます。

 対象アプリについては、来年以降拡大していく予定のようです。

まとめ

 Bardの新モデル「Gemini」のリリースを受け、Assistant with Bardの全容解明もいよいよ最終局面に入りました。

 ProとNanoは、それぞれモデルサイズが異なるため、Assistant with Bard内でも異なる役割を持つことが考えられます。

関連記事はこちら //

Googleが一部Assistant機能のサポート終了 & マイクアイコンの仕様変更を発表
Googleは、Google Assistantの機能縮小とマイクアイコンのUI変更をアナウンスしました。サポート終了となる17機能は、日常シーン、娯楽、ヘルスケア、アプリ操作に関するもので、ユーザーには随時通知していく予定と伝えています。
Google Assistantの後継となる「Gemini App」の切り替え手順
Geminiへのアクセス方法は、AndroidとiOSで少し異なります。Androidはアプリのインストール、もしくはGoogle Assistantからの切り替え。iOSはGoogleアプリのGeminiタブからアクセスします。
ChatGPTの音声会話機能を使ってみよう!基本操作・事前設定・画期的な2つの特徴とは?
OpenAIが提供する会話機能は、モバイルアプリの全ユーザー向けに提供されています。ユーザーが話す言語を自動判別するAuto-Detectに加え、「聞き取り状態が継続する」という画期的な特徴を備えています。
タイトルとURLをコピーしました