TL;DR
– Googleは、今年5月のGoogle I/O で発表した「Gemini Live」を正式にリリース
– AIが回答中でもユーザー音声を聞き取る「Interrupt」モードは、スムーズな会話形成に有用
待ち望んだUX

引用元: blog.google
Googleは、Gemini Advanced(有料)のモバイルユーザー向けに、「Gemini Live」の提供を開始しました。Androidから随時リリースが進んでいます。
私は、OPPO A73(Android 11)と、Pixel 8(Android 14)でテストしましたが、両端末とも問題なく動作しました。
(UPdate 2024/9/24)
Googleは、Gemini Advanced以外のユーザーにも、Gemini Liveの提供を開始しました。
10人の話し手
言語は英語で、10種類の音声が用意されています。
GeminiアプリのHome画面から、右上のアカウントアイコン ⇨ Settings ⇨ Gemini’s voiceに進み、任意の音声を選択します。

「Gemini’s voice」に進む

好きな音声を選択する

Liveの起動
Home画面右下のアイコンをタップすると、Gemini Liveが起動します。

Gemini Liveの起動アイコン

「Hold」と「End」
「Hold」でLiveモードの一時停止(起動状態でマイクがOffになる)、「End」でLiveモードが終了します。
なお、Liveモードのスクリーンには、テキスト、画像、図、表、リンクなどの視覚的な情報は表示されません。
「Interrupt」モード
テンポ良く会話を進めたい場合は、「Interrupt」モードを活用します。
設定は、Home画面 ⇨ 右上のアカウントアイコン ⇨ Settings ⇨ Interrupt Live responses から行います。

「Interrupt Live responses」をOn
InterruptモードをOnにすると、AIの状態(回答中、生成中)に関係なく、会話の中断や追加質問を、ハンズフリーで実行できるようになります。
会話の流れを自由に形成できるため、効率的な情報収集に非常に有用です。
バックグラウンドでも使用可能
(Update 2024/9/12)
バックグラウンド機能の設定方法を追加しました。
端末の設定 ⇨ 通知 ⇨ アプリの通知 ⇨ Google に進み、「Geminiとのライブチャット」をOnにすると、他アプリを操作中でも、Liveモードを継続することができます。

Geminiライブチャットの設定
また、GeminiアプリのHome画面 ⇨ 右上のアカウントアイコン ⇨ Settings ⇨ Gemini on lock screen の設定をOnにすると、画面lock時でも会話の継続が可能です。

「Gemini on lock screen」に進む

Onにすると画面ロック時でも使用可能に
そして、ユーザーの無言状態が一定時間続くと、Liveは自動で一時停止するように設計されています。
追加情報は会話履歴を参照する
Live終了後の会話履歴を見ると、回答テキスト、URLリンク、その他情報を確認することができます。
しかし、Liveは拡張機能(MapsやHotels)と連携しないため、情報量は通常のGeminiと比較すると少なめです。
回答テキスト、URLリンク、MapsやHotelsなどの詳細情報を確認しながら会話を進めたい場合は、通常のGeminiを使用する方が良いでしょう。
まとめ
Googleは、今年5月のGoogle I/Oで発表した「Gemini Live」を正式にリリースしました。
AIが回答中でもユーザー音声を聞き取る「Interrupt」モードは、過去にない音声UXを実現しています。
(端末・バージョン情報)
- Pixel 8 / Android 14
- OPPO A73 / Android 11
- Google Gemini / 1.0.662093464
関連記事はこちら //

