Advertisement

Gemini Liveを即席の音声翻訳アプリとして活用する方法

Alexa・Gemini・Siri
この記事は約5分で読めます。
【PR】 本投稿にはアフィリエイト広告が含まれています

 本投稿は、以下の端末、アプリ、バージョンを使い、執筆時点の情報を基に作成しています。

  • Pixel 8(Android 15)
  • Google Gemini(1.0.741105040)

TL;DR

– Geminiを音声通訳アプリとして使用する際は、幾つかの事前設定が必要

– 「Gems」の活用が、スムーズな翻訳体験のキーポイント

– Gemini LiveはGemsと併用できないが、通常の音声入力で代替可能

「ヤバい、英語わからない」をGeminiで乗り切る

 Geminiは、「日本語 ⇄ 日本語」「英語 ⇄ 英語」のように同一言語で会話が進行するため、通常は翻訳アプリとして使用することができません。

 しかし、会話を始める前の事前設定1つで、「日本語 ⇄ 英語」をスムーズにこなす翻訳アプリにカスタマイズすることができます。

Gemsを活用する

 使用するのは、用途に合わせたAIを作成する「Gems」という機能です。

 この機能は、「Geminiにどう振舞ってほしいのか?」を記述した Instructions(カスタム指示)の中身が大事な要素になります。

「Translator」を生み出すインストラクションは?

 「Translator」と名付けた私のGemsには、以下のようなカスタム指示を入力しています。具体例を示しながら分かりやすく説明することで、性能がガラリと変わります。

これから、ユーザーの日本語を英語に、英語は日本語に翻訳してください。例えば、

ユーザー: あなたの名前は?
答え: What is your name?

ユーザー: Where is Tokyo Tower located?
答え: 東京タワーはどこにありますか?

のように回答してください。

注意
Web検索、Google Workspace、Google Mapsは使用しないでください。
翻訳内容以外の回答はしないでください。

 自分でカスタム指示を書く手間を省きたい場合は、自動生成機能も活用できます。雛形があると、Gems完成までの作業がある程度は楽になります。

Gemsが便利な理由

 Gemsを使用せずにGeminiの翻訳性能を引き出したい場合は、Gemini Liveを起動して、

「これから私が日本語で話したことは英語に、英語で話したことは日本語に翻訳してください。」

 と言うだけでも、概ね期待通り動きます。ただ、この使い方は、

  • インストラクションを毎回言う必要がある
  • 具体例や注意事項を説明しないと、上手く翻訳しない可能性が高くなる

 というデメリットがあるため、あまり実用的ではないと個人的には考えています。

 効率的、かつ精度の高い翻訳体験にしたい場合は、Gemsの使用をオススメします。

Advertisement

試してみよう

 では、Gemsの作成から音声テストまで、一連の手順を試していきます。

  1. 言語を設定する
  2. Gems作成画面を開く
  3. Gemsを作成する
  4. テストする
1. 言語を設定する

 Geminiアプリを開き、右上のアカウントアイコン → Settings(設定)→ Languages(言語)の順に進み、Main language(メインの言語) と Second language(第二言語)を設定します(日英の翻訳であれば、日本語と英語)。

 この設定が日本語だけになっていると、Geminiは英語も日本語として理解しようとするため、翻訳が上手くいかない可能性が高くなります。

2. Gems作成画面を開く

 GeminiのWebアプリにアクセスして、左サイドバーのGem Manager(Gem マネージャー)をクリックし、Gemsの作成画面を開きます。

 モバイルアプリの場合は、アプリ起動 → 左上の吹き出しアイコン → Gems → Your Gems(作成したGem)→ You can create Gems on the web here(Gemはこちらからウェブで作成できます)の順に進み、Gemsの作成画面を開きます。

3. Gemsを作成する

 Instructions(カスタム指示)の欄に、冒頭の内容を入力して、Save(更新)をタップします。

geminiアプリを音声翻訳に使用するためのgems設定画面

「カスタム指示」と「更新」
4. テストする

 問題がなければ、作成したGemsを選択して「こんにちは」と入力すると、Geminiが「Hello」と回答します。

テスト例

  1. 「こんにちは」→ Gemini: Hello
  2. 「I’m looking for some souvenirs」→ Gemini: お土産を探しています
  3. 「このマグカップはどうですか?」→ Gemini: How about this mug?
  4. 「Sounds nice, how much is it?」→ Gemini いいですね、いくらですか?
  5. 「2つで1580円です」→ Gemini: It’s 1580 yen for two.
  6. 「OK, I’ll take two」→ Gemini: 分かりました、2つください
  7. 「お支払い方法はどうしますか?」→ Gemini: How would you like to pay?
Advertisement

Gemini Live + Gems ができないため、通常の音声入力方法を使用する

 Gemsは、Gemini Liveとの併用ができません。そのため、音声入力は会話画面の右下にあるマイクアイコン(以下画像参照)を使用します。

 

geminiのgemsで音声入力する時のマイクアイコン

右下のマイクアイコン

まとめ

 Geminiを音声翻訳アプリにカスタマイズしたい場合は、Gemsを活用します。事前に作成しておくと、必要な時にいつでも繰り返し呼び出せるので、日常や仕事のちょっとした場面の助けになります。

関連記事はこちら //

Geminiを「Gems」でカスタマイズ!用途に合わせたオリジナルAIをデザインしよう
Geminiアプリの「Gems」は、オリジナルAIを数行の文章で作成する機能です。カスタム指示を自動生成する機能も搭載されているため、「家庭教師」や「キャリアアドバイザー」のようなAIを、初心者でも簡単に作成することができます。
Geminiが過去の会話内容を思い出す!より人間らしい対話UXの提供開始へ
Geminiは、過去の会話履歴を参照して回答することが可能になりました。同じ情報を繰り返し説明する手間が省けるため、対話効率は大きく向上することになります。
旅行サポートから機械操作のアドバイスまで!Gemini Liveでリアルタイム映像を共有する
Gemini Liveでリアルタイム映像を共有しながら会話することが可能になりました。視覚と音声を融合したUXにより、問題解決のスピードを一段と早めることができます。
タイトルとURLをコピーしました