Bard が Gemini へと名称変更
2024年2月8日、これまで「Bard」と呼ばれていた生成AIモデルは、「Gemini」に改名されることが発表されました。
最上位の対話型生成AI「Gemini Advanced」も発表し、日本では月額2900円で提供を開始しました。現在、言語は英語のみですが順次日本語にも対応する予定となっています。
また、GeminiやGemini Advanced が使えるスマートフォンアプリが提供されます。
https://japan.googleblog.com/2024/02/bard-gemini-ultra-10-gemini.html
本記事では、記事公開時点での「Google Bard」の情報について執筆しているため、現在の内容と異なる点がある可能性がございます。
知っておきたい Google Bard の便利機能ベスト5
第5位 表データをスプレッドシートで出力
この機能はまさにChatGPTにはない Google ならではの機能です。 Google Bard で出力した表データをスプレッドシート上に直接出力することができます。具体的な利用方法について説明していきます。例えば、 Google Bard に対して「都道府県の人口数ランキングTOP10」を出力するためのプロンプトを送信したとします。
すると、以下のように「都道府県人口ランキングTOP10」が出力されるので、表下にある「 Google スプレッドシートにエクスポート」をクリックします。
すると、シートの生成処理が実行され、処理が完了すると、以下のように「新しいスプレッドシートを作成しました」というメッセージが出力されるので、「スプレッドシートを開く」をクリックしてください。
シートを開くと、先程 Google Bard で出力された都道府県の一覧がシートに書き込まれていることがわかります。これが Google Bard の表出力機能です。結果を一々コピーせずに、自動的に書き込みしてくれるのは地味ではありますが、非常に便利な機能であると思います。
第4位 Google レンズによるOCR機能
Google Bard にはマルチモーダル機能が備わっており、この機能により Google Bard はテキストデータだけでなく、画像の読み込みも行うことができます。早速使い方を見てみましょう。まず、第5位で Google Bard から出力した表をスプレッドシートに出力する方法について解説しましたが、このスプレッドシート上の出力結果の画面キャプチャを取ってみましょう。
画面キャプチャが取れたら、この画像を Google Bard にアップロードしつつ、「画像から表データをテキストで抽出して」というプロンプトを送信してみます。
すると、 Google Bard は画像の解析を実行し、以下の通り、画像データから抽出したテキストを画面上に出力してくれました。現状 Google Bard のマルチモーダルはテキストと画像のみに対応していますが、今後は音声や動画など、様々な種類のファイルにも対応していくことが予想され、さらに複雑な指示についても処理できるようになっていくと思います。この機能はこの先の成長性の期待も踏まえて第4位にランクインさせてもらいました。
第3位 出力結果のリンク共有
Google Bard には出力した結果をリンク化して共有する機能が備わっています。例えば、あなたがとても有益なアウトプット結果を得られた場合、あなたはどのようにして、第3者にそれを伝えますか? Google Bard は出力結果そのものをリンク化して展開することができるため、一々内容をコピペして展開する手間が発生しません。実際に使い方を説明します。第4位の章で、画像をOCRした結果を Google Bard 上に出力しましたが、この内容を他のユーザーに展開してみましょう。以下画像の通り、赤枠のアイコンをクリックし、「共有」をクリックします。
すると、公開リンク生成モーダルが立ち上がるので、「公開リンクを作成」をクリックします(必要であれば、見出しの修正を行ったり、内容を再生成することも可能です)。
公開リンクが生成されると、以下のようにURLが出力されます。出力されたURLはコピペして、Slackやその他チャットサービスで展開したり、SNSに投稿したりすることができます。
第2位 YouTube連携
Google Bard は YouTube との連携も可能です。 YouTube との連携機能を利用する場合は Google Bard の拡張機能を有効化する必要があります。ヘッダメニューの「拡張機能」をクリックし、「 YouTube 」の拡張機能を有効化すれば、本機能の利用準備はOKです。
例えば、 Goolge Bard でクラウドエースのラリオス川口さんの動画を表示するように指示を出すと、以下のように関連動画をリンク一覧で表示してくれます。
自然言語で検索できるため、 YouTube の検索機能よりも使い勝手は良いかもしれません。実際、私は YouTube の動画を検索する場合、 Google Bard を使うことが日常となり、 YouTube の検索ボックスは最近使わなくなってしまいましたが、特に不自由なく欲しい動画に辿り着けています。
第1位 Google Workspace 連携
個人的に一番感動したのが Google Workspace との連携機能です。この機能を利用することで、ユーザーは自分自身の Google Workspace ( Gmail 、 Google ドライブ、 Google ドキュメント)を検索したり、要約したりすることができます。この機能を有効化するためには YouTube との連携機能同様に、「拡張機能」から「 Google Workspace 」を有効化します。
Google ドライブ上に過去リリースした記事の原稿があるとします。この原稿の内容を Google Bard によって要約してみましょう。
以下のように、 Google ドライブ上に存在するファイル名を指定した上で要約を依頼するプロンプトを送信してみます。
すると、 Google Bard は Google ドライブ上のファイルの中身を読み込み、要約を出力してくれました。
いかがでしたでしょうか。 Google Bard とその他 Google ツールをシームレスに繋いでくれる本機能は、今後の拡張性にも可能性を感じさせる非常に強力な機能であると思います。現状、連携可能な Google Workspace の機能には制限がありますが、今後はさらに対応可能なツールの範囲も広がっていくことが想定されます。
Google Bard は今後どう進化していくのか
このように Google Bard には、 ChatGPT にはないユニークな機能が備わっています。一体 Google Bard は今後どのような進化を遂げていくのでしょうか。考えられる進化について考察してみます。
リアルタイム情報との統合
これは最も予測できる未来だと思いますが、リアルタイムのニュースやイベント、天気予報などの最新情報が、 Google Bard の応答結果と直接統合されるようになっていくことが考えられます(ホテルやフライト情報等、既に一部データはリアルタイムに参照できるようになっています)。これにより、ユーザーは最新の情報を迅速に取得できるようになり、より Google Bard の活用が進んでいくことが期待できます。
しかし、一方で Google 検索と生成AIの統合も進んでおり、検索エンジンとの棲み分けが曖昧になっていく可能性があります。もちろん Google としてはビジネス上、ユーザー用途のバッティングを避けたいと思うはずなので、 Google Bard に統合するリアルタイムデータには制限をかける可能性があります。
ユーザー個別への最適化
ユーザーの検索履歴や好みに基づいて、よりパーソナライズされた応答が提供されるようになっていく未来も想定されます。これにより、ユーザーにとってより関連性の高い情報が提供され、使い勝手が向上します。 例えば、旅行が趣味のユーザーが「過去訪れたことがないオススメの旅先」を Google Bard に尋ねると、過去の Google Map の履歴を見て、来訪歴にない旅先を一覧で提案してくれます。これは非常に便利な機能です。しかし、昨今のクッキー廃止の世界的なトレンドからもわかる通り、個人情報の扱いは非常にセンシティブな問題になっています。おそらく、EU等、AIの規制に厳しい地域では、提供自体が難しい機能になるかもしれません。少なくとも、ユーザーの同意の元で提供される機能になることは間違いありません。
マルチモーダル機能のさらなる進化
前述した通り、現状の Google Bard で処理可能なコンテンツは限定されています。今後は、テキスト、画像ベースの応答に加えて、音声、動画、ソースコード等、様々なコンテンツの統合が進むことが考えられます。これにより、ユーザーはよりリッチな情報体験を得られるようになります。
まとめ
ChatGPTと比較すると、 Google Bard はまだまだ注目度が低いサービスであると思います。実際私自身もChatGPTの有料プランを活用していますし、性能で言えば、ChatGPTに分があると考えています。しかし、去年2023年にリリースされた Gemini (ジェミナイ)は、ここまでOpenAIが作り上げてきたChatGPTの優位性を揺るがすくらいの大きなリリースであったと考えています。実際に Google クラウドが提供する Vertex AI というサービスで Gemini を利用することができるのですが、あくまで主観的な評価にはなりますが、いくつかのパターンで性能を検証したところ GPT-4 と比較しても遜色ないレベルのレスポンスを確認しています。 Gemini は今後 Google Bard の日本語バージョンにも搭載予定になっているため、 Google Bard が性能的にも今後どのような進化を遂げていくのか、非常に楽しみです。