Google I/O 2024 のイベントでGoogleの進化の勢いを感じました。

報道では、ChatGPTの新モデル「GPT-4o【ジーピーティーフォーオーと読む。oはomni(オムニ)】」の話題のほうが上回っているように個人的に感じてますが、
つい先日行なわれた、Google I/O 2024 のイベントで、それぞれの実体をみると個人的にはこちらも飛躍的な進化を遂げていると感じました。

Geminiは、今回の発表以前より、マルチモーダルの技術がありましたが、
今回発表されたGeminiでは、より進化をさせたマルチモーダルAIの技術は革新的だと思いました。

マルチモーダルとは、異なる種類の情報(モダリティ)を理解・処理し、生成するAI技術です。
具体的には、■テキスト、■画像、■音声、■動画などを組み合わせた情報を取り扱うことができます。

とくに身近で実用的な価値として感じる
Geminiを活用した新製品(アプリの実装等)・新機能として、
●Googleフォト
Ask Photos
【写真に写っている内容を自然言語で質問できる新機能など】や
思い出アルバム

●Google検索に「AI Overview」
【検索結果に概要テキストを表示し、検索内容を素早く理解できる】

●Gmailにスマートコンポーズ
【文脈に沿った文章を自動的に提案し、メール作成を効率化】

●Android
Gemini Live
【Geminiと自然言語で会話できる新アプリ等】や、
Gemini専用アプリ

その他、Google WorkspaceとGeminiの統合 など。

いわゆる、ググラビリティ(簡単に説明すると 見つけれらやすさ)と、作業効率化も向上しているように感じました。