このアメリカの大手企業は、会話の抑揚やリズムをそのまま保持する新しい音声翻訳技術を導入している。

Googleが70言語に対応したリアルタイム翻訳サービス「Gemini 3.5 Live Translate」をリリース
Googleが70言語に対応したリアルタイム翻訳サービス「Gemini 3.5 Live Translate」をリリース

Googleは、音声会話をほぼリアルタイムで翻訳できる新しい人工知能モデル「Gemini 3.5 Live Translate」をリリースした。火曜日に発表されたこのシステムは、70以上の言語に対応し、話者の元のイントネーション、リズム、声質を維持できる点が特徴だ。この技術は、約500億人の定期ユーザーを誇るGoogle翻訳アプリをはじめ、同社の複数のサービスに既に無料で統合されている。

複数のサービスと統合されたテクノロジー

この開発は、昨年12月にサービス全体をGeminiテクノロジーに移行したGoogle翻訳の全面的な刷新の一環です。この自社開発のAIモデルにより、トーン、慣用句、文化的背景を考慮した、より自然でニュアンスに富んだテキスト翻訳が可能になります。Androidユーザーはリスニングモードを利用できるようになり、Google Meetも多言語ビデオ会議向けにこの機能を統合する予定です。

開発者へのより広範な展開

Gemini 3.5 Live Translateは、開発者が自社アプリケーションにこの機能を統合できるように、Gemini API経由で利用可能になります。マウンテンビューは、従来の翻訳ツールを真の同時通訳ツールへと進化させることで、言語の壁をなくすための新たな一歩を踏み出しました。このアップデートは、カリフォルニアに拠点を置く同社が、流暢で即時的な音声翻訳を日常的なコミュニケーションに広く普及させたいという強い意志を示すものです。

シェア

欧州共同体

注釈

コメント欄は開放されていますが、スパム対策が施されています。リンクを含む最初の投稿およびコメントは、手動で審査されます。

この記事に最初にコメントしてみませんか?

この記事に返信する

コメントは審査されます。宣伝メッセージ、自動送信メール、不適切なリンクはブロックされます。

最初のコメント、またはリンクを含むメッセージは、承認待ちとなる場合があります。