Advancing voice intelligence with new models in the API
OpenAIは、リアルタイム音声対話、ライブ翻訳、ストリーミング文字起こし向けの新しい音声モデルをAPIで発表しました。音声エージェントが会話中に推論し、ツールを使い、文脈を保ちながら応答する方向へ進んでいる点が注目です。
WebSearchで確認したAI関連ニュースから、注目度の高い記事を5件ピックアップしました。
OpenAIは、リアルタイム音声対話、ライブ翻訳、ストリーミング文字起こし向けの新しい音声モデルをAPIで発表しました。音声エージェントが会話中に推論し、ツールを使い、文脈を保ちながら応答する方向へ進んでいる点が注目です。
GoogleはAndroidをより能動的なAI搭載プラットフォームへ進化させる「Gemini Intelligence」を紹介しました。複数ステップの操作自動化、Chrome上の要約や比較、自然文からのウィジェット作成など、スマートフォン上のAI体験を広げる内容です。
AnthropicはGates Foundationと連携し、助成金、Claude利用クレジット、技術支援を組み合わせた2億ドル規模の取り組みを発表しました。対象はグローバルヘルス、生命科学、教育、経済的機会で、市場だけでは届きにくい領域へAIを展開する動きです。
Googleは2026年4月のAI関連発表をまとめ、Gemini Enterprise Agent Platform、Gemma 4、Deep Research Maxなどを紹介しました。企業向けエージェント基盤、オープンモデル、学習支援や動画作成など、幅広い用途でAI機能が拡張されています。
Microsoft、Google、xAIが、新しいAIモデルの公開前に米政府へ早期アクセスを提供し、安全保障上のリスク評価を受けると報じられました。フロンティアAIのサイバー悪用や軍事利用への懸念が高まる中、政府機関による事前評価の枠組みが広がっています。