Google научила Gemini 2.5 понимать интонации и передавать эмоций в диалогах
На конференции Google I/O 2025 представлена обновлённая версия мультимодальной ИИ-модели Gemini 2.5. Теперь она умеет в режиме реального времени генерировать аудио и вести диалог с учётом эмоций. Доступ к функциям открыт для разработчиков через Google AI Studio и Vertex AI. Gemini 2.5 Flash Preview обеспечивает реалистичное голосовое взаимодействие. Модель распознаёт эмоциональную окраску речи, может адаптировать интонацию и акцент, а также […]
Читать дальше