Año de la Voz – Capítulo 5

¡Hemos llegado al final del Año de la Voz de Home Assistant! Nuestro objetivo para 2023 era permitir a los usuarios controlar Home Assistant hablando en su propio idioma.

A principios de 2023, Home Assistant tenía control básico basado en texto para algunos dispositivos solo en inglés. A medida que se acerca el año, los usuarios ahora pueden controlar y hacer preguntas sobre sus hogares inteligentes con voz en más de 50 idiomas en una variedad de dispositivos, que incluyen:

  • Cualquier dispositivo ESPHome con micrófono
  • Teléfonos, tabletas y relojes inteligentes Android
  • Teléfonos analógicos de la vieja escuela (con adaptador)

Los usuarios de Home Assistant ahora pueden crear múltiples asistentes de voz mezclando y combinando componentes de una “canalización” de voz. Los suscriptores de Home Assistant Cloud obtienen acceso automáticamente a componentes de voz de alta calidad en más de 130 idiomas y dialectos. También están disponibles componentes totalmente locales, como nuestro sistema de texto a voz Piper, que permite un control de voz 100% fuera de línea.

En el Capítulo 4, agregamos el procesamiento de textos de activación directamente en Home Assistant aprovechando el proyecto openWakeWord. Esto permitió que pequeños satélites de voz, como el kit de desarrollo M5 ATOM Echo, descargaran la detección de palabras de activación mediante la transmisión de audio a un servidor Home Assistant. La comunidad ha trabajado arduamente entrenando una variedad de palabras de activación personalizadas que todos pueden usar para hacer que su experiencia de voz sea única.

Para el último capítulo de 2023, hemos ampliado los tipos de comandos de voz disponibles para incluir el clima, la temperatura y listas de tareas pendientes. Los satélites de voz ahora saben en qué área se encuentran y también hay más opciones de hardware/software disponibles.

¡Felices vacaciones!

Asistencia a la ejecución del ESP32-S3-BOX.

El S3-BOX-3

Espressif lanzó recientemente el ESP32-S3-BOX-3, una actualización del ESP32-S3-BOX descontinuado (y la variante “lite”). Este kit de desarrollo “AIoT” contiene un chip ESP32-S3, micrófonos duales, un pequeño altavoz y una pantalla. Hay varias bases disponibles en la caja, que exponen un conector de alimentación USB-C y pines GPIO para expandir el dispositivo.

Ayude a ejecutar el ESP32-S3-BOX con ilustraciones personalizadas.

El equipo de ESPHome ha trabajado arduamente para agregar soporte para el S3-BOX-3, ¡incluida la capacidad de personalizar la pantalla! Consulte el tutorial S3-BOX-3 para comenzar.

Pasa las vacaciones con Frenck como tu asistente de voz.

Más comandos de voz

Comenzando desde el Capítulo 1, agregamos comandos de voz para:

  • Encendido y apagado de luces y otros dispositivos
  • Apertura y cierre de puertas, ventanas, etc.
  • Configurar el brillo y el color de las luces.
  • Agregar artículos a una lista de compras
  • Hacer preguntas, como qué ventanas están abiertas en un área

Para el Capítulo 5, hemos ampliado esta lista para incluir:

  • Agregar elementos a una lista de tareas pendientes: «agregar sacar la basura a mi lista de tareas»
  • Obtener la temperatura interior: «¿cuál es la temperatura?»
  • Obtener las condiciones climáticas actuales: «¿Cómo está el clima?»
  • Cancelar una activación por satélite: «no importa»

Asegúrese de haber expuesto los dispositivos a los que desea que Assist tenga acceso y de que tengan el nombre adecuado. Siempre puedes agregar un alias cuando quieras hacer referencia a un dispositivo mediante algo más conveniente para la voz. Por ejemplo, agregar un alias «Berlín» a una entidad meteorológica le permitiría decir «¿cómo está el clima en Berlín?».

Conciencia del área

Los satélites de voz se pueden colocar por toda la casa y es importante tener en cuenta su área al interpretar comandos como «encender las luces». Este comando ahora encenderá todas las luces en el área del satélite y «apagar las luces» hará lo contrario. Por supuesto, aún puedes orientar las luces en un área diferente, especificando: “encender las luces del dormitorio”.

Los satélites de voz aprovechan la zona en la que se encuentran.

Este es un pequeño comienzo para que los satélites sean conscientes de su contexto y ajusten su comportamiento en consecuencia.

Satélites Raspberry Pi mejorados

Hasta la fecha, los satélites de voz basados ​​en Raspberry Pi han utilizado la API websocket de Home Assistant. Esto tenía varias limitaciones, como requerir un token API, no saber en qué área estaba el satélite y no poder configurarlo en la interfaz de usuario de Home Assistant.

Hemos ampliado la integración de Wyoming para comunicarnos directamente con satélites remotos. Estos satélites se descubren automáticamente y se pueden configurar de manera muy similar a los satélites basados ​​en ESPHome con la capacidad de establecer un área y un canal de voz.

Se admiten varios modos de satélite, incluidos:

  • Transmisión siempre activa: el satélite transmite todo el audio a Home Assistant

  • Transmitir por voz: solo transmite audio una vez que se detecta la voz

  • Palabra de activación local: solo transmite audio cuando se detecta una palabra de activación localmente

La limpieza de audio, como el control automático de ganancia y la supresión de ruido, se puede realizar en Home Assistant o en el satélite. Una Raspberry Pi Zero 2 W tiene potencia más que suficiente para realizar una limpieza de audio local y una detección de palabras de activación, lo que le permite tener muchos satélites sin sobrecargar su servidor Home Assistant. ¡Reutiliza tu antigua Raspberry Pi y comienza tu viaje con el control por voz inteligente en el hogar!

Raspberry Pi Zero 2 W (PVP: $15 USD).

Manténganse al tanto

Aunque el Año de la Voz está llegando a su fin, ¡la voz en Home Assistant apenas comienza! Yo, Mike “The Voice” Hansen, continuaré en Nabu Casa para mejorar y ampliar las capacidades de voz y lenguaje natural de Home Assistant.

En la hoja de ruta para el próximo año, estamos planeando cosas como la detección local de palabras de activación en el S3-BOX-3 y la integración con modelos de lenguajes grandes (LLM) como GPT. También seguimos buscando el hardware satelital de voz perfecto: económico y con excelente audio, pero también capaz de ejecutar modelos de palabras de activación de código abierto localmente.

Gracias

Gracias a la comunidad de Home Assistant por suscribirse a Home Assistant Cloud para apoyar el Año de la Voz y el desarrollo de Home Assistant, ESPHome y otros proyectos en general.

Gracias a nuestros líderes lingüísticos por ampliar el soporte de oraciones a todos los idiomas.