La palabra de activación del dispositivo en ESP32-S3 está aquí – Voz: Capítulo 6

TL;DR: ¡Hemos agregado detección de palabras de activación en el dispositivo (microWakeWord)! Es más rápido y escalable que procesar la palabra de activación en Home Assistant. Seguiremos admitiendo el procesamiento de textos de activación en Home Assistant. También es nuevo una mayor personalización para los activadores de oraciones, intenciones adicionales para controlar más dispositivos y mejores mensajes de error y herramientas de depuración.

Mira la transmisión en vivo completa del capítulo 6 de Voice

El Año de la Voz 2023 sentó una base sólida para permitir a los usuarios controlar Home Assistant hablando en su propio idioma.

Seguimos con mejoras en Assist, que incluyen:

Ah, y “una cosa más”: ¡detección de palabras de activación de código abierto en el dispositivo en ESPHome! 🥳🥳🥳

Mire este video del nuevo sistema microWakeWord ejecutándose en un ESP32-S3-BOX-3 junto con uno que detecta la palabra de activación dentro de Home Assistant:

Palabra de activación en el dispositivo o en streaming

microWakeWord

Gracias al increíble microWakeWord creado por Kevin Ahrendt, ESPHome ahora puede realizar la detección de palabras de activación en dispositivos como el ESP32-S3-BOX-3. Puedes instalarlo en tu S3-BOX-3 hoy para probarlo.

En el Capítulo 4, agregamos la detección de palabras de activación usando openWakeWord. Desafortunadamente, openWakeWord era demasiado grande para ejecutarse en dispositivos de bajo consumo como S3-BOX-3. Así que elegimos ejecutar la detección de palabras de activación dentro de Home Assistant.

La detección de palabras de activación en HA permite que dispositivos pequeños como el kit de desarrollo M5 ATOM Echo simplemente transmitan audio y dejen que todo el procesamiento se realice en otro lugar. Esto es genial, ya que permite transformar dispositivos de baja potencia que utilizan un simple chip ESP32 en un asistente de voz incluso si no tienen la potencia necesaria para detectar palabras de activación. La desventaja es que agregar más asistentes de voz requiere más uso de CPU en HA, así como más tráfico de red.

Ingrese microWakeWord. Después de escuchar una entrevista con Paulus Schoutsen (fundador de Home Assistant) en el podcast Self Hosted, Kevin Ahrendt creó un modelo basado en la red neuronal Inception de Google. Como colaborador existente de ESPHome, Kevin pudo ejecutar este nuevo modelo en el chip ESP32-S3 dentro del S3-BOX-3. (También funciona en S3-BOX y S3-BOX-Lite, ahora descontinuados)

Kevin ha entrenado tres modelos para el lanzamiento de microWakeWord:

  • “Está bien nabú”
  • “Hola Jarvis”
  • «Alexa»

Puede probarlos usted mismo ahora siguiendo el tutorial ESP32-S3-BOX. Cambiar la palabra de activación predeterminada «ok nabu» requerirá ajustar la configuración de ESPHome y volver a compilar el firmware, lo que puede llevar mucho tiempo y requiere una máquina con más de 2 GB de RAM.

¡Agradecemos a Kevin por desarrollar microWakeWord y hacerlo parte del hogar abierto!

Respuestas desencadenantes de oraciones

Agregar oraciones personalizadas a Assist es tan fácil como agregar un activador de oración a una automatización. Esto le permite activar cualquier acción en Home Assistant con las frases que desee.

Ahora, con la nueva acción de respuesta de conversación en HA 2024.2, también puede personalizar la respuesta hablada o impresa. Usando plantillas, su respuesta puede hacer referencia al estado actual de su hogar.

También puede hacer referencia a comodines en el desencadenante de su oración. Por ejemplo, el desencadenante de la oración:

podría tener la respuesta:

Playing {{ trigger.slots.album }} by {{ trigger.slots.artist }}

además de llamar a un servicio de medios.

Puede experimentar ahora con activadores de oraciones y respuestas de conversación personalizadas en nuestro editor de automatización haciendo clic aquí:

Errores y depuración mejorados.

Ayude a los usuarios a conocer muy bien la frase «Lo siento, no pude entender eso». Este mensaje de error genérico se produjo por diversos motivos, como por ejemplo:

  • La frase no coincidía con ninguna intención conocida.
  • Los nombres del dispositivo/área no coinciden
  • No había ningún dispositivo de un tipo específico en una zona (luces, ventanas, etc.)

A partir de HA 2024.2, Assist proporciona diferentes mensajes de error para cada uno de estos casos.

Ahora, si encuentra errores, ¡sabrá por dónde empezar a buscar! Lo primero que debe verificar es que su dispositivo esté expuesto a Assist. Algunos tipos de dispositivos, como las luces, están expuestos de forma predeterminada. Otros, como las cerraduras, no lo están y deben abrirse manualmente.

Una vez que sus dispositivos estén expuestos, asegúrese de haber agregado un alias apropiado para que Assist sepa exactamente cómo se referirá a ellos. Los dispositivos y áreas pueden tener varios alias, incluso en varios idiomas, para poder adaptarse a las preferencias de todos.

Si aún tiene problemas, también se ha mejorado la herramienta de depuración de asistencia. Al utilizar la herramienta, verá cómo Assist interpreta una oración, incluidas las piezas faltantes.

Nuestros líderes lingüísticos de la comunidad están trabajando arduamente traduciendo oraciones para Assist. Si tiene sugerencias para agregar nuevas oraciones, cree un problema en el repositorio de intenciones o escríbanos a [email protected]

Gracias

Gracias a la comunidad de Home Assistant por suscribirse a Home Assistant Cloud para respaldar la voz y el desarrollo de Home Assistant, ESPHome y otros proyectos en general.

Gracias a nuestros líderes lingüísticos por ampliar el soporte de oraciones a todos los idiomas.