jueves, 28 de julio de 2022

Cómo funciona una habilidad de Alexa

Alexa Developer Console
Una habilidad de Alexa (Amazon) tiene tanto un modelo de interacción (o una interfaz de usuario de voz), como una lógica de aplicación. Cuando habla un usuario, Alexa procesa el discurso en el contexto de su modelo de interacción para determinar la solicitud del usuario. Luego, Alexa envía la solicitud a la lógica de la aplicación de habilidades, que actúa en consecuencia. La lógica de la aplicación puede ser un servicio en la nube de backend alojado por Alexa, AWS u otro servidor.

El Gestor de Solicitudes de Alexa
El Gestor de Solicitudes de Alexa: Los usuarios acceden al contenido proporcionado por una habilidad, pidiendo a Alexa que invoque la habilidad (Alexa es la palabra de activación). Una vez invocada la habilidad, el usuario puede hacer los requerimientos que sean procedentes. Alexa, tiene potencialidades (programadas), para reconocer el discurso y determinar lo que quiere el usuario (ASR: Alexa Reconocimiento del Habla y NLU: Comprensión del lenguaje natural).

El Modelo de Interacción de Voz: Define las palabras y frases que los usuarios pueden decir a Alexa para invocar las intenciones, la lógica asociada hace posible que la habilidad responda y haga lo que se requiere para cada invocación. Se puede usar un modelo prediseñado, o personalizado; mientras mapee todas las expresiones a considerar.

El SDK de Alexa incluye un constructor de habilidades (Skill Builder), que proporciona métodos de utilidad para construir las instancias de la habilidad, configurar un agente de usuario y controlador de integración con Lambda (λ de AWK; funciones lambda).

En resumen: El dispositivo hardware (ejemplo: Alexa Echo), graba el audio, lo digitaliza, lo encripta y lo envía a los servidores de Amazon en la nube; como un flujo de dato digital. El software propietario de Amazon, atiende y suministra los servicios requeridos por las solicitudes de los usuarios: transforma el flujo de audio digital en texto; reconoce el nombre de la habilidad invocada; las intenciones (new trip) y las expresiones anexas (sample utterance); los argumentos (slots asociados). Con toda esa información, ubica los métodos y funciones que garantizan los servicios requeridos o de backend ; esto se hace normalmente usando una función λ; pero puede usarse otro tipo de software o servicio en la Web (no necesariamente asociado a Amazon).

La usabilidad de un conjunto de habilidades, depende, de que también las expresiones de invocación y los valores de los parámetros personalizados, representan el uso del lenguaje en el mundo real.

Para iniciarse en esta interesante tecnología, no se requiere obligatoriamente tener un dispositivo hardware Alexa de Amazon, se puede utilizar la App de Alexa desde un teléfono "inteligente" y el Skill Builder incluido en el Alexa SDK. Amazon, posibilita la iniciación y aprendizaje disponiendo en forma libre una considerable porción de su batería de herramientas corriendo en las granjas de servidores de su nube; disponibles para cada cuenta aperturada en su sistema de desarrollo (Consola para desarrolladores de Alexa).

Uso de habilidades alojadas de Alexa

Glosario: 
  • Skill: Habilidad o Aplicación de voz.
  • Intent: Acción que el usuario quiere que el asistente desempeñe cuando se activa por una determinada petición.
  • Sample Utterance: Son aquellos enunciados o expresiones, que se anexan luego de la invocación, para que Alexa tenga suficiente información para ejecutar el intent.
  • Slot: Parámetros, Variables o Expresiones, que representan información específica en las actuaciones para elegir la intención correcta. 

EJEMPLO DE UN SKILL GENÉRICO DOCUMENTADO


No hay comentarios.:

Publicar un comentario

Páginas

Entrada destacada

Mirar al Cielo; Cumaná también tiene Estrellas:

La Foto no es desde la Estación Espacial Internacional 😁, fue tomada desde Mi Ventana ; mirando al este. Anoche se "fue la luz" ...

Entradas populares

Visitas: