Las tareas de diseño en interfaces de voz en dibujos

El mundo de la interfaces de voz suele generar la duda sobre cómo un diseñador puede aportar valor dentro de dispositivos como Alexa, Google Assistant, Siri o Bixby. Para aclarar la duda hace poco di una charla por Instagram sobre los roles y tareas de diseño en interfaces de voz o VUI, que podéis ver aquí: parte 1 y parte 2.

En cambio, como veis en el siguiente tuit, son muchos los que reconocen que en la actualidad el trabajo más importante está relacionado con el diseño de la solución y no tanto con su desarrollo.

Hoy en este post recupero los dibujos que utilicé durante la charla y aporto además una breve definición de cada una de los roles y tareas de diseño en el mundo de las interfaces de voz (VUI).

¿Qué hace un Diseñador de producto en Alexa, Google o cualquier otra VUI?

diagramas venn sobre diseño de producto: negocio, tecnología, usuario

El diseñador de producto conoce el modelo de negocio y optimiza sus recursos para proponer una solución a un problema de un usuario, teniendo en cuenta las posibilidades y limitaciones de la tecnología para la cual diseña.

En el caso de las VUI, crea soluciones basadas en conversación natural, conociendo las limitaciones del ASR (Automatic Speech recognition), el NLU (Natural Language Understanding), la generación de respuestas, el TTS (text to speech) y las propias de la comunicación entre personas (ruido, carga cognitiva, etc.).

Para profundizar en el conocimiento del usuario podrá utilizar todas las herramientas de research de usuarios clásicas, así como otras más apropiadas para el mundo conversacional, como el role play, en el cual se analiza la conversación y los temas tratados entre dos personas: una con el problema y otra con la capaciad de resolverlo.

¿En qué consiste el Diseño de Interacción en interfaces de voz?

dibujo sobre diseño de interacción

El diseñador de interacción conoce y utiliza los elementos de interacción del medio para el cual diseña facilitando la consecución del objetivo de su usuario.

En el mundo VUI, conoce las diferentes estructuras de la conversación y los elementos que la componen, pudiendo decidir, por ejemplo, en que casos utilizar preguntas abiertas, cerradas y de «sí» o «no», cuando solicitar confirmaciones explícitas o cuantos elementos incluir en una lista.

Si quieres conocer más sobre diseño de interacción en VUI, puedes leer este artículo sobre Patrones de diseño en interfaces de voz.

¿Cómo se prototipa en Alexa, Google, o cualquier otra VUI?

dibujo sobre herramientas de prototipado

Durante todo el proceso el prototipado es una actividad fundamental para validar la solución y la propia interacción. Durante el protipado nos servimos de herramientas manuales y digitales para simular el resultado final y evaluar su funcionamiento antes de iniciar su desarrollo definitivo.

En la interacción por voz podemos hacer uso de la propia conversación humana como herramienta de prototipado y podemos validar nuestros mensajes e interacciones con solo leerlos a una segunda persona. También podemos utilizar software, como por ejemplo botsociety.io.

Si quieres conocer herramientas concretas, échale un ojo a este post sobre herramientas de diseño y prototipado en interfaces de voz.

¿Cómo se hace Testing en interfaces de voz?

dubujo de un mago de oz como herramienta de testing

El testeo o testing va un paso más allá en el prototipado, permitiendo la interacción natural por parte de un usuario. Esta actividad se realiza para detectar los diferentes puntos de fricción en una interacción antes de que la solución entre en desarrollo.

Podemos utilizar software que genera soluciones cercanas al desarrollo final, con herramientas como Voiceflow o Tortu.io, pero podemos hacer también uso de otras previas, como el «Mago de Oz», por el cual un usuario interactúa con un sistema que en realidad es manejado por un ser humano.

¿Cómo se trabaja el Wording y la personalidad en interfaces de voz?

dibujo de cómo el wording puede cambiar la reacción ante un texto

El wording, está relacionado con la redacción o UX writing y tiene que ver con la definición de las palabras exactas que componen los mensajes y que tienen el objetivo transmitir el mensaje para que el usuario realice la tarea esperada o entienda la información necesaria.

En las interacciones conversacionales la tarea tiene gran relevancia al tratarse de sistemas basados en palabras y al permitir respuestas en el mismo formato. Un mensaje con un objetivo claro obtendrá una respuesta diferente dependiendo de las palabras que usemos, pudiendo general respuestas correctas, no esperadas, fuera del dominio, o incluso indignadas por parte del usuario.

Como parte de esa definición de mensajes podemos crear una personalidad para la interfaz que estamos generando que sirva de guía al tono que queremos mantenter. Sobre personalidad en interfaces de voz podéis leer más en este post y os recomiendo mucho echar un ojo a Designing for Emotion de Aaron Walter.

¿En que consiste el Diseño de audio en VUI?

dibujo sobre audio design

El diseño de audios es la actividad por la cual acompañamos la interacción de elementos sonoros, que permiten que la actividad sea más placentera y que sirven para guiar la experiencia dotándola de elementos de feedback, separación, énfasis o emoción.

Sus tareas van desde la elección de la voz en la interfaz conversacional, a los elementos sonoros que la acompañan, tanto en su tipología como en los momentos en que esos sonidos son utilizados.

Si os interesa el tema os recomiendo echar un ojo a Chris Seifert, Lead Sound Design en Amazon y a su charla en la IXDA.

¿Qué es el Diseño multimodal y cómo se trabaja en interfaces de voz?

dibujo de un dispositivo multimodal

El diseño multimodal es la integración de diferentes formas de interacción en una experiencia única. Sus tareas buscan conseguir que el usuario tenga la libertad de interactuar a través de la forma que quiera sin que el resultado se vea afectado. Las diferentes formas de interacción pueden ser táctiles, mediante la voz, gestos, emociones, posicionales…

En la actualidad cuando hablamos de diseño multimodal en dispositivos de voz estamos limitados a la integración de experiencias de voz con interacciones táctiles a través de una pantalla que aporta información visual a la conversación.

Si quieres saber más sobre diseño multimodal, échale un ojo a este post que tengo sobre consejos de diseño en dispositivos con pantalla en Alexa.

Conclusiones

Como hemos visto a lo largo del post las tareas de diseño en interfaces de voz son muchas. En mi experiencia laboral he encontrado perfiles especializados en algunas de ellas, llegando a la exclusividad, y a perfiles más amplios que cubren varias de las tareas.

¿Qué tarea o perfil os interesa más?

dibujo de gracias

 

Jesús Martín Jiménez

Soy Jesús Martín, y fui el diseñador de Alexa en Francia, Italia y España tras su lanzamiento en esos países. Me enamoré de la tecnología y de sus recovecos hace ya varios años y lo que voy descubriendo lo cuento en esta página.

 

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *