16 abril 2020

Como en cualquier tipo de producto digital, realizar tests de usabilidad para interfaces de voz es sumamente importante. Estos tipos de tests son similares a los tests de usabilidad que aplicamos al resto de productos digitales, pero tienen sus particularidades. Las explico en el post de hoy.

Puntos iniciales a tener en cuenta

En primer lugar, al comienzo de las pruebas es preferible no revelar a los usuarios que el sistema utiliza el reconocimiento de voz anticipado. Esto resulta importante porque uno de los insights a determinar es descubrir si los usuarios son conscientes de cómo o cuándo pueden comunicarse con el sistema.

Imagen de rawpixel.com

Otra metodología común es pedirle al usuario que realice la técnica de Think aloud, donde el usuario narra en voz alta sus pensamientos y los flujos de navegación por los que va adentrándose en la interfaz. Habrá que tener en cuenta que cuando se realizan test de usabilidad para interfaces de voz, esto no es posible.

Definición de objetivos

Es importante definir con claridad y análisis los objetivos que se quieren obtener con estos tests. El artículo Usability testing for Voice AI products lista las peculiaridades de objetivos para las interfaces de voz de manera muy concisa:

  • Flujo de interacción: Se plantean mediante preguntas los insights más relevantes que queremos conseguir respecto al flujo de interacción:
    • ¿Saben los usuarios cómo iniciar y/o finalizar la tarea?
    • ¿Entienden cómo navegar y avanzar?
    • ¿Existen rutas de navegación confusas por las que el usuario puede perderse?. En ese caso, ¿Cómo habría que orientarlo para que éste vuelva a su ruta correcta?
    • ¿Perciben los usuarios mejoras en esta nueva interfaz con respecto a la solución actual?
  • Respuestas de lenguaje natural: en este caso deberán plantearse las siguientes preguntas:
    • ¿Son las indicaciones y las respuestas de voz claras e informativas?
    • ¿Está la interfaz dando la información correcta en el momento correcto?
    • ¿Entienden los usuarios los mensajes de error?
  • Reconocimiento de voz automatizado: en este escenario, existe siempre un paso intermedio de transcripción entre la instrucción del usuario y la acción ejecutada:
    • ¿Hay transcripciones fallidas? ¿Cómo soluciona la interfaz esos fallos?
    • ¿Se identifican patrones de error recurrentes?
    • ¿Cuáles son estos patrones?. ¿Por qué ocurren?

Otras preguntas transversales y de suma importancia son: ¿Qué problema/s resuelve la interfaz de voz que estamos testeando? y ¿Qué aspectos del mundo real podrían ayudar a obtener ideas?

Como punto de inspiración para poder responder a estas preguntas pondré el ejemplo de Cortana. Microsoft se basó en personal real de atención al cliente para recopilar ideas sobre las posibles características de los asistentes de voz.

Los diseñadores UX pronto descubrieron que los trabajadores de Customer Service pedían ayuda cuando no conseguían resolver la solicitud de un cliente, o no entendían una tarea asignada. Por tanto, al igual que en el mundo real, Microsoft implementó en Cortana la solicitud de ayuda. También se observó que el personal tenía una ficha historial de cada cliente, funcionalidad que también se incluyó en el asistente inteligente.

Definición de tareas

Muchas de las metodologías de investigación dentro del UX Research siguen siendo aplicables para productos con interfaces de voz. Pero como comenté al principio, hay ciertas particularidades con las que habrá que ser especialmente cuidadosos. En el terreno de la definición de tareas, hay dos puntos que debemos revisar con esmero:

  • Revisar especialmente la descripción de las tareas para evitar dar pistas al usuario, ya que es fácil en este entorno incluir palabras que coincidan con los comandos que el usuario tendrá que dictar para dar las instrucciones a la interfaz.
  • Recalcar el hecho de que se está testeando el producto y no al usuario. Es obvio, esto se recalca en cualquier test de usabilidad. Pero en este marco es especialmente importante ya que, debido a la inmadurez de la tecnología, los participantes se encontrarán con errores con mucha más frecuencia que en los tests de un producto digital con interfaz visual. Los usuarios se sentirán más avergonzados, por lo tanto habrá que transmitirles tranquilidad extra para hacerles sentir cómodos pudiendo así realizar el test con naturalidad.

Configurar el prototipo

Los prototipos para tests de usabilidad se vuelven complejos cuando se trata de prototipar para interfaces de voz. Dentro de este proceso, uno de los aspectos fundamentales será el desarrollo de los flowcharts de diálogo, donde se desplegarán la distintas ramas de opciones y flujos de conversación.

Hay multitud de herramientas en el mercado que ofrecen servicios para prototipado de voz, pero quizás les falta profundidad en los desarrollos. Adobe XD, Figma, y Sketch, entre otras, ofrecen servicios para interfaces de voz pero en sí mismas no abarcan todo el escenario.

Lo ideal es testear el propio producto en desarrollo, pero si esto no es posible, existen aplicaciones más especializadas que pueden ayudar en este campo:

  • Amazon Polly. Es un servicio que convierte texto en habla verosímil, lo que permite crear aplicaciones que hablan y categorías totalmente nuevas. Utiliza tecnologías de aprendizaje profundo para sintetizar un habla que se asemeja a la voz humana. Además también permite crear aplicaciones multilenguaje.
  • DialogFlow. Es otra opción que permite la creación de interfaces de conversación basadas en texto y voz, incluyendo chatbots y tecnología de Inteligencia Artificial. Como punto ventajoso, DialogFlow incorpora la experiencia y los productos de aprendizaje automático de Google.
  • Botsociety. Una aplicación muy interesante que facilita integraciones con Sketch. También está enfocada en Messenger, Slack, Alexa y Google Home.

Realización de los tests

Normalmente, en cualquier test de usabilidad se llevan a cabo comprobaciones previas. En el caso de las interfaces de voz esto es particularmente importante, ya que habrá que comprobar la precisión del reconocimiento. Por esto es aconsejable testearlo en profundidad, ya que los fallos de reconocimiento pueden causar problemas y evitar que los usuarios completen las tareas.

Otro de los puntos esenciales llegados a esta fase, es el comentado al inicio del post: habrá que ser cautos y no dar pistas a la hora de explicar las tareas. Es muy fácil caer en este error cuando se habla de interfaces basadas en lenguaje humano, que se activan mediante palabras o frases clave.

Trabajamos proyectos de diseño de servicios y productos digitales en los que la investigación de usuarios es un elemento fundamental del proceso.