Robótica

Siri y Alexa intentan parecer más humanas para conseguir que compre más

Además de entender lo que se les dice, los asistentes virtuales están evolucionando para captar las emociones y modular su discurso para ser más persuasivos y estimular las ventas de las empresas

  • Viernes, 28 de octubre de 2016
  • Por Will Knight
  • Traducido por Teresa Woods

Los descendientes de Alexa y Siri podrían tener habilidades comerciales sorprendentemente buenas.

Conocí la versión temprana de un bot de conversación persuasiva en una conferencia tecnológica celebrada recientemente en Pittsburgh (EEUU). Después de charlar un rato sobre cosas insustanciales e intercambiar alguna broma, el bot, llamado Sara, me recomendó conocer a algunas otras personas. Las sugerencias fueron excelentes, y si no las hubiese conocido ya, habría seguido su consejo.

Sara fue desarrollado por la directora de interacciones humano-máquina de la Universidad de Carnegie Mellon (EEUU), Justine Cassell, que estudia cómo los que los agentes virtuales podrían emplear pistas sutiles dentro de las conversaciones para construir relaciones con las personas y volverse más eficaces a la hora de transmitir datos o persuadirles para que hagan algo.

Foto: Sara, un bot de conversación, emplea varios micrófonos y cámaras de vídeo para rastrear las comunicaciones no verbales de una persona. Crédito: ArticuLab.

El trabajo sugiere el potencial de unos bots de conversación más útiles. La mayoría sigue siendo horriblemente torpe y se confunde con facilidad, y llevará tiempo lograr un entendimiento más profundo del lenguaje. Pero las pistas conversacionales podrían ayudar a que sean menos irritantes y más eficaces. Algunas grandes empresas ya están empleando este enfoque para mejorar sus asistentes virtuales.

Hablar con Sara desde luego me resultó menos antinatural que hablar con el típico bot de conversación. El sistema estudia las palabras que pronuncia una persona durante una conversación además del tono de su voz, y emplea varias cámaras para estudiar las expresiones faciales y movimientos de cabeza del locutor. Gracias a esta información, un programa intenta determinar la respuesta más apropiada diseñada para aumentar la sensación de empatía con esa persona. En un momento dado de nuestra conversación, por ejemplo, Sara me vio sonreir y asentir con la cabeza, y al instante hizo un comentario autocrítico.

Cassell explica: "Hay muchos bots de conversación que emplean expresiones sociales, pero las usan al azar y eso no es muy útil. En los humanos de verdad, las expresiones sociales tienen un objetivo".

Por ejemplo, según Cassell, la gente a menudo utiliza la conversación superficial para preparar el terreno para una pregunta incómoda, lo que ayuda a suavizar el golpe. Si un ordenador emplea la conversación superficial en el contexto equivocado, no sólo será menos eficaz sino resultará extraño. Cassell y sus alumnos han estudiado muchos tipos distintos de interacciones humanas para entender los componentes que podrían ser captados y codificados dentro de las máquinas, anotando más recientemente el comportamiento de alumnos de instituto que se enseñan algebra entre sí.

Aunque Cassell lleva más de una década estudiando cómo podrían las máquinas imitar el entendimiento conversacional, afirma que los investigadores corporativos sólo han empezado a mostrar su interés por su trabajo recientemente. De hecho, afirma que una gran empresa que rehusó nombrar se ofreció a comprar las patentes de Sara.

Las técnicas que están perfeccionando podrían resultar especialmente importantes a medida que los asistentes virtuales asuman más responsabilidades a la hora de guiarnos para encontrar datos y dar forma a nuestros hábitos de compra. Facebook, Microsoft y Google entre otras ven en los bots de conversación una prometedora interfaz nueva para llegar a los clientes (ver El marketing en redes sociales abraza los bots).

Foto: Sara fue expuesto en una conferencia patrocinada por el Foro Económico Mundial y celebrada en Tianjín (China) recientemente. Crédito: ArticuLab.

Algunos de los asistentes virtuales más pulidos, como Siri, ya usan algunas sutiles pistas sociales. Este año, Apple compró una empresa llamada Emotient, que está desarrollando tecnología para detectar las emociones de las personas. Eso podría señalar su intención de mejorar la inteligencia emocional de Siri.

Mientras tanto, fuentes cercanas a las investigaciones de Amazon dicen que la empresa está estudiando formas para que Alexa, el asistente virtual de su dispositivo Echo controlado por voz, se compenetre más con los estados emocionales de los usuarios tal y como expresan su tono de voz y manera de hablar (ver El asistente de Amazon derrotará a Siri detectando las emociones del usuario). Obviamente, el dispositivo de Amazon también está diseñado con un ojo puesto en permitir las compras en línea, por lo que no resulta difícil de imaginar que Alexa desarrollara una habilidosa labia comercial.

Existen retos para que funcione de una manera práctica. El profesor de la Universidad Northeastern (EEUU) Timothy Bickmore cree que uno de los mayores consiste en captar todas las diversas pistas que pueden resultar relevantes para una interacción, incluidas las expresiones faciales y el lenguaje corporal. Esto podría resultar especialmente peliagudo desde dispositivos móviles, aunque en teoría un smartphone podría captar la información empleada para hacer funcionar a programas como Sara. Y afirma que el enfoque no será de gran ayuda si una interfaz sólo está diseñada para ejecutar un comando tan rápida y eficientemente como sea posible. El experto detalla: "Esas pistas son más útiles dentro de las conversaciones naturales. A veces la conversación social sólo entorpece".

Sara, al menos, parecía bastante útil como ayudante de conferencia. Este año Cassell y sus alumnos se la llevaron a un evento organizado por el Foro Económico Mundial en Tianjín (China), donde ayudó a los asistentes a conocer a gente. Y dice que un estudio aún sin publicar demuestra que Sara es más eficaz a la hora de lograr que alguien haga clic sobre un vínculo cuando aplica sus estrategias conversacionales. Ese tipo de construcción de relaciones humano-máquina podría señalar las cosas que están por venir.

Cassell detalla: "Mi objetivo es desarrollar un dispositivo que pueda acompañarte durante toda la vida, y cuyo comportamiento evolucione con el transcurso del tiempo. Si al cabo de cinco años te habla igual que el día que lo compraste, entonces sentirás que tienes un dispositivo con amnesia, o, incluso peor, uno al que no le importas".

Para comentar, por favor accede a tu cuenta o regístrate

¿Olvidaste tu contraseña?

Informes Especiales

El futuro de la medicina: un tratamiento para cada paciente

Una ola de avances científicos e inversiones financieras puede estar a punto de marcar el nacimiento de una nueva era de atención sanitaria marcada por la personalización y la precisión. Bienvenidos al futuro de la medicina.

Otros Informes Especiales

Advertisement
Advertisement
Publicidad