Despliega Un Agente de IA de Voz Completo con Amazon Nova Sonic

Despliega Un Agente de IA de Voz Completo con Amazon Nova Sonic

Despliegue de un Agente de IA de Voz Completo con Amazon Nova Sonic

Los avances en soluciones de inteligencia artificial están revolucionando los centros de atención al cliente al permitir conversaciones naturales entre los clientes y los agentes de IA. Esto no solo acorta los tiempos de espera, sino que también reduce drásticamente los costos operativos, todo sin sacrificar la interacción humana que los clientes esperan. Con el reciente lanzamiento de Amazon Nova Sonic en Amazon Bedrock, ahora es posible construir agentes de IA conversacionales sofisticados que se comunican de manera natural mediante la voz, eliminando la necesidad de componentes separados de reconocimiento de voz y conversión de texto a voz.

Amazon Nova Sonic es un modelo de voz a voz en Amazon Bedrock que permite conversaciones en tiempo real con un tono humano. Aunque muchas implementaciones tempranas de Amazon Nova Sonic se centraron en el desarrollo local, esta solución proporciona una arquitectura completamente desplegada en la nube que se puede utilizar como base para construir aplicaciones de prueba de concepto reales. Este activo es desplegable a través del AWS Cloud Development Kit y ofrece una fundación para desarrollar más casos de uso de Amazon Nova utilizando componentes de infraestructura preconfigurados, permitiendo además personalizar la arquitectura para satisfacer requisitos comerciales específicos.

Visión General de la Solución

A continuación, se presenta un diagrama que ofrece una visión general de la solución desplegable.

Diagrama de la Solución

La solución está compuesta por las siguientes capas:

  • Capa de Frontend – Diseñada con escalabilidad y rendimiento en mente:
    • Amazon CloudFront actúa como la red de entrega de contenido para la aplicación web.
    • Amazon S3 almacena activos estáticos.
    • La interfaz de usuario gestiona la transmisión de audio y la interacción del usuario.
  • Capa de Comunicación – Facilita interacciones en tiempo real:
    • Network Load Balancer gestiona conexiones WebSocket, permitiendo sesiones de comunicación interactivas de dos vías.
    • Amazon Cognito proporciona autenticación de usuarios y validación de tokens JWT.
  • Capa de Procesamiento – La columna vertebral computacional del sistema:
    • Amazon ECS ejecuta el servicio backend en contenedores.
    • AWS Fargate proporciona el backend de computación sin servidor.
    • El backend en Python procesa flujos de audio y gestiona interacciones con Amazon Nova Sonic.
  • Capa de Inteligencia – Utiliza IA y tecnologías de datos:
    • El modelo de Amazon Nova Sonic en Amazon Bedrock maneja el procesamiento de voz.
    • Amazon DynamoDB almacena información del cliente.
    • Amazon Bedrock Knowledge Bases conecta modelos fundamentales con las fuentes de datos de la organización.

Requisitos Previos

Antes de comenzar, verifique que tiene lo siguiente:

  • Python 3.12
  • Node.js v20
  • npm v10.8
  • Una cuenta de AWS
  • El AWS CDK configurado
  • Amazon Nova Sonic habilitado en Amazon Bedrock
  • Navegador Chrome o Safari
  • Un micrófono y altavoces en funcionamiento

Despliegue de la Solución

Puede encontrar la solución y las instrucciones completas de despliegue en el repositorio de GitHub. Utilice los siguientes comandos en su terminal del AWS Command Line Interface (AWS CLI):

git clone https://github.com/aws-samples/sample-sonic-cdk-agent.git 
cd nova-s2s-call-center 

# Configurar variables de entorno
cp template.env .env

# Editar .env con su configuración

# Desplegar la solución 
./deploy.sh 

El despliegue crea dos pilas de AWS CloudFormation:

  • Pila de red para VPC y componentes de red
  • Pila para recursos de aplicación

El resultado de la segunda pila le proporcionará un enlace de distribución de CloudFront, que lo llevará a la página de inicio de sesión.

Personalizando la Aplicación

Una característica clave de esta solución es su flexibilidad; puede adaptar las capacidades del agente de IA a su caso de uso específico. La implementación de muestra demuestra esta extensibilidad a través de herramientas personalizadas e integración de conocimiento:

  • Consulta de información del cliente – Recupera datos del perfil del cliente desde DynamoDB.
  • Búsqueda en la base de conocimiento – Consulta una base de conocimiento de Amazon Bedrock para obtener información de la empresa, detalles de planes y precios.

Modificación del Prompt del Sistema

La solución incluye una interfaz de usuario en la que puede ajustar el comportamiento del agente de IA modificando su prompt del sistema. Esto permite iteraciones rápidas en la personalidad, la base de conocimiento y el estilo de conversación del agente sin necesidad de redeplegar toda la aplicación.

Expansión de la Base de Conocimiento

La solución utiliza las bases de conocimiento de Amazon Bedrock para proporcionar información específica de la empresa al agente de IA. Puede actualizar esta base de conocimiento con:

  • Preguntas frecuentes y sus respuestas
  • Catálogos de productos y especificaciones
  • Políticas y procedimientos de la empresa

Limpieza

Puede eliminar las pilas con el siguiente comando:

cd cdk
npx cdk destroy --all

Los agentes de IA están transformando cómo las organizaciones abordan el servicio al cliente, ofreciendo la capacidad de manejar múltiples conversaciones simultáneamente y proporcionar un servicio consistente las 24 horas. Esta solución hace accesibles esos beneficios, proporcionando una base desplegable para aplicaciones de Amazon Nova Sonic en AWS.

Para obtener más información, consulte los siguientes recursos:

Fuente: AWS Blogs

Deja una respuesta