Integración de Amazon Bedrock Knowledge Bases con Amazon OpenSearch Service Managed Cluster
La integración de Amazon Bedrock Knowledge Bases con Amazon OpenSearch Service como clúster gestionado representa un avance significativo en la capacidad de almacenar y recuperar vectores en aplicaciones de inteligencia artificial. Este artículo explora cómo implementar esta conexión, proporcionando una guía paso a paso para maximizar el uso de esta potente combinación.
Con la reciente actualización de Amazon Bedrock, que ahora permite el uso de clústeres gestionados de OpenSearch como almacén de vectores, las organizaciones pueden beneficiarse de una solución de generación de recuperación aumentada (RAG) completamente gestionada. Esta mejora permite a los usuarios conectar modelos fundamentales con fuentes de datos internas de manera más eficiente y efectiva.
Beneficios de utilizar OpenSearch Service Managed Cluster como almacén de vectores
OpenSearch Service ofrece dos opciones de implementación para cargas de trabajo de vectores: clústeres gestionados y colecciones sin servidor. Ambas opciones aprovechan las capacidades de búsqueda y recuperación de vectores de OpenSearch, aunque cada una es adecuada para diferentes escenarios. Los clústeres gestionados permiten una mayor flexibilidad de configuración, opciones de ajuste de rendimiento y escalabilidad, lo que los hace ideales para aplicaciones de IA a gran escala.
Algunas de las ventajas clave de utilizar un clúster gestionado de OpenSearch incluyen:
- Configuración flexible: Permite una personalización extensa para satisfacer requisitos específicos de rendimiento.
- Optimización de rendimiento y costos: Proporciona control granular sobre la precisión, latencia y costos asociados con la base de datos de vectores.
- Acceso anticipado a características avanzadas de ML: Las nuevas capacidades de búsqueda de vectores suelen estar disponibles primero en clústeres gestionados.
Requisitos previos para la integración
Antes de comenzar con la configuración, es fundamental contar con ciertos elementos en su lugar:
- Fuente de datos: Un bucket de Amazon S3 con documentos para la ingestión en la base de conocimientos.
- Dominio de OpenSearch Service: Asegúrese de que el dominio esté en la misma región y cuenta donde creará su base de conocimientos de Amazon Bedrock.
Resumen de la solución
La integración de un clúster gestionado de OpenSearch con Amazon Bedrock Knowledge Bases implica varios pasos clave:
- Crear un dominio de OpenSearch Service.
- Configurar un índice vectorial en OpenSearch Service.
- Configurar la base de conocimientos de Amazon Bedrock.
- Configurar permisos de acceso controlados en OpenSearch Service.
- Completar la creación de la base de conocimientos e ingresar datos.
Creación de un dominio de OpenSearch Service
Para establecer un clúster gestionado de OpenSearch, siga estos pasos:
- En el OpenSearch Service console, seleccione «Managed clusters» como tipo de implementación y haga clic en «Create domain».
- Proporcione un nombre de dominio, como bedrock-kb-domain.
- Configure la versión del motor como OpenSearch 2.13 o superior.
- Configure el acceso de red como «Public access».
- Habilite el control de acceso granular para asegurar su dominio.
Configuración de un índice de vectores en OpenSearch Service
Para almacenar vectores de documentos, es necesario crear un índice habilitado para búsqueda de vectores. Utilice las herramientas de desarrollo en OpenSearch Dashboards para definir y crear el índice con el siguiente comando:
PUT /bedrock-kb-index
{
"settings": {
"index": {
"knn": true
}
},
"mappings": {
"properties": {
"embeddings": {
"type": "knn_vector",
"dimension": 1024,
"space_type": "l2",
"method": {
"name": "hnsw",
"engine": "faiss",
"parameters": {
"ef_construction": 128,
"m": 24
}
}
},
"AMAZON_BEDROCK_TEXT_CHUNK": {
"type": "text",
"index": true
},
"AMAZON_BEDROCK_METADATA": {
"type": "text",
"index": false
}
}
}
}
Configuración de la base de conocimientos de Amazon Bedrock
Inicie el proceso de creación de la base de conocimientos en la consola de Amazon Bedrock, conectándola a su dominio de OpenSearch configurado como almacén de vectores. Asegúrese de ingresar correctamente la ARN del dominio y la información del índice creado.
Configuración de permisos de acceso controlados en OpenSearch Service
Implemente un control de acceso granular asignando permisos específicos a la base de conocimientos de Amazon Bedrock. Esto garantiza que solo las operaciones permitidas puedan ser ejecutadas.
Esta integración no solo mejora la capacidad de almacenamiento de datos, sino que también optimiza la búsqueda y recuperación de información, facilitando el acceso a datos críticos para aplicaciones impulsadas por inteligencia artificial.
Para más información sobre cómo empezar con Amazon Bedrock Knowledge Bases, visite la página oficial de Amazon Bedrock.
Fuente: AWS Blog












