Buscar inteligentemente el contenido de Drupal utilizando Amazon Kendra

Explora de manera inteligente el contenido de Drupal utilizando Amazon Kendra

Amazon Kendra es un servicio de búsqueda inteligente impulsado por el aprendizaje automático (ML). Amazon Kendra te ayuda a agregar fácilmente contenido de una variedad de repositorios de contenido en un índice centralizado que te permite buscar rápidamente todos los datos de tu empresa y encontrar la respuesta más precisa. Drupal es un software de gestión de contenido. Se utiliza para crear muchos de los sitios web y aplicaciones que usamos a diario. Drupal tiene un gran conjunto de características, como la redacción sencilla de contenido, un rendimiento confiable y seguridad. Muchas organizaciones utilizan Drupal para almacenar su contenido. Uno de los requisitos clave para muchos clientes que utilizan Drupal es la capacidad de encontrar información precisa de forma fácil y segura en todos los documentos de la fuente de datos.

Con el conector de Drupal de Amazon Kendra, puedes indexar el contenido de Drupal, filtrar los tipos de contenido personalizados que deseas indexar y buscar fácilmente el contenido de Drupal utilizando la búsqueda inteligente de Amazon Kendra.

Esta publicación te muestra cómo utilizar el conector de Drupal de Amazon Kendra para configurar el conector como una fuente de datos para tu índice de Amazon Kendra y buscar tus documentos de Drupal. Según la configuración del conector de Drupal, puedes sincronizar el conector para rastrear e indexar diferentes tipos de contenido de Drupal, como blogs y wikis. El conector también ingiere la información de la lista de control de acceso (ACL) para cada archivo. La información de ACL se utiliza para el filtrado de contexto de usuario, donde los resultados de búsqueda para una consulta se filtran según el acceso autorizado de un usuario.

Prerrequisitos

Para probar el conector de Amazon Kendra para Drupal utilizando esta publicación como referencia, necesitas lo siguiente:

Configurar la fuente de datos utilizando el conector de Amazon Kendra para Drupal

Para agregar una fuente de datos a tu índice de Amazon Kendra utilizando el conector de Drupal, puedes utilizar un índice existente o crear un índice nuevo. Luego, completa los siguientes pasos. Para obtener más información sobre este tema, consulta la Guía del desarrollador de Amazon Kendra.

  1. En la consola de Amazon Kendra, abre tu índice y elige Fuentes de datos en el panel de navegación.
  2. Elige Agregar fuente de datos.
  3. En Drupal, elige Añadir conector.
  4. En la sección Especificar detalles de la fuente de datos, ingresa un nombre y descripción y elige Siguiente.
  5. En la sección Definir acceso y seguridad, para URL del host de Drupal, ingresa la URL del sitio de Drupal.
  6. Para configurar los certificados SSL, puedes crear un certificado autofirmado para esta configuración utilizando el comando openssl x509 -in mydrupalsite.pem -out drupal.crt y almacenar el certificado en un depósito de Amazon Simple Storage Service (Amazon S3). Para obtener más detalles sobre cómo generar una clave privada y el certificado, consulta Generación de certificados.
  7. Elige Examinar S3 y selecciona el depósito de S3 con el certificado SSL.
  8. En Autenticación, tienes dos opciones:
    • Usar Secrets Manager para crear nuevas credenciales de autenticación de Drupal. Necesitas un nombre de usuario y una contraseña de administrador de Drupal (además, un ID de cliente y un secreto de cliente para la autenticación de OAuth 2.0).
    • Usar un secreto existente de Secrets Manager que tenga las credenciales de autenticación de Drupal a las que deseas que acceda el conector (además, un ID de cliente y un secreto de cliente para la autenticación de OAuth 2.0).
  9. Elige Guardar y agregar secreto.
  10. Para Rol de IAM, elige Crear un nuevo rol o elige un rol de IAM existente configurado con las políticas de IAM adecuadas para acceder al secreto de Secrets Manager, al índice de Amazon Kendra y a la fuente de datos.

Consulte Roles IAM para las fuentes de datos para obtener los permisos requeridos para el rol IAM.

  1. Elija Siguiente.
  2. En la sección Configurar opciones de sincronización, seleccione Artículos, Páginas básicas, Bloques básicos, Tipos de contenido personalizados y Bloques personalizados junto con las opciones para rastrear comentarios y adjuntos según sea necesario.
  3. Opcionalmente, ingrese los patrones de inclusión/exclusión para los títulos de la entidad.
  4. Proporcione información sobre el alcance de sincronización (completo o solo delta) y especifique el cronograma de ejecución.
  5. Elija Siguiente.
  6. En la sección Establecer mapeos de campos, agregue campos personalizados de Drupal que desea sincronizar y sus respectivos mapeos de campos de Amazon Kendra. Los campos requeridos ya están premapeados por Amazon Kendra.
  7. Elija Siguiente.
  8. Revise las configuraciones y guarde la fuente de datos.
  9. Elija Sincronizar ahora en la fuente de datos creada para iniciar la sincronización de datos con el índice de Amazon Kendra.

El tiempo necesario para rastrear y sincronizar el contenido en Amazon Kendra varía según el volumen de contenido y el rendimiento.

Ahora puede buscar el contenido de Drupal indexado utilizando la consola de búsqueda o una aplicación de búsqueda. Opcionalmente, también puede buscar con ACL siguiendo los siguientes pasos adicionales.

  1. Vaya a la página de índice que creó y, en la pestaña Control de acceso de usuarios, elija Editar configuración.
  2. En las configuraciones de control de acceso, seleccione , mantenga los valores predeterminados para Nombre de usuario y Grupos, elija JSON para Tipo de token y mantenga la expansión de usuario-grupo como Ninguno.
  3. En la siguiente página, mantenga los valores predeterminados (o cámbielos según sus requisitos de capacidad) y elija Actualizar.

Realizar búsqueda inteligente con Amazon Kendra

Antes de intentar buscar en la consola de Amazon Kendra o utilizar la API, asegúrese de que la sincronización de la fuente de datos esté completa. Para verificarlo, vea las fuentes de datos y verifique si la última sincronización fue exitosa.

  1. Para comenzar la búsqueda, en la consola de Amazon Kendra, elija Buscar contenido indexado en el panel de navegación.

Se lo redirigirá a la consola de búsqueda de Amazon Kendra. Ahora puede buscar información en los documentos de Drupal que indexó utilizando Amazon Kendra.

  1. En esta publicación, buscamos un documento almacenado en la fuente de datos de Drupal.
  2. Expanda Consultar prueba con un token de acceso y elija Aplicar token.
  3. Para Nombre de usuario, ingrese la dirección de correo electrónico asociada a su cuenta de Drupal.
  4. Elija Aplicar.

Ahora el usuario solo puede ver el contenido al que tiene acceso según el nombre de usuario o grupos especificados. En nuestro ejemplo, el usuario de Drupal con el correo electrónico [email protected] no tiene acceso a ningún documento en Drupal, por lo que no se muestra ninguno.

Limitaciones

Tenga en cuenta las siguientes limitaciones al utilizar esta solución:

  • No se pueden rastrear los tipos de contenido (como artículo o página básica) que no están asociados a ninguna vista.
  • Si un administrador no tiene acceso a un bloque, entonces no se puede rastrear los datos del bloque.
  • El contenido del cuerpo del documento para los tipos de contenido artículo, página básica, bloque básico, tipo de contenido definido por el usuario y tipo de bloque definido por el usuario se muestra en formato HTML. Si el contenido HTML no está bien formado, entonces aparecerán las etiquetas relacionadas con HTML en el cuerpo del documento y, por lo tanto, se pueden ver en los resultados de búsqueda de Amazon Kendra. Esto también se aplica a los comentarios de artículo, página básica, bloque básico, tipo de contenido definido por el usuario y tipo de bloque definido por el usuario.
  • El tipo de contenido o tipo de bloque sin descripción o cuerpo no se inyectará en el índice de Amazon Kendra porque hay una validación en el lado del SDK de Amazon Kendra. Sin embargo, Drupal le permite crear el tipo de contenido sin descripción o cuerpo. Solo se inyectarán en el índice de Amazon Kendra los comentarios y archivos adjuntos de los respectivos tipos de contenido o tipos de bloque (si existen).

Limpieza

Para evitar incurrir en costos futuros, limpie los recursos que creó como parte de esta solución. Si creó un nuevo índice de Amazon Kendra mientras probaba esta solución, elimínelo. Si solo agregó una nueva fuente de datos utilizando el conector de Amazon Kendra para Drupal, elimine esa fuente de datos. Elimine cualquier usuario IAM creado.

Conclusión

Con el conector de Amazon Kendra para Drupal, su organización puede buscar contenido almacenado en un sitio Drupal de manera segura utilizando la búsqueda inteligente impulsada por Amazon Kendra. En esta publicación, le presentamos la integración, pero hay muchas características adicionales que no cubrimos, como las siguientes:

  • Puede asignar campos adicionales a los atributos del índice de Amazon Kendra y habilitarlos para facetas, búsqueda y visualización en los resultados de búsqueda.
  • Puede integrar la fuente de datos de Drupal con la capacidad de Enriquecimiento de Documentos Personalizado (CDE) en Amazon Kendra para realizar lógica de asignación de atributos adicional e incluso transformación personalizada de contenido durante la ingestión.

Para obtener más información sobre las posibilidades con Drupal, consulte la Guía del desarrollador de Amazon Kendra.

Para obtener más información sobre otros conectores integrados de Amazon Kendra para fuentes de datos populares, consulta la página de Conectores de Amazon Kendra.

We will continue to update Zepes; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

Aprendizaje Automático

Red Cat y Athena AI crean drones militares inteligentes con visión nocturna.

Red Cat Holdings, Inc., una empresa líder en tecnología militar, ha logrado un hito en su colaboración con Athena AI....

Inteligencia Artificial

Revelando Redes de Flujo Bayesiano Una Nueva Frontera en la Modelización Generativa

La Modelización Generativa se encuentra dentro del aprendizaje automático no supervisado, donde el modelo aprende a d...

Inteligencia Artificial

Amplios horizontes La presentación de NVIDIA señala el camino hacia nuevos avances en Inteligencia Artificial

Los avances dramáticos en el rendimiento del hardware han dado lugar a la IA generativa y a una rica variedad de idea...

Inteligencia Artificial

Conoce CodeGPT Una nueva herramienta de generación de código que está causando sensación en la comunidad de IA

Nuevo entre las herramientas de generación de código de IA, CodeGPT se está convirtiendo rápidamente en favorito entr...

Inteligencia Artificial

Top 50 Herramientas de Escritura de IA para Probar (Agosto 2023)

Grammarly Grammarly es una gran herramienta para mejorar la escritura. Revisa la gramática, ortografía, puntuación y ...