Saltar al contenido

SpainClouds

La Crisis de privacidad de datos en IA Generativa y cómo blindarla

En el panorama tecnológico actual, la IA generativa (GenAI) ha pasado de ser una promesa de ciencia ficción a una herramienta empresarial crítica, especialmente en lo que a seguridad de datos se refiere.

Este avance ha provocado lo que Alejandro Fuenmayor, Cloud Solution Senior Manager en Oracle, describió durante la pasada edición de SpainClouds Summit 2025, como una «historia de desamor» o crisis entre la IA y los datos corporativos, principalmente debido a desafíos de seguridad y privacidad.

Descubre a continuación las claves para reconciliar esta relación y cómo las organizaciones pueden aprovechar el potencial de los modelos de lenguaje sin comprometer sus activos más valiosos.

1. ¿Los datos pertenecen a mi empresa o a la IA?

Uno de los principales frenos para la adopción masiva de la GenAI en entornos corporativos es la custodia de los datos. Al enviar información a través de APIs de terceros, surge la duda: ¿quién consume esa información y qué tratamiento recibe?.

Para solucionar esto, Oracle propone modelos de despliegue privado en infraestructura dedicada (Bare Metal), donde los datos utilizados para interactuar con modelos como Llama 4 o Cohere son privados y se destruyen una vez que el clúster desaparece.

2. Oracle 23ai: La base de datos multimodal y el "Select AI"

La gran novedad en la gestión de datos es la versión Oracle Database 23ai. Esta base de datos es multimodal, lo que permite combinar en una sola consulta SQL datos relacionales, documentos JSON, grafos y, crucialmente, vectores.

3. RAG: La solución contra las "alucinaciones" IA

La técnica conocida como Retrieval-Augmented Generation (RAG) actúa como un filtro de confianza para los modelos de lenguaje. En lugar de confiar ciegamente en el conocimiento público del modelo (que puede estar desactualizado o inventar datos), el RAG utiliza los datos propios de la organización (estructurados o no) para personalizar las respuestas.

Esto no solo evita alucinaciones, sino que garantiza que la IA responda basándose en manuales internos, documentos de negocio o bases de datos específicas de la empresa.

RAG elimina las alucinaciones de la IA

Este comportamiento no es casual: entender cómo funciona RAG con búsqueda vectorial permite comprender por qué el modelo deja de “inventar” respuestas y se limita a información real y contextualizada.

4. El modelo viaja al dato, no al revés

Tradicionalmente, los datos debían viajar hacia donde estaba el modelo de aprendizaje automático. Oracle ha invertido este flujo mediante Oracle Machine Learning (OML), permitiendo embeber algoritmos de IA directamente en la base de datos.

Esto permite:

  • Reducir el trasiego de información sensible.
  • Utilizar modelos de plataformas como Hugging Face para que corran dentro del repositorio de datos, aumentando la seguridad.

4. Infraestructura de Supercúster: La "fiebre del oro" de las GPUs

La IA generativa requiere una capacidad de cómputo masiva. Fuenmayor compara las GPUs con «los picos y las palas» de la fiebre del oro actual. Oracle ofrece una infraestructura de supercúster que permite gestionar cientos de miles de GPUs en modo enjambre a través de redes RDMA de baja latencia, lo que facilita el entrenamiento y la inferencia de modelos a gran escala.

Soluciones de IA con superclasters de GPU

5. Agentes y Asistentes: IA en todas las capas

La estrategia de Oracle no se limita a la infraestructura, sino que integra la IA en todo su portfolio:

  • Servicios de Visión y Documentos: Capacidad de extraer automáticamente datos de facturas o DNIs. Si el modelo estándar falla, el cliente puede reentrenarlo con sus propios datos en un corto periodo de tiempo.

  • Digital Assistant: Actúa como la «ventanilla única» o el «mediocentro» de la organización, conectando diferentes servicios con interfaces conversacionales.

  • Oracle Code Assist: Un asistente diseñado para desarrolladores, optimizado con el conocimiento de los repositorios de código de Oracle (Java y PL/SQL), que genera código, documentación y pruebas unitarias.

Recibe nuestra Newsletter de Cloud semanal

La clave para superar la crisis entre la IA y los datos reside en la soberanía del dato. Al utilizar herramientas como APEX para el desarrollo rápido (low-code) y desplegar agentes de IA en entornos controlados, las empresas pueden transformar sus ideas en producción de forma ágil y segura,.

Para aquellos interesados en experimentar, existen laboratorios en vivo y versiones gratuitas de la base de datos 23ai para ejecutar en contenedores o en la nube pública.

Últimos articulos de SpainClouds Summit