Planteamiento del problema
Para que una solución empresarial basada en algoritmos de Inteligencia Artificial funcione correctamente, es necesario considerar múltiples componentes dentro de la organización. Sin embargo, en muchos proyectos estos elementos no se gestionan de manera integral o incluso se ignoran durante las fases iniciales.
Si analizamos este desafío desde un modelo de arquitectura empresarial, como TOGAF, observamos que las organizaciones operan a través de distintas dimensiones: procesos de negocio, aplicaciones, tecnología y datos.
Dentro de la dimensión tecnológica suelen distinguirse varias capas:
- Sistemas de información
- Infraestructura tecnológica
- Datos
Paradójicamente, los datos —el elemento fundamental para la Inteligencia Artificial— suelen abordarse demasiado tarde en los proyectos.
En muchas implementaciones los problemas aparecen cuando el sistema está cerca de entrar en producción:
- No existen datos suficientes para entrenar los modelos
- No hay responsables definidos para los datos
- Existen inconsistencias entre áreas de la organización
- Hay múltiples versiones de la misma información
Este fenómeno no es nuevo en la computación. Desde hace décadas se conoce el principio:
Garbage in, garbage out (Si entra basura al sistema, la salida también será basura).
Y con la Inteligencia Artificial el problema se amplifica.
Los algoritmos de Inteligencia Artificial no solo procesan información; también generan conclusiones, recomendaciones y decisiones automáticas. Cuando los datos son incorrectos, el sistema no solo produce errores, los reproduce y amplifica a gran velocidad, generando impactos significativos en los procesos del negocio.
Fundamento conceptual: ¿qué son los datos?
En el ámbito de la tecnología de la información, los datos se definen formalmente como:
“Representaciones de hechos, conceptos o instrucciones en una forma formalizada adecuada para comunicación, interpretación o procesamiento.”
— ISO/IEC 2382 – Vocabulary of Information Technology
Desde la perspectiva de gestión empresarial, el DAMA-DMBOK (Data Management Body of Knowledge) señala:
“Los datos son el activo fundamental que describe la operación de una organización y permite generar información para la toma de decisiones.”
— DAMA-DMBOK
En términos simples, existe una cadena de valor clara:
Dato → Información → Conocimiento → Decisión
Cuando el primer eslabón falla, todo lo que sigue pierde confiabilidad.
El problema estructural en las organizaciones
En la práctica, muchas empresas enfrentan problemas estructurales relacionados con la gestión de los datos.
1. Múltiples orígenes de datos
- Distintos sistemas con diferentes catálogos de clientes
- Múltiples definiciones de productos o servicios
- Registros duplicados en sistemas financieros o administrativos
En empresas más pequeñas el problema también existe, aunque con otra forma: procesos críticos gestionados en hojas de cálculo independientes, que generan múltiples versiones paralelas de la información.
2. Falta de estandarización
- Las estructuras de información son diferentes
- Los formatos de registro cambian entre sistemas
- Los catálogos no coinciden
Esto genera fricción operativa, retrasos en los procesos y sobrecostos en los proyectos tecnológicos.
3. Ausencia de responsables de los datos
- Sin responsable de su administración
- Sin control de calidad
- Sin procesos claros de actualización
4. Falta de certeza en el uso de la información
- Procesos detenidos para validar información
- Duplicidad de registros
- Reconciliación manual de datos
- Transferencias manuales de información entre sistemas
- Ciudad de México
- CDMX
- Distrito Federal
Aunque parece un detalle menor, en los sistemas de información este tipo de inconsistencias rompe la integridad de los datos.
Una lección aprendida: el caso de Business Intelligence
Diversos estudios de consultoras como Gartner señalan que uno de los factores más frecuentes de fracaso en proyectos de Inteligencia Artificial es precisamente la calidad de los datos. Pues, sin datos confiables:
- Los modelos no pueden entrenarse correctamente
- Las conclusiones pierden credibilidad
- Las organizaciones abandonan las iniciativas de IA
Conclusión estratégica
- Definir responsables claros de los datos críticos
- Establecer procesos de calidad de datos
- Asegurar la trazabilidad de la información
- Homologar catálogos y estructuras de datos
- Incorporar el gobierno de datos dentro de la arquitectura empresarial
La Inteligencia Artificial no puede sustituir una mala gestión de datos. Por el contrario: La calidad de los datos determina el valor real que la IA puede generar para la organización.
.
En I2C ayudamos a las organizaciones a evaluar su nivel de preparación y a diseñar soluciones de Inteligencia Artificial Orquestada, integradas a los procesos reales del negocio.
Solicite el check-up gratis