Inteligencia artificial en procesos legales: más allá de la ciencia ficción
22 de Junio de 2021
Ingeniero Juan Pablo Caro, ACE
Consultor senior
FTI Consulting Informática Forense
En 1956, el escritor norteamericano Philip K. Dick publicó la novela corta The Minority Report en la revista especializada en ciencia ficción Fantastic Universe. Adaptada al cine en una película del 2002, la trama de The Minority Report gira alrededor de un cuerpo de policía en una sociedad futurista que es capaz de predecir el crimen antes de que este ocurra, a través del acceso a una forma de inteligencia avanzada.
Más allá de los cuestionamientos morales acerca del libre albedrío, la libertad y el autoritarismo, propios de la obra de Dick, la idea de usar una forma de inteligencia artificial como parte de la investigación de algún crimen parece completamente fantástica e imposible y, a pesar de que tecnologías como la ciencia de datos, la inteligencia artificial y el aprendizaje automático hoy son usadas ampliamente en plataformas de venta en línea, redes sociales, aplicaciones móviles y muchas otras industrias, la aplicación de estas técnicas y herramientas a procesos legales, de investigación y de justicia es aún muy incipiente.
Sin embargo, ya existen herramientas, recursos y metodologías que pueden ayudar a la identificación de evidencia digital en procesos de investigación aplicados a fraude, corrupción e investigaciones internas en entornos corporativos y, aunque América Latina está un poco rezagada en el uso de estas tecnologías, es hora de que se sume a esta tendencia que es común en el entorno legal de otros países.
La evidencia digital y el ‘e-Discovery’
El “descubrimiento electrónico”, conocido comúnmente por su nombre en inglés e-Discovery, hace referencia al proceso de identificación, preservación, revisión y preparación de información a partir de medios de almacenamiento digital, con el fin de usarla como soporte a procedimientos legales. Esto típicamente incluye datos contenidos en una gran cantidad de dispositivos electrónicos y fuentes de información, incluyendo computadores personales, teléfonos celulares, recursos compartidos o servicios en la nube, correo corporativo, sistemas de respaldo, sistemas contables, entre muchos otros datos.
No es difícil imaginar cómo, durante un proceso de investigación o de preparación de un proceso legal, la cantidad de datos, fuentes de información y documentos preservados aumenta rápidamente a medida que se desarrolla la investigación. Incluso, desde el momento en que se inicia el proceso, fácilmente se llega a terabytes de datos que deben ser procesados, analizados y clasificados, porque pueden contener información potencialmente relevante para el proceso legal.
Basta con ver nuestro escritorio en este momento y contar cuántos dispositivos que contienen documentos hay en él: ¿dos?, ¿tres?, ¿tal vez un computador y un par de teléfonos celulares?, ¿y qué hay de la información en nuestro correo corporativo o en servicios en la nube? Es fácil imaginar cómo, a medida que la tecnología ha entrado en nuestras vidas y entorno laboral, nos hemos acostumbrado a generar y almacenar datos e información prácticamente sin notarla y, por supuesto, toda puede convertirse en evidencia digital o material probatorio durante un proceso legal.
Así, un proceso de preparación documental para una instancia legal normalmente involucra la revisión de miles de documentos, correos electrónicos y mensajes de datos, incluyendo muchas veces servicios tan diversos como conversaciones de aplicaciones de mensajería instantánea como WhatsApp o eventos de calendario y reuniones en plataformas como Zoom o Microsoft Teams. De acuerdo con un análisis realizado por Domo, cada persona en el planeta generó alrededor de 1,7 megabytes de datos por segundo en el 2020. Esto es casi 150 gigabytes diarios de información por persona[1].
Ante este crecimiento, cada vez es más difícil y demandante procesar y clasificar adecuadamente los datos para análisis. Además, los criterios tradicionales de clasificación como filtrado por palabras clave, fechas, nombres de archivo o dominios de correo electrónico muchas veces no son suficientes para reducir el universo de información a un tamaño razonable, generan demasiado ruido o, incluso, pueden excluir documentos relevantes como apoyo al proceso legal o la investigación.
Nuevas soluciones para nuevos problemas
Es en este punto cuando debemos buscar y emplear alternativas innovadoras para abordar el problema que hemos provocado por la cantidad de dispositivos e información que nos hemos acostumbrado a usar, y es justamente como respuesta a este problema que las herramientas y procesos de e-Discovery han comenzado a emplear la ciencia de datos como recurso para hacer más eficiente el proceso de clasificación y análisis de información para simplificar la revisión de los equipos legales.
De la misma forma en que plataformas de contenido como Netflix o YouTube, o tiendas en línea como Amazon pueden recomendar películas, libros o productos similares a los que hemos consumido anteriormente, las plataformas de revisión de e-Discovery pueden “recomendar” documentos, correos electrónicos o mensajes de texto similares a los que ya han sido identificados como relevantes o valiosos dentro del proceso de análisis, tomando como base el tipo de lenguaje o jerga empleados, los usuarios contenidos en el mensaje, las fechas asociadas con el documento, los metadatos del archivo que contiene la información y, en general, cualquier elemento de información propia del documento.
De igual manera, estas herramientas emplean algoritmos predictivos –sí, predictivos, como la inteligencia superior de The Minority Report–, los cuales logran “predecir” la posible codificación de un documento que no ha sido revisado por un analista humano. Es decir, un motor de procesamiento es capaz de “aprender” qué tipo de documentos es valioso como soporte en un proceso legal y cuáles no, y de anticipar y presentar a un equipo de analistas los documentos que “predice” que probablemente serían calificados como relevantes por un analista humano. Esto puede ayudar a las organizaciones a reducir significativamente los costos de revisión documental, a encontrar resultados de manera más eficiente y a enfocar los resultados en la información que realmente es importante, dejando de lado documentos redundantes, repetidos o irrelevantes para el caso.
Por supuesto, todavía estamos en un punto en el que los modelos de inteligencia artificial y, especialmente, los resultados de estos requieren supervisión humana. Para esto, es importante contar con un equipo de analistas preparado y con alta capacidad crítica y de toma de decisiones, para así asegurar a las organizaciones que no se está excluyendo información que pueda ser importante, y que todos los documentos presentados como soporte al proceso legal son los que se necesitan. Todavía no estamos en el punto en el que podamos confiar plenamente en los computadores para tomar decisiones profesionales, sin embargo, no podemos ser ajenos a que las empresas que abracen la tecnología para este propósito estén mejor preparadas para asesorar adecuadamente a sus clientes.
¿Qué viene en el futuro?
El uso de inteligencia artificial, ciencia de datos y motores de procesamiento en la identificación de documentos como material probatorio ya es una realidad y es ampliamente usado en nuestra sociedad. Sin embargo, el crecimiento de estas herramientas trae algunas posibilidades, ideas y perspectivas que, si bien son muy interesantes, requieren de profesionales y expertos que entiendan la regulación de protección de datos personales, y que puedan hacer uso adecuado de ellas sin exponer ni arriesgar los activos de información de los clientes.
Por ejemplo, hoy es posible diseñar e implementar un sistema de procesamiento de datos que pueda supervisar en tiempo real los correos electrónicos, chats corporativos y sistemas de información dentro de una organización, para analizar patrones de conducta y tratar de identificar comportamientos irregulares que constituyan señales tempranas de fraude, corrupción, extralimitación de funciones, abuso de confianza o cualquier otra conducta anormal de un empleado dentro de una organización, o identificar comunicaciones relacionadas con la competencia.
Sin embargo, si bien el desarrollo de un sistema como estos estaría basado en criterios externos conocidos (matrices de riesgo de cumplimiento o modelos como el triángulo del fraude), los modelos de inteligencia artificial requieren ser entrenados y trabajar con datos reales. Esto implica la vigilancia constante y el almacenamiento de datos personales de empleados, contratistas o terceros. Nuevamente, se requiere de un equipo de profesionales capacitados en la gestión de este tipo de riesgos, especialmente en un contexto donde los empleados trabajan desde sus casas y pueden vivir en países con diferentes niveles de regulación y protección sobre sus datos.
Si bien aún estamos lejos de tener la capacidad predictiva del crimen imaginada por Philip K. Dick, las herramientas de e-Discovery ya están disponibles y pueden ser usadas para mejorar los procesos de investigación o soportar los procesos legales de los clientes, y ser una gran ventaja competitiva en un mundo dominado por los datos y la computación de alta velocidad. Debemos estar preparados y contar con un equipo de profesionales dispuestos a abrazar el cambio e incorporar las nuevas herramientas que necesariamente trae un nuevo entorno laboral y legal.
[1] https://www.domo.com/learn/infographic/data-never-sleeps-8
Opina, Comenta