En esta sesión Jorge Gómez, especialista en AML, nos da una introducción a la segmentación de factores de riesgo, qué es la metodología CRISP-DM, recomendaciones claves para mantener la segmentación en el tiempo y cómo puedes segmentar tus factores de riesgos desde una herramienta fácil de usar como Pirani.
1. Introducción a la segmentación de factores de riesgo
Es el proceso por medio del cual se lleva a cabo la separación de elementos en grupos homogéneos al interior de ellos y heterogéneos entre ellos.
1.1. Factores de riesgo en lavado de activos y financiación del terrorismo
En este caso debemos hablar puntualmente de clientes, contrapartes, jurisdicciones, productos y canales, los cuales son citados en la recomendación 10 del GAFI que amplía el concepto de debida diligencia.
1.2. Tipos de segmentación
- Descriptiva
- A juicio de expertos (método delphi)
- Dinámica
- Atada a la debida diligencia
1.3. Metodologías para la segmentación
K-Means: es un algoritmo de clasificación no supervisada (clusterización) que agrupa objetos en k grupos basándose en sus características (Variables). El agrupamiento se realiza minimizando la suma de distancias entre cada objeto y el centroide de su segmentos o cluster, o lo que es lo mismo se agrupan en función de la similitud de las características.
Bietápico: este clúster intenta revelar los patrones en el conjunto de datos de entrada. Los registros se agrupan de manera que los de un mismo grupo o clúster tiendan a ser similares entre ellos, y que los de otros grupos sean distintos.
Redes neuronales: aprendizaje basado en la práctica, modelos de Machine Learning, tiene un gran enfoque en el análisis predictivo.
1.4. Análisis del contexto
- Conocimiento del negocio: ¿Qué hace? - ¿Cómo lo hace? ¿Con quién lo hace? ¿Dónde lo hace?
- Conocimiento del mercado: Competencia - Mercado objetivo - Métodos transaccionales - Jurisdicciones
1.5. Tipos de variables a segmentar
Cuantitativas: continuas (usan números decimales) y discretas (toman números enteros).
Cualitativas: nominal (no tiene características específicas) y ordinal (llevan un orden jerárquico).
1.6. Beneficios de la aplicación del proceso de segmentación
- Facilita el proceso de conocimiento de las contrapartes y demás factores de riesgo mencionados, con lo cual se logra tener un contexto amplio de la organización y su entorno.
- Identificar tendencias y tipologías del riesgo a lo largo de los diferentes segmentos.
- Si logramos ligar la segmentación con el monitoreo transaccional, conseguiremos también identificar los movimientos intra y extra segmento de forma oportuna.
2. Metodología CRISP-DM
Cross Industry Standard Process for Data Mining (Proceso Estándar para Minería de Datos en Industrias Cruzadas). Es una metodología de amplia difusión y probada en procesos de aprendizaje automático, el propósito de esta es el desarrollo de modelos a partir de información y datos específicos de una compañía.
2.1. Entendimiento del negocio
- Tener conocimiento del contexto interno y externo.
- Entender el negocio desde la base.
- Consultar información de diferentes fuentes internas y externas.
- Consultar y analizar información histórica.
- Entender de forma clara la descripción y el comportamiento de los principales factores de riesgo: clientes, productos, canales y jurisdicciones.
2.2. Entendimiento de los datos
- Entender los datos que se tienen almacenados.
- Tener claridad sobre las fuentes de datos.
- Garantizar y conocer el estado de la calidad de los datos (ISO 25012).
- Saber qué bases de datos e información sí pueden ser útiles.
- Definir y documentar la periodicidad de la actualización.
2.3. Preparación de los datos
- Para preparar los datos es necesario entenderlos.
- Garantizar en todo momento que la base de datos esté limpia, organizada y actualizada.
2.4. Modelamiento
- Elección tanto del modelo de segmentación a utilizar, también llamado algoritmo, como de las variables adecuadas.
- Ejecutar más de un modelo de segmentación e ir probando diferentes.
- Proceso de calibración del modelo, entender los resultados y hacer ajustes de forma que sea un proceso práctico y útil para la compañía.
- Seleccionar las variables adecuadas para cada uno de los factores de riesgo.
- Algunas variables a considerar pueden ser: actividad económica, ingresos, volumen transaccional, entre otras.
2.5. Evaluación del resultado
- Validar el modelo de segmentación en pro de que el resultado sí sea coherente con lo esperado.
- Revisar que toda la información es correcta.
- Realizar siempre esta validación después de un proceso de segmentación, bien sea por inspección o por medio de herramientas alternativas que permitan evaluar tanto el nivel de consistencia como de precisión de los resultados entregados por el modelo.
2.6. Despliegue (Deployment)
- Si al evaluar el resultado todo está correcto, en esta última etapa se despliega el modelo completo de segmentación con el fin de agregar realmente valor para la organización.
- Después de un determinado periodo hay que ejecutarla de nuevo.
- Realizar análisis, revisión de las características de los segmentos y calibración de las alertas.
- Integrar los resultados de la segmentación al monitoreo y seguimiento transaccional.
- Definir procedimientos para el análisis de las operaciones inusuales.
3. Recomendaciones claves para mantener la segmentación en el tiempo
- Tener unas políticas claras sobre cómo realizarle mantenimiento, soporte al modelo, con el fin de mantenerlo en el tiempo.
- Definir claramente quiénes son los responsables de dar mantenimiento y velar por la continuidad del modelo de segmentación.
- Tener en cuenta tanto factores internos como externos a la organización al momento de revisar la calidad del modelo ejecutado.
- Documentar todo lo referente al modelo de segmentación.
- Actualizar de forma constante la información.
Referencias bibliográficas
- Superintendencia Financiera de Colombia: Guía de mejores prácticas para la construcción de modelos de segmentación relacionados con los factores de riesgo de Lavado de Activos y Financiación del Terrorismo.
- IBM: Conceptos básicos de ayuda de CRISP-DM
- MBA USP/ESALQ: CRISP-DM: las 6 etapas de la metodología del futuro