La popularidad de la red social la han convertido el objetivo de ataques de ciberdelincuentes, robo de datos, influencia electoral, suplantación de cuentas y un largo etcétera, al fin y al cabo los seres humanos no hemos hecho más que trasladar todas los problemas del mundo real al virtual.
Facebook lleva mucho tiempo experimentando con tecnologías de inteligencia artificial y machine learning para poder atajar los efectos causados por cuentas que infringen sus políticas de uso. El control manual de casi 2.500 millones de cuentas es prácticamente imposible, por no hablar de los millones de cuentas que se crean a diario en la red social. Una de las infracciones más comunes en Facebook es la creación de cuentas falsas.
Éstas se pueden clasificar en dos categorías, aquellas que no pertenecen a una persona real y se han identificado como tal, por ejemplo, una cuenta de una mascota no puede ser un usuario de Facebook, sino más bien una página. En estos casos Facebook las convierte automáticamente en páginas al tratarse de cuentas de valor añadido, pero no personas físicas. El segundo tipo es el más preocupante, son aquellas cuentas falsas que se crean para violar las condiciones de servicio de Facebook con el objetivo de obtener algún rédito, como las dedicadas al spam o timos, como los recientes casos de venta de criptomonedas.
Facebook desactivó entre enero y marzo del 2019 alrededor de los 2.000 millones de cuentas falsas, de las cuales el 99,7% se produjo de forma proactiva, es decir, antes de que ningún usuario las denunciase. La manera de enfrentarse a este tipo de cuentas se divide en tres niveles. El primero es antes de que la propia cuenta se cree, mediante los formularios que el usuario tiene que completar se descartan muchas cuentas que podrían ser potencialmente falsas, si hay sospecha, Facebook pide más información.
Pedir el número de teléfono es una gran barrera para los creadores de cuentas falsas porque generar números de teléfono falsos es simplemente caro. El siguiente nivel es cuando la cuenta está creada, y antes de que ésta esté activa se elimina. En esta fase caen la mayoría de las cuentas falsas, antes de entrar en contacto con otro usuario. Y ya, por último se encuentran las cuentas que superan todos los controles y consiguen ser activas dentro de la red social, éstas suponen alrededor de un 5% de las cuentas activas mensuales, es decir, 122 millones de cuentas, tres veces la población de España. Éstas últimas son muchas veces creadas de forma manual por los transgresores y detectadas posteriormente usando machine learning.
El nuevo proceso de machine learning que ha estado implantando Facebook durante los dos últimos años para detectar estas cuentas rastreando patrones de comportamiento se denomina Deep Entity Classification (DEC). Básicamente este sistema analiza el graph del usuario, o lo que es lo mismo, sus interacciones y conexiones, en vez de quedarse sólo en las características directas de la cuenta falsa, que son más fáciles de superar, comprueba hasta 10.000 puntos entorno directo e indirecto a una cuenta. El etiquetado de estos comportamientos se produce de dos formas, de forma automática para grandes volúmenes y precisión baja, y humana para volúmenes bajos y alta precisión, y ambas se combinan en dos fases para obtener el mejor resultado.
Facebook se encuentra en una carrera constante en contra de los creadores de cuentas falsas, los cuales también usan tecnología para franquear todas las barreras tecnológicas que pone la red social. Deep Entity Classification es el siguiente paso que promete mejorar con el tiempo aprendiendo de los usuarios y asegurar que las cuentas de Facebook son 100% auténticas.