jueves, 3 de septiembre de 2009

Ley de Benford - Detección de fraudes de datos

Esta ley fue descubierta en 1881 por Simon Newcomb y redescubierta en 1938 por Frank Benford en circunstancias casi idénticas.
En aquellos tiempos, los cálculos complejos no se realizaban con calculadoras, sino con las hoy caídas en desuso tablas de logaritmos. Lo que ambos notaron es que algunas páginas estaban mucho más gastadas que otras: eran las que contenían logaritmos de números que comenzaban con 1. Eso los llevó a investigar y descubrir el motivo detrás de esa llamativa disparidad.

Lo que hallaron al recolectar los datos de muchos conjuntos de números es que el 1 era muy preponderante como dígito inicial, el 2 un poco menos, el 3 algo menos, y cada dígito siguiente un poco menos que el anterior, hasta llegar al 9, que era el que menos presente. Y aunque esta distribución no se daba en todos los conjuntos, sí aparecía en aquellos que respondían a una distribución logarítmica, la que resulta estar muy presente en la naturaleza.

Aunque la ley fue bautizada con el nombre de Benford, que la corroboró con datos de decenas de miles de conjuntos de números, Newcomb ya había calculado que la probabilidad de que un dígito N sea el inicial es log10 (N+1) - log10 (N). El siguiente gráfico muestra la probabilidad de que cada uno de los dígitos del 1 al 9 sea el inicial.




Lo más extraordinario es la aplicación de esta ley para detectar fraudes de datos: quien quiera adulterar los números de su declaración jurada, deberá hacer grandes esfuerzos para ajustar sus números a la ley de Benford, si no quiere darle argumentos a los peritos contables.

(fuente: blog de Paenza)

No hay comentarios:

Publicar un comentario en la entrada