lunes, 4 de mayo de 2009

Adrián Paenza. "La ley de Benford" (Página 12, contratapa del domingo 3 de mayo)

Lo que sigue es un ejercicio que sirve para poner a prueba nuestras supuestas “convicciones” y para “descalificar” nuestra intuición. Le voy a proponer que se tome el trabajo de hacer una serie de verificaciones, algo realmente muy fácil, pero que requiere de un poco de tiempo. Por eso, le sugiero que lo tome con calma y en todo caso, hágalo cuando tenga un rato libre. Se va a sorprender con los resultados... Acá va.
a) Elija un libro que tenga cerca. Cualquiera. Abralo en cualquier página, y anote el número de la página. Ahora, tome un libro diferente y elija una página al azar también. Anote el número de la página otra vez. Repita este procedimiento con muchos libros hasta que haya anotado el número de 100 páginas o más. (Le dije que tenía que dedicarle un rato, pero no me diga que es difícil. Seguro que es tedioso, sí, pero no me diga que es complicado de hacer.)
b) Entre en un negocio cualquiera. Anote los precios de 100 productos o más. No importa qué tipo de negocio. Si necesita (y tiene acceso) vaya a cualquier página de Internet y anote los precios de diferentes productos que ofrezca. Pero tienen que ser 100 o más.
c) Obtenga ahora las direcciones de las personas que trabajan con usted, o compañeros de oficina o de clase. No importa. Y además, logre que le escriban las direcciones de gente que ellos conocen hasta que complete otra vez 100 o más de estos números. No hace falta que pongan los nombres, sólo los números de las direcciones.
d) Busque en Internet o en cualquier enciclopedia la población de 100 o más ciudades y/o pueblos del país en donde vive usted. Anótelos.
Una vez que tenga esta lista de por lo menos 400 números (si es que hizo la tarea para el hogar que figura más arriba), sepárelos de la siguiente forma:
Anote en una columna todos los que empiezan con el dígito 1. Luego, en otra columna, los que empiezan con el 2. Después, otra columna más, con los que empiezan con el 3. Y así siguiendo, hasta tener 9 columnas. Todas empiezan con dígitos distintos, del 1 al 9.
Antes de seguir, tengo algunas preguntas:
¿Usted cree que las columnas tendrán todas la misma cantidad de números? Es decir, ¿tendrán todas la misma longitud? ¿O le parece que habrá alguna que será más larga que otra?
Antes de contestar, deténgase un momento y piense lo que usted cree que debería pasar. ¿No tiene la tentación de decir que “da lo mismo”? Es decir, uno intuye que como eligió todos esos números al azar, el primer dígito puede ser cualquiera, debería dar lo mismo. Las columnas deberían ser todas iguales (¿no debería ser “las columnas deberían tener todas longitudes similares”?). Sin embargo, no es así.
Lo que sigue es la presentación en sociedad de una de las leyes más “antiintuitivas” que conozco. Se llama Ley de Benford. Los resultados (aproximados) que uno obtiene si hace los experimentos que planteaba más arriba, son los siguientes:

¿No es increíble que haya más de un 30 por ciento de posibilidades de que el dígito con el que empieza sea un número 1? ¿No parece mucho más razonable que para todos los dígitos sea 11.11 por ciento (que se obtiene de hacer 1/9)? No sólo eso. Luego, en escala descendente aparecen el resto de los dígitos, tanto que al número nueve le corresponde menos de un 5 por ciento en el papel de líder (*). Si bien no lo escribí antes, ignoro al cero como dígito inicial, porque uno –en general– no escribe un cero a la izquierda. Cualquier número significativo empieza con algún dígito que no sea cero.
El que descubrió esto fue el doctor Frank Benford (**), un físico que trabajaba en la General Electric. En 1938, cuando no había ni calculadoras ni computadoras, la mayoría de las personas que hacían cálculos usaban tablas de logaritmos. Benford observó que las páginas que contenían logaritmos que empezaban con uno ¡estaban mucho más usadas, sucias y ajadas que las otras! Así, empezó a sospechar que había algo particular detrás de esa observación, y lo fue a confrontar. De hecho, se dedicó a hacer el análisis de 20.229 conjuntos de números que involucraban categorías bien desconectadas entre sí:
a) volúmenes de agua de todos los ríos de una región
b) estadísticas de béisbol de jugadores norteamericanos
c) números que aparecían en todos los artículos de un determinado ejemplar de la revista Reader’s Digest
d) distancias entre todas las ciudades de un país
e) direcciones de las primeras 342 personas que aparecían en la guía de American Men of Science (Hombres de Ciencia Norteamericanos)
f) número de pobladores de todas las ciudades de un país
g) dólares a pagar por electricidad de los usuarios de una cierta ciudad
Al comprobar que se repetía el patrón que había descubierto con las tablas de logaritmos, Benford se dio cuenta de que tenía en sus manos algo muy importante y muy antiintuitivo. Y se embarcó en hacer una demostración de lo que conjeturaba (***). Lo increíble de esta ley, más allá de lo antiintuitiva, es que se usa –por ejemplo– para detectar a los evasores de impuestos. Un contador y matemático, el doctor Mark J. Nigrini, que actualmente trabaja en Dallas, hizo la primera aplicación práctica de la Ley de Benford. La idea que usó es que si alguien está tratando de falsificar datos, inexorablemente tendrá que inventar algunos números. Cuando lo haga, la tendencia es –por parte de la gente– a usar muchos números que empiecen con 5, 6 o 7 y no tantos que empiecen con uno (***). Esto será suficiente para violar lo que predice la Ley de Benford y por lo tanto invita a que el gobierno haga una auditoría de esos números. La ley es claramente no infalible, pero sirve para detectar sospechosos. Lo curioso es que quienes usaron los primeros experimentos de Nigrini aprovecharon para poner a prueba la declaración de impuestos de Bill Clinton. Nigrini concluyó que si bien había más redondeos que los esperables, no parecía esconder ningún fraude al fisco.
Para concluir: esta ley es muy difícil de aceptar sin rebelarse. Es muy antiintuitiva. Sin embargo, cierta. Y como escribí más arriba, es utilizada por distintas oficinas recaudadoras de impuestos para que les sirva de alerta sobre quiénes están fraguando sus declaraciones.
La inspiración para publicar este artículo, y muchísimos de los datos que aquí figuran, parte de sugerencias que me hicieron los doctores Pablo Coll y Pablo Milrud, ambos matemáticos. Además, hay un extraordinario artículo sobre la Ley de Benford que publicó Malcolm W. Browne en 1998 y que ha sido citado en forma incesante por todos aquellos que divulgan el contenido de esta ley.


* Un alerta: esta ley, sin embargo, no se aplica a fenómenos que son verdaderamente aleatorios. Es decir, no se puede usar en la lotería, en donde la probabilidad de que salga cualquier número es la misma. Por ejemplo, si usted pone nueve bolillas en un bolillero, numeradas del uno al nueve, saca una, anota, la pone nuevamente adentro, hace girar el bolillero, saca otra, anota otra vez, y sigue con el proceso, lo que encuentra al final es que los números aparecen igualmente distribuidos, ya que la probabilidad de que aparezca cada uno es 1/9. Lo que hace falta es que no sean números al azar. Es decir, la Ley de Benford se aplica para conjuntos grandes de números que no sean aleatorios. Es decir, se usa esta ley cuando uno trabaja con conjuntos de muchos números, que obedezcan a la recolección de datos que provengan de la naturaleza (incluyendo factores sociales). Por ejemplo, si uno hiciera la lista de los montos de todas las facturas de luz que se pagan en la Argentina, entonces sí, ahí vale la ley. Si uno hiciera un relevamiento de la cantidad de kilos de carne que entraron por día en el mercado de Liniers en los últimos diez años, también. Lo mismo que si uno tuviera los datos de las longitudes de todos los ríos de un determinado país.

** La mayoría de los investigadores sobre la ley, que quedó reconocida como Ley de Benford, aseguran que quien primero la observó fue el astrónomo y matemático Simon Newcomb. Por alguna extraña razón sus trabajos no tuvieron trascendencia y fueron desechados. Benford los retomó y les dio vida nuevamente. De todas formas, lo que es curioso es que ambos encontraron el mismo resultado haciendo observaciones sobre el uso que se les daba a las tablas de logaritmos.

*** Benford demostró que la probabilidad de que apareciera el dígito n como primer número se podía calcular con la fórmula:
P = [Log (n+1) – Log (n)]/(Log 10–Log 1) = Log (1 + 1/n).