Páginas

miércoles, 11 de junio de 2008

Acertijo: Sobre enlaces rojos

Wikipedia en español tiene 370.000 artículos, aunque si contamos todos los espacios de nombres tenemos 1.100.000 páginas.

Analizando el dump pagelinks, se extrae que existen más de 12 millones de [[enlaces rojos o azules]] a artículos del espacio de nombres cero, el principal, 1.833.874 si no contamos repeticiones. Cruzando esos datos con el dump alltitles, podemos saber cuantos enlaces rojos tenemos, es decir, cuantos artículos nos faltan por crear. Esta cifra no es real, pues alguien puede crear hoy un artículo e incluir un enlace rojo que hasta ayer no existía. Pero más o menos es una medida de lo mínimo que nos queda por crear.

Programé un script y analicé los datos. Para la española salen 1.326.089 [[enlaces rojos]] distintos, es decir, nos faltan por crear al menos 1.326.089 artículos, para que toda la enciclopedia esté compuesta de enlaces azules. Pero conforme se crean más artículos, el número de enlaces rojos aumenta, aunque no se sabe por cuanto tiempo seguirá sucediendo esto.

Ahora viene el acertijo, ¿qué debe salir al aplicar el script a Wikipedia en inglés? ¿Debe salir menos de 1.300.000 ya que es más completa? ¿Debe salir una cifra similar? ¿Debe salir más pero siguiendo una proporción equivalente en función del número de artículos de la inglesa? ¿O debe salir un número desproporcionado y fuera de todo pronóstico?

Yo ya lo sé. Espero vuestras respuestas.

Solución: Hasta el domingo 15 de junio

Licencia

Unless stated otherwise, the text of the blog posts is published under this Creative Commons license.
A menos que se indique otra cosa, el texto de las entradas del blog se publica bajo esta licencia Creative Commons.
Licencia de Creative Commons