Páginas

Aviso

Este blog lleva inactivo desde el año 2011. Para ver mi actual web personal, entra en emilio.org.es.

domingo, 15 de junio de 2008

Acertijo: Sobre enlaces rojos (Solución)

Analizar el dump de la inglesa llevó un tiempo más que la nuestra, aun así fue rápido. Allí tienen 143 millones de enlaces rojos o azules al espacio de nombres principal, 9.067.964 si no contamos repeticiones. De éstos, 5.339.363 son rojos. Esa es la solución.

¿Habrá alguna ley que relacione número de artículos, número de páginas y número de enlaces? ¿Hasta cuando seguirá creciendo el número de enlaces rojos? El conocimiento humano (enciclopédico) debe ser finito. Ahora estamos subiendo la pendiente en la gráfica, ¿cuándo empezaremos a bajarla para dar por terminada la tarea? ¿Nunca?

Ganaron Rastrojo, Bigsus, Gizmo y Millars.

viernes, 13 de junio de 2008

Caja tonta

¿Alguien esperaba que llegaran entre 2000 y 3000 lectores al día al artículo de Televisión desde la redirección Caja tonta?

Hagan redirecciones señores, hay que darle difusión a los artículos a través de palabras y expresiones cotidianas. Atraen visitantes.

Actualización: El motivo de que tenga tantas visitas es que el web crawler de Google ha indizado el artículo televisión a través de Caja tonta.

miércoles, 11 de junio de 2008

Acertijo: Sobre enlaces rojos

Wikipedia en español tiene 370.000 artículos, aunque si contamos todos los espacios de nombres tenemos 1.100.000 páginas.

Analizando el dump pagelinks, se extrae que existen más de 12 millones de [[enlaces rojos o azules]] a artículos del espacio de nombres cero, el principal, 1.833.874 si no contamos repeticiones. Cruzando esos datos con el dump alltitles, podemos saber cuantos enlaces rojos tenemos, es decir, cuantos artículos nos faltan por crear. Esta cifra no es real, pues alguien puede crear hoy un artículo e incluir un enlace rojo que hasta ayer no existía. Pero más o menos es una medida de lo mínimo que nos queda por crear.

Programé un script y analicé los datos. Para la española salen 1.326.089 [[enlaces rojos]] distintos, es decir, nos faltan por crear al menos 1.326.089 artículos, para que toda la enciclopedia esté compuesta de enlaces azules. Pero conforme se crean más artículos, el número de enlaces rojos aumenta, aunque no se sabe por cuanto tiempo seguirá sucediendo esto.

Ahora viene el acertijo, ¿qué debe salir al aplicar el script a Wikipedia en inglés? ¿Debe salir menos de 1.300.000 ya que es más completa? ¿Debe salir una cifra similar? ¿Debe salir más pero siguiendo una proporción equivalente en función del número de artículos de la inglesa? ¿O debe salir un número desproporcionado y fuera de todo pronóstico?

Yo ya lo sé. Espero vuestras respuestas.

Solución: Hasta el domingo 15 de junio

martes, 3 de junio de 2008

No crecemos

Estoy volviendo a hacer estadísticas, comparando periodos y no me salen las cuentas. De momento solo me he fijado en los usuarios nuevos. Estos son los datos:


Periodos:

  • 1 de enero de 2006 — 31 de mayo de 2006: 53650 usuarios nuevos
  • 1 de enero de 2007 — 31 de mayo de 2007: 100490 usuarios nuevos
  • 1 de enero de 2008 — 31 de mayo de 2008: 101291 usuarios nuevos (contando el 29 de febrero)
Del primer periodo al segundo hay un incremento en el crecimiento de usuarios nuevos de casi el 100%, mientras que del segundo al tercero podríamos decir que no hay incremento alguno. Es decir, sí que se registran usuarios nuevos, pero no a mayor ritmo como cabría esperar. ¿Nos hemos estancado?

Los cientos de dientes de sierra son semanas, donde el pico del diente es el miércoles-jueves, y los valles de alrededor son los findes de semana, cuando decae la actividad. Es posible observar varias mesetas correspondientes a bloques anuales, e incluso el último de ellos parece hasta inferior al del año anterior, pero en realidad no ha cambiado.

¿Alguna explicación? Se está discutiendo en el Café.

Licencia

Unless stated otherwise, the text of the blog posts is published under this Creative Commons license.
A menos que se indique otra cosa, el texto de las entradas del blog se publica bajo esta licencia Creative Commons.
Licencia de Creative Commons