Páginas

Aviso

Este blog lleva inactivo desde el año 2011. Para ver mi actual web personal, entra en emilio.org.es.

miércoles, 26 de enero de 2011

El Tiananmen de Egipto

Miles de egipcios han aprovechado el día de la ira para salir a la calle y pedir el fin del régimen de tres décadas de Hosni Mubarak, protagonizando enfrentamientos violentos contra la policía, en unas protestas sin precedentes inspiradas por la revuelta que derrocó hace dos semanas el Gobierno del presidente tunecino Ben Ali. (sigue en El País)

Video compartido en YouTube. A los 01:20 minutos, un joven se planta delante del vehículo, imágenes que recuerdan a Tiananmen en 1989.

miércoles, 19 de enero de 2011

Muy hábil, Señora Ministra

No sé si habreis leido el artículo de la Ministra de Cultura Ángeles González-Sinde en El País, titulado El adversario es otro. No tiene desperdicio, sabiendo de quién procede y en qué momento se escribe y publica. A través de un comentario en Barrapunto, me he puesto a indagar un poco más sobre el tema.

Empieza con una cita de las páginas dedicadas al comienzo de El Quijote a la tasa y el prólogo, concretamente a la primera.

En su artículo, la ministra lo plasma así:
Por parte de vos, Miguel de Cervantes, nos fue hecha relación que habíades compuesto un libro intitulado El ingenioso hidalgo de la Mancha, el cual os había costado mucho trabajo y era muy útil y provechoso (...) Os damos licencia y facultad para que vos, o la persona que vuestro poder hubiere y no otra alguna, podais imprimir el dicho libro (...) So pena que la persona o personas que sin tener vuestro poder lo imprimiere o vendiere: o hiciere imprimir o vender, por el mesmo caso pierda la impresión que hiciere, con los moldes y aparejos de ella: y más incurra en pena de cincuenta mil maravedís cada vez que lo contrario hiciere... Fecha en Valladolid a veinte y seis días del mes de Septiembre de mil seiscientos y cuatro años. Yo el Rey.
González-Sinde utiliza ese texto como justificación de que los derechos de autor son muy antiguos (tanto como El Quijote) y que quien se atreviese (ya en aquella época) a contradecirlos, podría ser multado con cuantiosas sumas.

Si os fijais, hay dos partes omitidas por "(...)". El texto completo es el siguiente (remarco en negrita lo que la ministra ha evitado):
Por cuanto por parte de vos, Miguel de Cervantes, nos fue fecha relación que habíades compuesto un libro intitulado El ingenioso hidalgo de la Mancha, el cual os había costado mucho trabajo y era muy útil y provechoso, nos pedistes y suplicastes os mandásemos dar licencia y facultad para le poder imprimir, y previlegio por el tiempo que fuésemos servidos, o como la nuestra merced fuese; lo cual visto por los del nuestro Consejo, por cuanto en el dicho libro se hicieron las diligencias que la premática últimamente por nos fecha sobre la impresión de los libros dispone, fue acordado que debíamos mandar dar esta nuestra cédula para vos, en la dicha razón; y nos tuvímoslo por bien. Por la cual, por os hacer bien y merced, os damos licencia y facultad para que vos, o la persona que vuestro poder hubiere, y no otra alguna, podáis imprimir el dicho libro, intitulado El ingenioso hidalgo de la Mancha, que desuso se hace mención, en todos estos nuestros reinos de Castilla, por tiempo y espacio de diez años, que corran y se cuenten desde el dicho día de la data desta nuestra cédula; so pena que la persona o personas que, sin tener vuestro poder, lo imprimiere o vendiere, o hiciere imprimir o vender, por el mesmo caso pierda la impresión que hiciere, con los moldes y aparejos della; y más, incurra en pena de cincuenta mil maravedís cada vez que lo contrario hiciere. La cual dicha pena sea la tercia parte para la persona que lo acusare, y la otra tercia parte para nuestra Cámara, y la otra tercia parte para el juez que lo sentenciare. Con tanto que todas las veces que hubiéredes de hacer imprimir el dicho libro, durante el tiempo de los dichos diez años, le traigáis al nuestro Consejo, juntamente con el original que en él fue visto, que va rubricado cada plana y firmado al fin dél de Juan Gallo de Andrada, nuestro Escribano de Cámara, de los que en él residen, para saber si la dicha impresión está conforme el original; o traigáis fe en pública forma de cómo por corretor nombrado por nuestro mandado, se vio y corrigió la dicha impresión por el original, y se imprimió conforme a él, y quedan impresas las erratas por él apuntadas, para cada un libro de los que así fueren impresos, para que se tase el precio que por cada volumen hubiéredes de haber. Y mandamos al impresor que así imprimiere el dicho libro, no imprima el principio ni el primer pliego dél, ni entregue más de un solo libro con el original al autor, o persona a cuya costa lo imprimiere, ni otro alguno, para efeto de la dicha correción y tasa, hasta que antes y primero el dicho libro esté corregido y tasado por los del nuestro Consejo; y, estando hecho, y no de otra manera, pueda imprimir el dicho principio y primer pliego, y sucesivamente ponga esta nuestra cédula y la aprobación, tasa y erratas, so pena de caer e incurrir en las penas contenidas en las leyes y premáticas destos nuestros reinos. Y mandamos a los del nuestro Consejo, y a otras cualesquier justicias dellos, guarden y cumplan esta nuestra cédula y lo en ella contenido. Fecha en Valladolid, a veinte y seis días del mes de setiembre de mil y seiscientos y cuatro años.
Bien. En la segunda parte en negrita se observa como le conceden a Cervantes la "potestad para imprimir y explotar su obra", El Quijote, durante 10 años. Hoy día, los autores tienen toda su vida para explotar su obra, además de 70 años después de su muerte. Algo que es totalmente excesivo y absurdo.

Es evidente que a la ministra solo parece interesarle publicar una parte de la historia.

domingo, 16 de enero de 2011

Se buscan copistas

A todos nos han contado la historia de la Biblioteca de Alejandría, que fue arrasada (quizás hasta en varias ocasiones y de formas distintas), a lo largo de los muchos años de vida que tuvo, hasta finalmente desaparecer. Nosotros que hacemos vida en Internet, si nos preguntasen qué es lo más parecido a la Biblioteca de Alejandría existente hoy día, seguramente contestaríamos que Wikipedia.

La Biblioteca de Alejandría tenía un fallo enorme: su contenido estaba en un único lugar. Si hubiera habido una copia de la biblioteca en otro lugar del mundo, la destrucción de la copia de Alejandría habría quedado como una mera anécdota histórica, en vez de como lo que fue, una verdadera catástrofe para la humanidad.

La revolución de la informática ha traido consigo el acceso a gran velocidad a ingentes cantidades de información, novedad convertida en rutina que aun estamos tratando de asimilar. Pero esta fiebre por la información ha venido acompañada de una falsa sensación de seguridad de nuestros datos frente a catástrofes. Nunca antes había sido tan fácil crear, copiar y destruir información. Sin embargo nos mostramos muy tranquilos frente a ello. ¿Quién no ha perdido alguna foto o documento, incluso teniendo una copia de seguridad, por haber fallado esta? No solo nos enfrentamos a la pérdida de datos valiosos por errores de hardware, sino también por el uso de formato no abiertos o por la propia obsolescencia digital.

Regresando al tema Wikipedia y más en general al de los wikis, herramientas de generación colectiva de conocimiento, me gustaría llamar la atención sobre un tema que me parece fundamental: cómo asegurar la continuidad de ese conocimiento, evitar que se pierda con el paso del tiempo y los reveses del destino. La respuesta es sencilla, manteniendo copias de seguridad actualizadas y diseminadas en varios lugares, cuantos más mejor.

La Fundación Wikimedia, responsable de Wikipedia y sus proyectos hermanos, además de tener un sistema RAID en sus servidores de base de datos para la versión en vivo de Wikipedia, dispone de otro desde donde ofrece en descarga directa las copias de seguridad de los proyectos, con todos sus artículos e historiales completos (cada uno de los commits). Casi todas las copias de seguridad son actualizadas quincenalmente, pero existe una excepción, el backup más reciente de Wikipedia en inglés, la mayor Wikipedia de todas, es de enero de 2010. Tiene exactamente un año de antigüedad. La causa de ello es que el proceso de backup es súmamente lento para este caso, debido a que genera más de 5 TB de texto bruto (aunque comprimiéndolo en 7zip posteriormente queda en ~30 GB), y generalmente acaba fallando, de modo que hay que relanzarlo hasta que por fin tiene éxito (como tuvo a comienzos del año pasado; no se sabe cuándo será la próxima). De modo que nadie en el mundo puede descargarse ahora mismo una copia actualizada (que contenga las modificaciones realizadas en el último año) de Wikipedia en inglés, a menos que haga un script que se baje la versión en línea de los artículos. Este problema siempre ha acuciado a Wikipedia en inglés, y los administradores piensan continuamente formas de optimizar el proceso de backup, aunque no siempre con éxito. Para el resto de idiomas sí es posible bajar una copia de seguridad actualizada, todo sea dicho.

La intención de este artículo no es la de criticar el encomiable trabajo de los administradores de Wikipedia (u otros proyectos que comentaré luego), ya que ellos hacen todo lo posible con los medios de los que disponen, sino de llamar la atención acerca de una situación de la que posiblemente muchos no hayan caido en la cuenta. Creo que es nuestro deber, si disponemos de los recursos suficientes, el mantener una copia de todo este conocimiento en nuestros ordenadores. Una copia de Wikipedia en cada continente, en cada país del mundo, en cada hogar. Tal y como hemos venido haciendo con las enciclopedias de papel.

Quizás creais que mantengo una posición exagerada, pero el desastre puede llegar en cualquier momento, un error hardware, un acceso no autorizado al sistema, un incendio, un terremoto, o un huracán. El 13 de agosto de 2004 estaba previsto que el Huracán Charley pasara por Tampa, Florida, donde por aquel entonces Wikipedia tenía sus servidores. Se preparó un plan de emergencia para evitar cualquier posible pérdida de datos. Afortunadamente, los administradores respondieron rápido, y finalmente el huracán tampoco llegó a casar ningún daño.

Desde hace algún tiempo vengo solicitando que se hagan mirrors de los backups de Wikipedia de forma similar a como lo hacen las distribuciones GNU/Linux, en múltiples servidores en diversas localizaciones. Si conoces alguna universidad o entidad interesada en hacer de mirror de manera voluntaria, tienes más datos en esta página acerca de los recursos necesarios.

Es curioso como en esta sociedad, la gente duplica con alegría otro tipo de obras como películas o música, mientras que el compendio del saber humano (disponible con licencia libre por cierto) es descargado por muy pocos, casi nadie.

También es muy curioso como cada vez que alguiente entrevista a Jimmy Wales, el fundador de Wikipedia, le preguntan qué relación hay entre Wikipedia y WikiLeaks (que aclaro yo, por si alguien no lo sabe, que no existe ninguna relación, más alla de las 4 primeras letras de cada palabra), mientras que ningún periodista le pregunta qué mecanismos se están empleando para salvaguardar los millones de páginas de conocimiento que la humanidad está depositando altruistamente en los servidores. Que ya digo yo que la Fundación Wikimedia se lo toma muy en serio. Pero parece que es algo de poco interés mediático.

Proyectos de enciclopedia similares a Wikipedia pero a menor escala son Enciclopedia Libre Universal en Español y Wikanda (la enciclopedia de Andalucía). Seguramente (o eso espero) estos proyectos cuentan con un sistema de copias de seguridad interno, pero no he encontrado la posibilidad de descargar un backup público a mi ordenador. Creo que es nuestra reponsabilidad solicitarlos. Lo mismo ocurre con el resto de locapedias.

De momento dispongo de una copia de todas las Wikipedias, Wikcionarios, etc, en todos los idiomas en un disco duro externo. Ocupan tan solo 100 GB en conjunto. Muy poco espacio para lo que representan: la suma del conocimiento humano. El asunto de las imágenes es más complejo, son casi 8 TB, y no existe la posibilidad de bajárselas en paquetes, a menos que hagas un script.

Hoy está de nuestra mano evitar que vuelva a suceder lo ocurrido con la Biblioteca de Alejandría. Mañana quizás sea tarde.

¿Quieres descargar Wikipedia? Sigue este enlace http://download.wikimedia.org/backup-index.html (el fichero que contiene el texto e historiales de cada artículo es pages-meta-history.xml.7z; cada proyecto en cada idioma tiene un fichero de ese tipo). Los ficheros van desde pocos megas hasta varios gigas, en función del tamaño de cada Wikipedia. Por ejemplo, el más reciente de Wikipedia en inglés de 31 GB (2010-01-30) o el más reciente de Wikipedia en español con 3.5 GB (2010-10-23).

Aclaración: estas copias de seguridad son texto plano en formato XML comprimidas en 7zip o Bzip (no incluye imágenes). Es decir, no son directamente leibles en un navegador o un procesador de textos. Si lo que quieres es una copia offline de Wikipedia para consultarla, tienes lectores como Kiwix u Okawix. Más información en http://en.wikipedia.org/wiki/User:Emijrp/Wikipedia_Archive. Existe una versión en CD/DVD de Wikipedia en español, llamada CDPedia.

¿Conoces alguna universidad o entidad interesada en hacer de mirror de manera voluntaria? Tienes más datos en esta página, puedes dejar un mensaje en la página de discusión.

Si quieres hacer un backup de tu wiki, puedes usar las herramientas del WikiTeam.

viernes, 14 de enero de 2011

Wikipedia celebra su décimo cumpleaños el 15 de enero de 2011

Mañana sábado, 15 de enero de 2011, se cumplen 10 años desde la creación de Wikipedia. Fundada por Jimmy Wales en 2001, Wikipedia se ha convertido en el quinto sitio web más popular del mundo con más de 410 millones de lectores mensuales (según comScore, a noviembre de 2010). Un año después de su fundación, Wikipedia alcanzó 18000 artículos en 12 idiomas. Tras tres años, superó los 397000 artículos en 52 idiomas.

Hoy cuenta con más de 17 millones de artículos en un total de 270 idiomas y continua creciendo. Wikipedia es el único sitio web del TOP 10 creado y mantenido por voluntarios. En los últimos 10 años, cientos de miles de personas han realizado más de 1000 millones de aportaciones al proyecto.

Para conmemorar esta fecha, gente de todo el mundo ha preparado celebraciones alrededor de Wikipedia. Tan solo en India habrá más de 60 eventos de este tipo. Te invitamos a unirte a A Coruña (España), Bangalore (India), Skopje (Macedonia), Londres (Reino Unido), Nairobi (Kenia) o a cualquiera de los más de 400 eventos que se van a producir: http://ten.wikipedia.org/


Actualización (14/01/2011): Los periodicos empiezan a dedicar especiales. ABC "10 años de Wikipedia" | Wikipedia 10 hits the headlines | El video de Jimmy Wales subtitulado en español.

Actualización (15/01/2011): Galería de fotos.

Actualización (17/01/2010): Entrevista digital a Jorge Sierra, presidente de Wikimedia España.

lunes, 3 de enero de 2011

Licencia

Unless stated otherwise, the text of the blog posts is published under this Creative Commons license.
A menos que se indique otra cosa, el texto de las entradas del blog se publica bajo esta licencia Creative Commons.
Licencia de Creative Commons