Mostrando archivo para julio, 2016

l10n

julio 11th, 2016 | Opinión, Proceso inverso

La gestión de fechas, del calendario, en la informática, no es difícil, pero
sí es laboriosa. Hay diferentes zonas horarias en el mundo, bastante más que
asientos en muchos organismos mundiales [1]. Extremo ejemplo es Indiana, en
donde según qué criterios se consideren hay entre tres y ocho zonas horarias
diferentes [2]. El manejo del tiempo es más complicado que simplemente la
posición en la tierra de cada lugar, ya que los colectivos humanos
arbitrariamente tomamos la decisión política de cambiar la hora,
frecuentemente; y la fecha, aunque esto pasa mucho menos. Esta realidad a la
que la informática tiene que adaptarse deja trazas en repositorios de datos y
código públicos [3]. La gestión de calendarios es aún más complicada [4]
que lo expuesto por motivos que escapan al ámbito de este texto.

Cualquier tratador de datos puede confirmar lo diferente entre el
funcionamiento de las máquinas y los entornos de información imperfecta,
desorganizada, o sujeta a cambios arbitrarios. En el tratamiento de datos la
pureza formal de las matemáticas y sus aplicaciones prácticas choca
habitualmente con la naturaleza de la vida, con la impredecibilidad de la
aparición y detalles y consecuencias de una mutación en una reproducción, o
con la posibilidad de que la voluntad actúe en contra de una predicción. El
caos similar al que ocurre en la gestión del tiempo del que escribimos en el
párrafo anterior se reproduce fractalmente en muchos ámbitos sobre los que
la humanidad ejerce acción, por ejemplo a nivel colectivo en la península
ibérica respecto a varios asuntos… en su medida correspondiente.

En un modo parecido a las decisiones arbitrarias (en el sentido de la
impredecibilidad, sin valorar la justificación que el poder tuviera en el
momento) e históricas que se han tomado políticamente desde la antigüedad en
todo el mundo sobre la hora, la fecha y el calendario, existen arbitrariamente
múltiples formas correctas de referirse a las entidades geográficas a todos
los niveles en todos los ámbitos humanos. Con nuestro afecto por el anarquismo
(en su sentido amplio) generamos continuamente casos de multiplicidad de
grafías aceptadas para los nombres de los lugares [5]. Esto afecta de un modo
u otro a las tareas resueltas por máquinas.

Existiendo además múltiples identidades colectivas que se solapan
geográficamente a otras más generales y comunes, se suman posibilidades a la
forma de referir lugares [6]. En este punto entendemos que la problemática
obliga a aplicar técnicas de consideración por similitudes y a la pérdida de
importancia de unas palabras sobre otras, pero el problema da giros inesperados
debido a casos como que existan lugares como [7] que por nombre tienen una
palabra que en algunas lenguas (otra circunstancia a considerar) es un
artículo definido. Típicamente los artículos pierden importancia al hacer
búsqueda por similitud.

También hay casos en los que los nombres de dos lugares existentes contienen
las mismas palabras [8] pero en distinto orden [9]. Esto requiere la toma en
consideración del orden de palabras. Pero en la búsqueda en texto por
similitudes hay frecuentemente motivos que promueven que el orden no sea
importante.

En Madiva nos dedicamos entre otras muchas cosas a la búsqueda de conocimiento
a partir de datos de diversas fuentes, entre ellas las que proporcionan
ministerios y agencias gubernamentales. La naturaleza imprecisa y combativa de
nosotros con y contra nuestros vecinos y colegas añade otro efecto
multiplicador a este problema debido a las dificultades de coordinación y
falta de homogeneidad de criterios entre administraciones públicas, esto no
facilita la relación entre ficheros de datos provenientes de diferentes
organismos oficiales.

La incapacidad organizativa humana, consecuencia del libre albedrío, del
sentimiento mayoritario de jovialidad y tolerancia de las personas, de la
histórica incapacidad logística para el ejercicio del poder, contrasta con
las aspiraciones calvinistas por la sistematización y homogeneización para
facilitar la gestión a todos los niveles de los asuntos que tratan sobre las
personas y su actividad.

La civilización occidental, incontestablemente dominante en política
internacional, contribuye activamente al proceso de globalización, que ayuda a
facilitar la unión y colaboración de la acción humana en todas sus posibles
dimensiones, individual, familiar, gremial, empresarial, política; sin en la
mayoría de los casos ejercer una acción definitiva sobre la defensa o
abandono de las costumbres individuales, locales y regionales en las
dimensiones mencionadas de las relaciones humanas. Esto es la aceptación por
parte de la autoridad política de algo sobre lo que en realidad no puede
elegir.

Individualmente, cuanto más anticipada y asumida esté esta circunstancia
inevitable, con más preparación se afronta un futuro en el que el individuo
es cada vez menos importante en favor de las redes, la colaboración, y los
colectivos.

¿Sois capaces de cruzar datos de población [10] con datos de empleo [11] a
nivel municipal con un 100% de aciertos?

Hay algunos más municipios (y creciendo) que la cifra en la que estás
pensando. Por supuesto esto implica que la elección entre documentos de unos
años u otros (o cuantos de ellos se consideren) afecta a la longitud de la
solución… Sean sesenta mil caracteres cuadrados la medida de, por ejemplo,
un código de quinientas líneas de largo y ciento veinte columnas (caracteres)
de ancho… ¿sois además capaces de encontrar una solución no usando más de
420k caracteres cuadrados (C), o 230k (C++), 180k (Python), 160k (Java), 140k
(Ruby o PHP) o 130k (Javascript)? Excluyendo el acceso a hojas de cálculo, PDF
y textos ISO/UTF de ese cómputo.

Más acertijos como este en http://madivachallenge.appspot.com.

[1]: https://en.wikipedia.org/wiki/United_Nations_General_Assembly
[2]: https://github.com/eggert/tz/blob/master/zone.tab
[3]: https://github.com/eggert/tz/blob/master/europe
[4]: https://en.wikipedia.org/wiki/Tz_database
[5]: https://es.wikipedia.org/wiki/Lentegí
[6]: https://es.wikipedia.org/wiki/Sarratella
[7]: https://es.wikipedia.org/wiki/Les
[8]: https://es.wikipedia.org/wiki/Rubielos_de_Mora
[9]: https://es.wikipedia.org/wiki/Mora_de_Rubielos
[10]: http://www.ine.es/inebmenu/mnu_padron.htm
[11]: https://www.sepe.es/contenidos/que_es_el_sepe/estadisticas/datos_estadisticos/municipios/index.html

U.P

Continúa leyendo este artículo