La inteligencia artificial halla rastros del descubrimiento español de Australia El proyecto «Carabela» permite la búsqueda de palabras y transcripción de manuscritos del XV al XVIII desde las imágenes de los legajos

Jesús García Calero SEGUIR Actualizado: 16/10/2019 11:59h Guardar Enviar noticia por correo electrónico Tu nombre * Tu correo electrónico * Su correo electrónico *

El físico Enrique Vidal, de la Universidad Politécnica de Valencia, llevaba más de una década persiguiendo un objetivo: ayudar con tecnología a la lectura y transcripción de manuscritos antiguos. Pero encontraba una muralla de dificultades. Durante siglos la ortografía y los trazos han variado tanto que «resultaba muy difícil enseñar a un algoritmo a identificar las palabras». Por ejemplo, enero de escribía con hache o sin ella, barco a veces con uve, y los adornos de la letra cortesana, procesal, o humanística hacían casi ilegible en ocasiones el texto. Pero los científicos no se rinden.

Al catedrático de Informática del Área de Lenguajes y Sistemas Informáticos y su equipo del Centro de Investigación de Reconocimiento de Patrones y Tecnología del Lenguaje Humano (PRHLT por sus siglas en inglés) les faltaba una especie de «Champollion» que pusiera en una misma «piedra Rosetta digital» todos los tipos de letra posibles para cada palabra. Ahí es donde entra en escena el historiador y paleógrafo del Centro de Arqueología Subacuática de Cádiz, Carlos Alonso Villalobos. Los dos científicos han puesto en pie un proyecto, bautizado como «Carabela», que recibió la financiación de la Fundación BBVA. Los brillantes resultados de la fase de evaluación se presentarán el próximo jueves en Sevilla, en la sede del Instituto Andaluz del Patrimonio Histórico.

En el Archivo de Indias

Se llamó «Carabela» porque ambos sabían que una de las aplicaciones inmediatas sería rastrear los inmensos fondos archivísiticos inéditos españoles, sobre todo los del Archivo General de Indias (AGI), donde se guarda en 80 millones de páginas que nadie ha visto en su práctica totalidad (43.000 legajos) la memoria de la exploración y el comercio con América y el Pacífico desde la época de Colón. Ahí está la información sensible sobre naufragios que ansían localizar los cazatesoros, algo que les preocupa porque «Carabela» permite rastrearlo todo con la rapidez de google. Pero no es el único fondo ni el único tema. Las pruebas han detectado documentación novedosa sobre el descubrimiento español de Australia. Los archivos públicos de nuestro país forman un océano de papel que permanece en más de un 90% inexplorado. La potencialidad del proyecto «Carabela» es, por tanto, casi inimaginable.

Para el proceso de pruebas utilizaron una parte ya digitalizada del AGI al azar: una colección de unos 60.000 documentos a los que sumaron 90.000 del Archivo Histórico Provincial de Cádiz. Del total de 150.000 imágenes, Carlos Alonso eligió 514 documentos que transcribió línea por línea porque servían para realizar la muestra de aprendizaje de las distintas maneras de escribir en el castellano antiguo. Enrique Vidal confiesa que «no tenía claro si iba a acabar bien». Pero cuando aplicó esa «Rosetta digital» a su programa de machine learning, se quedaron boquiabiertos.

400 naufragios en un minuto

Carlos Alonso relata: «Nos hemos metido en todos los charcos posibles. Imágenes con poca calidad (125 píxeles por pulgada) y pésimo contraste, para probar el sistema en el peor escenario. Y funciona de maravilla incluso en ese tipo de documentos. A nivel mundial no hay nada como esto, se han hecho en Europa herramientas para manuscritos del siglo XIX pero nada que abarque desde el XV al XVIII». La interface es un buscador de probabilidad estadística de las palabras presentes en la imagen del documento al que se puede aplicar más o menos sensibilidad. Con una sensibilidad media, alcanza el 85% de efectividad. «Eso es muchísimo», añade Carlos Alonso.

Todos esos charcos les llevaron a relacionar las palabras antiguas con las de hoy, para simplificar la búsqueda. Es decir que si uno escribe «barco» en el buscador el programa «Carabela» rastreará en los documentos «varco» y «barco», pero también los términos goleta, fragata, galeón, chalupa... Para darnos una idea del resultado de la fase de evaluación, solo decir que en un minuto de búsqueda sobre naufragios aparecieron 400, de los 150 eran inéditos, a pesar de estar en el portal de archivos del Ministerio de Cultura «Pares». 149 de esos expedientes son «sensibles» y necesitan protección ante los cazatesoros. La herramienta está lista para utilzarse en cualquier repositorio documental.

Noticias de Australia

Folio de la carta del jesuita - AGI

Vidal relata que un día preparaba una presentación de «Carabela» para un congreso de informática en Australia y le dio por buscar «Austral». Y ahí apareció un documento relevante para rescatar la historia española del continente austral: la carta al rey escrita el 10 de junio de 1710 por el procurador jesuita de las misiones de Manila, padre Andrés Serrano. Está a punto de partir hacia las «otras islas australes» y le relata: «La tierra que azia esta parte Austral del mundo está debajo de la demarcación de vuestra Real Corona y Patronazgo es en su longitud tanta como Europa, Asia menor y hasta el Caspio y la Persia, con todas sus islas». Cita el jesuita a Luis Vaez de Torres y Fernando de Quirós como navegantes que avistaron estas tierras un siglo antes, y lamenta que no se hayan enviado armadas a explorarlas, «una materia de tan importantes consecuencias espirituales y temporales» porque ha llevado a «la perdición eterna de innumerables adultos» que han muerto sin ser evangelizados.

El padre jesuita, que moriría un año después, en octubre de 1711 en un naufragio en las islas Palaos por las que viajaba, añade que esas «otras islas son una pequeña parte de la otra tierra Austral; y conquistadas estas no es difícil el hacer pie e ir penetrando poco a poco por la inmensa tierra firme, que corre hasta 34 grados de la banda del sur y aun se cree que pasa más adelante azia el polo Antártico». La descripción es bastante exacta. Lo que hace después es tratar de convencer al rey de la facilidad para construir armadas pequeñas para ir poblando la tierra Austral.

Australia recibía desde un siglo antes diferentes expediciones. Vaes de Torres y Quirós habían viajado por sus aguas en 1606. Ese mismo año se documenta el desembarco en sus costas del holandés Willem Janszoon. No se trata de reivindicar un descubrimiento exclusivo, sino el conocimiento que jesuitas españoles demuestran en este documento sobre la dimensión del continente que Cook reclama en 1768. Ello permite hablar, en opinión del historiador Manuel Lucena, de que «la historia global de España pone a Australia en el mapa y demuestra, una vez más, la ayuda que las humanidades digitales van a prestar a los estudiosos en los próximos años». Lo que demuestra el proyecto «Carabela» es precisamente el enorme avance que la tecnología ofrece para interpretar el pasado desde una base nueva y especialmente rigurosa, puesto que aporta una masiva consulta documental, imposible hasta ahora.