¿Los españoles descubrieron Australia?

Escuchando el capítulo 303 del podcast Coffee Break, nos enteramos del proyecto CARABELA. El cual busca recuperar información relevante de barcos y naufragios no identificados, aplicando técnicas similares a las del Reconocimiento Óptico de Caracteres (OCR), al Archivo General de Indias, en Sevilla y al Archivo Histórico Provincial de Cádiz.

El reto del proyecto que dirige Enrique Vidal, de la Universidad Politécnica de Valencia, es doble. Por un lado, tanto la forma de escribir, como de hablar; ha cambiado en seis siglos. Por lo cual se hace necesario trabajar por un lado, con paleógrafos para identificar las grafías. Y por otro lado, que realizar este trabajo manualmente por especialistas, se convierte en inviable. Para ello, es que se aprovechan las ventajas del Machine Learning.

Como resultado de algunos ejercicios de búsqueda de conceptos en el proyecto CARABELA, se buscó el término “austral” y se llevaron una enorme sorpresa. Un jesuita que detallaba la ubicación de Australia e islas contiguas; dejando registro de que Vaes de Torres y Quirós las desubrió en 1606. Mas de 50 años antes que James Cook las reclamara para el imperio británico.

Proyecto Carabela

El proyecto CARABELA (Indexación probabilística de colecciones de manuscritos para protección del patrimonio histórico subacuático) consta de 80 millones de páginas manuscritas. Un reto enorme porque en los idiomas no solo cambia la caligrafía, también las grafías e incluso los nombres de los lugares. Un proyecto que solo es posible conseguirlo con el aporte multidisciplinar de matemáticos, programadores, palógrafos, lenguaje; entre otros.

Menciona Ángel López-Sánchez en el podcast que el estrecho entre el continente australiano y la isla de Nueva Guinea se llama estrecho de Torres (en una asociación con Vaes de Torres). Menciona también Sara Robisco el descubrimiento de 150 naufragios que no se tenían identificados.

El artículo con la descripción del funcionamiento de CARABELA esta aquí. El proyecto se puede encontrar en esta liga y una presentación del mismo, aquí. La información del Centro de Investigación de Reconocimiento de Patrones y Tecnología del Lenguaje Humano, Universidad Politécnica de Valencia, aquí. El capítulo de Coffe Break lo pueden ver en youtube.

Créditos de la imagen: Proyecto CARABELA, y mapa por Picryl.