Summer School Barcelona 2025

El segundo Summer School del proyecto PortADa tuvo lugar entre enero y marzo de 2025, acogido por la Universidad de Barcelona, y se centró en una etapa clave del desarrollo del proyecto: la depuración de los datos extraídos. Esta instancia marcó el paso de la generación de corpus de texto a su preparación para el análisis estructurado.

Durante este encuentro se completaron tareas fundamentales para avanzar en el procesamiento de las noticias de llegadas de buques a los puertos, entre ellas:

  • La optimización de los procedimientos de segmentación, que permiten organizar correctamente el contenido de cada página digitalizada.
  • La finalización del proceso de OCR sobre las imágenes de prensa histórica digitalizada, solventando errores y afinando el procedimiento de reconocimiento automático.
  • El inicio de las tareas de depuración del texto, basadas en muestras significativas del corpus. Este trabajo permitió identificar y categorizar errores frecuentes y establecer estrategias diferenciadas según el tipo de entidad mencionada (puertos, buques, personas).
  • El diseño y uso de diccionarios y listas de palabras controladas, tanto para la normalización como para la detección automática de errores y ambigüedades.

Al final del Summer School se realizó un seminario académico, en el que participaron especialistas internacionales vinculados a proyectos de referencia en el ámbito de la historia marítima y en la aplicación de tecnologías digitales para el procesamiento masivo de datos procedentes de prensa histórica digitalizada. Las presentaciones incluyeron:

  • Silvia Marzagalli (Université Côte d’Azur – The Portic Project): The Portic experience: understanding maritime trade through digital humanities.
  • Miguel Ángel Bringas Gutiérrez (Universidad de Cantabria): Tráfico comercial por el puerto de Santander, 1881–1891.
  • Antoine Doucet (University of Ljubljana / La Rochelle Université): NewsEye – a digital investigator for historical newspapers.

Estos intercambios permitieron contrastar los enfoques metodológicos del proyecto PortADa con experiencias afines, enriquecer el proceso de depuración y abrir nuevas líneas de colaboración.

Como resultado de este Summer School, se logró obtener el texto completo de prácticamente todos los diarios correspondientes al período de estudio, lo que constituye un hito importante del proyecto. Además, se dejó perfilado el plan de trabajo para la siguiente etapa: el desarrollo de una plataforma digital interactiva, que permitirá realizar tareas colaborativas de depuración, validación y extracción de datos de manera distribuida entre los distintos equipos de investigación.

El Summer School de Barcelona consolidó así una nueva fase del proyecto, centrada en el paso del texto al dato y en el fortalecimiento de las herramientas necesarias para una explotación rigurosa y sostenible del corpus generado.