Automatic Text Transcribers and Collaborative Transcription Streamlining Palaeographic Reading and the Identification of Textual Information in Historical Collections: The Example of the Mooc Palaeography in the Wiki Network

Authors

  • Alícia Duhá Lose Universidade Federal da Bahia

DOI:

https://doi.org/10.48798/cadernosbad.3090

Keywords:

Transkribus, Wiki Ecosystem, Collaborative Transcription, Historical Documents, Digital Paleography

Abstract

This paper aims to present a practical example of the use of automatic text transcribers based on Artificial Intelligence as preliminary aids in the collaborative transcription of historical manuscripts, carried out during the Mooc Paleografia na Rede Wiki (Palaeography in the Wiki Network), a course promoted in 2024 by Wiki Movimento Brasil (WMB) in partnership with the Public Archives of the State of Bahia (APEB). During the course, which took place on Wikiversity, the Transkribus platform was incorporated into WikiSource as an initial step for the transcription of documents related to the Malê Revolt, the most significant uprising of enslaved Africans in Bahia, Brazil, in 1835. These documents, of great relevance to APEB, lacked detailed descriptions in the institution’s database, which would only be possible through comprehensive reading and transcription of the entire corpus. Thus, after lessons in both traditional and digital palaeography, the Mooc students were invited to begin their transcription activities through automated processing, using the M1 model, developed in Brazil between 2019 and 2022. This process brought two major advantages: the Wiki ecosystem enabled collective intervention with validation controls, ensuring the quality of the final transcription, and the use of Transkribus accelerated the overall workflow.

Downloads

Download data is not yet available.

References

Hosokawa, A. B. de Souza, Braz, C. B., Do Espírito Santo, C. C., Minervini, F. M., Dos Santos, J. G. V. A., Santana, J. F. P., Pires, Y. T. (2021). Análise do processo inquisitorial do negro Pedro João: um resultado do projeto Várias Mãos e Muitas Penas. Laborhistórico, 7, 413-442. Disponível em: https://revistas.ufrj.br/index.php/lh/article/view/49393

Lose, A. D., & Magalhães, L. B. S. (2016). Reflexões sobre edições digitais: fazendo filologia no século XXI. A Cor das Letras (UEFS), 17, 115-126. Disponível em: https://periodicos.uefs.br/index.php/acordasletras/article/view/1442

Lose, A. D., & Magalhães, L. B. S. (2024). Transkribus: uma ferramenta de paleografia digital mediando pesquisas em fontes inquisitoriais. Laborhistórico, 10, 1-22. Disponível em: https://revistas.ufrj.br/index.php/lh/article/view/63285

Magalhães, L. B. S. (2020). Uso da tecnologia no desenvolvimento de pesquisa em acervo. In A. D. Lose, L. B. S. Magalhães, C. C. F. G. Querino, E. C. Luz, & T. E. S. Nascimento (Orgs.), Pesquisando Acervo (Vol. 1, pp. 161-174). Salvador: Memória e Arte. Disponível em: https://www.memoriaarte.com.br/

Magalhães, L. B. S. (2021). Da 1.0 até a 3.0: a jornada da paleografia no mundo digital. Laborhistórico, 7, 279-295. Disponível em: https://revistas.ufrj.br/index.php/lh/article/view/42368

Magalhães, L. B. S., & Xavier, L. F. W. (2021). Can machines think? Por uma paleografia digital para textos em língua portuguesa. In A. D. Lose, L. B. S. Magalhães, & V. S. Mazzon (Orgs.), Paleografia e suas interfaces (pp. 259-269). Salvador: Memória e Arte. Disponível em: https://www.memoriaarte.com.br/

Reis, J. J. (2003). Rebelião escrava no Brasil: A história do levante dos Malês em 1835. Companhia das Letras.

Santos, J. G. V. A., & Lose, A. D. (2022). "Se não tivesse intervido, sem dúvida seria ocupada pelos hereges": o bispado da Bahia na guerra contra os holandeses. Revista de História (Salvador), 10, 1-12.

Santos, J. G. V. A., & Lose, A. D. (2022). O exercício da vigilância no Atlântico Sul: o caso do Frei Antonio Caldeira. Revista de História (Salvador), 10, 1-12. Disponível em: https://periodicos.ufba.br/index.php/rhufba/article/view/52398

Werneck Xavier, L. (2023). Montando um quebra-cabeça: paleografia, indexação digital e pesquisa interinstitucional. Laborhistórico, 9, 1-19.

Published

2025-07-27

How to Cite

Duhá Lose, A. (2025). Automatic Text Transcribers and Collaborative Transcription Streamlining Palaeographic Reading and the Identification of Textual Information in Historical Collections: The Example of the Mooc Palaeography in the Wiki Network. Cadernos BAD, (1-2). https://doi.org/10.48798/cadernosbad.3090

Issue

Section

Jornadas Open Source