Automatic Text Transcribers and Collaborative Transcription Streamlining Palaeographic Reading and the Identification of Textual Information in Historical Collections: The Example of the Mooc Palaeography in the Wiki Network
DOI:
https://doi.org/10.48798/cadernosbad.3090Keywords:
Transkribus, Wiki Ecosystem, Collaborative Transcription, Historical Documents, Digital PaleographyAbstract
This paper aims to present a practical example of the use of automatic text transcribers based on Artificial Intelligence as preliminary aids in the collaborative transcription of historical manuscripts, carried out during the Mooc Paleografia na Rede Wiki (Palaeography in the Wiki Network), a course promoted in 2024 by Wiki Movimento Brasil (WMB) in partnership with the Public Archives of the State of Bahia (APEB). During the course, which took place on Wikiversity, the Transkribus platform was incorporated into WikiSource as an initial step for the transcription of documents related to the Malê Revolt, the most significant uprising of enslaved Africans in Bahia, Brazil, in 1835. These documents, of great relevance to APEB, lacked detailed descriptions in the institution’s database, which would only be possible through comprehensive reading and transcription of the entire corpus. Thus, after lessons in both traditional and digital palaeography, the Mooc students were invited to begin their transcription activities through automated processing, using the M1 model, developed in Brazil between 2019 and 2022. This process brought two major advantages: the Wiki ecosystem enabled collective intervention with validation controls, ensuring the quality of the final transcription, and the use of Transkribus accelerated the overall workflow.
Downloads
References
Hosokawa, A. B. de Souza, Braz, C. B., Do Espírito Santo, C. C., Minervini, F. M., Dos Santos, J. G. V. A., Santana, J. F. P., Pires, Y. T. (2021). Análise do processo inquisitorial do negro Pedro João: um resultado do projeto Várias Mãos e Muitas Penas. Laborhistórico, 7, 413-442. Disponível em: https://revistas.ufrj.br/index.php/lh/article/view/49393
Lose, A. D., & Magalhães, L. B. S. (2016). Reflexões sobre edições digitais: fazendo filologia no século XXI. A Cor das Letras (UEFS), 17, 115-126. Disponível em: https://periodicos.uefs.br/index.php/acordasletras/article/view/1442
Lose, A. D., & Magalhães, L. B. S. (2024). Transkribus: uma ferramenta de paleografia digital mediando pesquisas em fontes inquisitoriais. Laborhistórico, 10, 1-22. Disponível em: https://revistas.ufrj.br/index.php/lh/article/view/63285
Magalhães, L. B. S. (2020). Uso da tecnologia no desenvolvimento de pesquisa em acervo. In A. D. Lose, L. B. S. Magalhães, C. C. F. G. Querino, E. C. Luz, & T. E. S. Nascimento (Orgs.), Pesquisando Acervo (Vol. 1, pp. 161-174). Salvador: Memória e Arte. Disponível em: https://www.memoriaarte.com.br/
Magalhães, L. B. S. (2021). Da 1.0 até a 3.0: a jornada da paleografia no mundo digital. Laborhistórico, 7, 279-295. Disponível em: https://revistas.ufrj.br/index.php/lh/article/view/42368
Magalhães, L. B. S., & Xavier, L. F. W. (2021). Can machines think? Por uma paleografia digital para textos em língua portuguesa. In A. D. Lose, L. B. S. Magalhães, & V. S. Mazzon (Orgs.), Paleografia e suas interfaces (pp. 259-269). Salvador: Memória e Arte. Disponível em: https://www.memoriaarte.com.br/
Reis, J. J. (2003). Rebelião escrava no Brasil: A história do levante dos Malês em 1835. Companhia das Letras.
Santos, J. G. V. A., & Lose, A. D. (2022). "Se não tivesse intervido, sem dúvida seria ocupada pelos hereges": o bispado da Bahia na guerra contra os holandeses. Revista de História (Salvador), 10, 1-12.
Santos, J. G. V. A., & Lose, A. D. (2022). O exercício da vigilância no Atlântico Sul: o caso do Frei Antonio Caldeira. Revista de História (Salvador), 10, 1-12. Disponível em: https://periodicos.ufba.br/index.php/rhufba/article/view/52398
Werneck Xavier, L. (2023). Montando um quebra-cabeça: paleografia, indexação digital e pesquisa interinstitucional. Laborhistórico, 9, 1-19.
Downloads
Published
How to Cite
Issue
Section
License
Copyright (c) 2025 Cadernos BAD

This work is licensed under a Creative Commons Attribution 4.0 International License.
Os autores que publicam nos Cadernos BAD:
- Concedem à revista o direito de primeira publicação, mantendo os direitos de autor, de acordo com os termos da Creative Commons Attribution, que permite a partilha do texto com menção obrigatória da publicação inicial nos Cadernos BAD;
- Mantêm o direito de publicar o texto noutros locais (ex.: repositório institucional, capítulo de livro, outra publicação periódica), com menção da publicação inicial nos Cadernos BAD e uma ligação para o sítio na Internet da revista;
- Mantêm a possibilidade e são mesmo incentivados a publicar e distribuir o seu trabalho online (ex.: em repositórios institucionais ou na sua página pessoal) antes ou durante o processo editorial, já que isso pode potenciar interações geradoras de melhoria, bem como aumentar o impacto e a citação do texto publicado (Veja Efeitos do Acesso Livre).
