Систематизація підходів до класифікації документів в архівах

Автор(и)

DOI:

https://doi.org/10.36273/2076-9555.2025.10(351).38-45

Ключові слова:

класифікація документів, методи класифікації, автоматизовані системи, цифрове опрацювання документів, структурування архівних фондів, цифрові архіви

Анотація

У статті проведено систематизацію традиційних і сучасних підходів до класифікації документів в архівних установах. Розглянуто теоретичні основи, ручні й автоматизовані методи класифікації. Констатовано, що до традиційних методів класифікації в архівах належать ієрархічні класифікаційні системи, тематичне та функціональне групування, архівний опис. Автоматизовані методи охоплюють системи на основі правил, статистичні методи класифікації, методи машинного навчання, глибоке навчання, гібридні підходи.
Запропоновано послідовність етапів класифікації в архівах: передопрацювання, виділення ознак, етап побудови або застосування моделі класифікації, оцінювання точності класифікації, інтеграція автоматизованої класифікації в системи управління документами.
Проаналізовано головні проблеми, що постають у процесі впровадження автоматизованих рішень, зокрема багатомовність, неструктурованість даних, низька якість оцифровування, етичні виклики.
Стаття базується на сучасних дослідженнях і практичних прикладах, що підтверджує актуальність теми в умовах цифрової трансформації архівної справи.

Біографія автора

Василь Курило

аспірант НУ "Львівська політехніка", спеціальність "Інформаційна, бібліотечна та архівна справа"

Посилання

Brokensha S., Kotzé E., Senekal B. Machine learning for document classification in an archive of the National Afrikaans Literary Museum and Research Centre. Journal of the South African Society of Archivists. 2023. Vol. 56. P. 134—147. DOI: https://doi.org/10.4314/jsasa.v56i.9 (accessed: 18.05.2025).

Esposito F. [et al.]. Machine learning methods for automatically processing historical documents: from paper acquisition to XML transformation. First International Workshop on Document Image Analysis for Libraries. 2004. Palo Alto, CA, USA. [S. l.]. DOI: https://doi.org/10.1109/dial.2004.1263262 (accessed: 18.05.2025).

Lombardi F., Marinai S. Deep Learning for Historical Document Analysis and Recognition—A Survey. Journal of Imaging. 2020. Vol. 6, no. 10. P. 110. DOI: https://doi.org/10.3390/jimaging6100110 (accessed: 18.05.2025).

Hutchinson T. Protecting Privacy in the Archives: Supervised Machine Learning and Born-Digital Records. 2018 IEEE International Conference on Big Data (Big Data), Seattle, WA, USA, 10—13 December 2018. [S. l.], 2018. DOI: https://doi.org/10.1109/bigdata.2018.8621929 (accessed: 18.05.2025).

Trace C. B. Maintaining Records in Context: A Historical Exploration of the Theory and Practice of Archival

Classification and Arrangement. The American Archivist. 2020. Vol. 83, no. 1. P. 91—127. DOI: https://doi.org/

17723/0360-9081-83.1.91 (accessed: 18.05.2025).

Jiang Sh. [et al.]. Deep Learning for Technical Document Classification. IEEE Transactions on Engineering

Management. 2022. P. 1—17. DOI: https://doi.org/10.1109/tem.2022.3152216 (accessed: 18.05.2025).

Barros T. H. B., Moraes J. B. E. Archival Classification and Knowledge Organization: Theoretical Possibilities for the Archival Field. Categories, Contexts and Relations in Knowledge Organization. [S. l.]. 2012. P. 272—276. DOI: https://doi.org/10.5771/9783956504402-272 (accessed: 18.05.2025).

##submission.downloads##

Опубліковано

2025-12-01

Номер

Розділ

Архівознавство й архівна справа