Систематизація підходів до класифікації документів в архівах
DOI:
https://doi.org/10.36273/2076-9555.2025.10(351).38-45Ключові слова:
класифікація документів, методи класифікації, автоматизовані системи, цифрове опрацювання документів, структурування архівних фондів, цифрові архівиАнотація
У статті проведено систематизацію традиційних і сучасних підходів до класифікації документів в архівних установах. Розглянуто теоретичні основи, ручні й автоматизовані методи класифікації. Констатовано, що до традиційних методів класифікації в архівах належать ієрархічні класифікаційні системи, тематичне та функціональне групування, архівний опис. Автоматизовані методи охоплюють системи на основі правил, статистичні методи класифікації, методи машинного навчання, глибоке навчання, гібридні підходи.
Запропоновано послідовність етапів класифікації в архівах: передопрацювання, виділення ознак, етап побудови або застосування моделі класифікації, оцінювання точності класифікації, інтеграція автоматизованої класифікації в системи управління документами.
Проаналізовано головні проблеми, що постають у процесі впровадження автоматизованих рішень, зокрема багатомовність, неструктурованість даних, низька якість оцифровування, етичні виклики.
Стаття базується на сучасних дослідженнях і практичних прикладах, що підтверджує актуальність теми в умовах цифрової трансформації архівної справи.
Посилання
Brokensha S., Kotzé E., Senekal B. Machine learning for document classification in an archive of the National Afrikaans Literary Museum and Research Centre. Journal of the South African Society of Archivists. 2023. Vol. 56. P. 134—147. DOI: https://doi.org/10.4314/jsasa.v56i.9 (accessed: 18.05.2025).
Esposito F. [et al.]. Machine learning methods for automatically processing historical documents: from paper acquisition to XML transformation. First International Workshop on Document Image Analysis for Libraries. 2004. Palo Alto, CA, USA. [S. l.]. DOI: https://doi.org/10.1109/dial.2004.1263262 (accessed: 18.05.2025).
Lombardi F., Marinai S. Deep Learning for Historical Document Analysis and Recognition—A Survey. Journal of Imaging. 2020. Vol. 6, no. 10. P. 110. DOI: https://doi.org/10.3390/jimaging6100110 (accessed: 18.05.2025).
Hutchinson T. Protecting Privacy in the Archives: Supervised Machine Learning and Born-Digital Records. 2018 IEEE International Conference on Big Data (Big Data), Seattle, WA, USA, 10—13 December 2018. [S. l.], 2018. DOI: https://doi.org/10.1109/bigdata.2018.8621929 (accessed: 18.05.2025).
Trace C. B. Maintaining Records in Context: A Historical Exploration of the Theory and Practice of Archival
Classification and Arrangement. The American Archivist. 2020. Vol. 83, no. 1. P. 91—127. DOI: https://doi.org/
17723/0360-9081-83.1.91 (accessed: 18.05.2025).
Jiang Sh. [et al.]. Deep Learning for Technical Document Classification. IEEE Transactions on Engineering
Management. 2022. P. 1—17. DOI: https://doi.org/10.1109/tem.2022.3152216 (accessed: 18.05.2025).
Barros T. H. B., Moraes J. B. E. Archival Classification and Knowledge Organization: Theoretical Possibilities for the Archival Field. Categories, Contexts and Relations in Knowledge Organization. [S. l.]. 2012. P. 272—276. DOI: https://doi.org/10.5771/9783956504402-272 (accessed: 18.05.2025).
##submission.downloads##
Опубліковано
Номер
Розділ
Ліцензія
Надсилаючи авторський оригінал статті в редакцію, автор тим самим дає згоду на використання його персональних даних для публікації в журналі, а також на розміщення статті в електронній версії журналу на веб-сайті Національної бібліотеки України імені В. І. Вернадського відповідно до наказу Міністерства освіти і науки, молоді та спорту України від 17 жовтня 2012 року № 1111 "Про затвердження Порядку формування Переліку наукових фахових видань України".
Авторський оригінал має бути завершеним твором і не може доопрацьовуватись автором після прийняття редакцією.
Статті, що не відповідають викладеним вимогам, або містять не всі елементи (наприклад, без індекса УДК), редакцією не приймаються. Оригінали, не прийняті до опублікування, авторам не повертаються.
Редакція має право робити редакційні правки, які не впливають на смисл тексту. Правки узгоджуються з автором.
Публікація статей в журналі безоплатна. Авторський гонорар не виплачується й авторський примірник не надається.
Автори, які хочуть придбати журнал, зазначають це в листі при надсиланні матеріалів до редакції, вказавши електронну адресу для надсилання рахунку за примірник журналу. Отримати примірник можна після надходження коштів на рахунок Книжкової палати. Без попереднього замовлення придбати примірник журналу не можна.