摘要: 提出中文历史档案数据化整理的学术概念,参照FEAF框架设计技术参考模型,针对面临的现实阻力提出若干实践策略。中文历史档案数据化整理是致力于采用数据科学的理论、方法和技术,通过人工标注与机器学习相结合的方式,将历史档案的背景信息、自然语言文本的语义信息和对应社会系统的语境信息转换为计算机可以高速精准处理的大规模结构化数据集的过程。现阶段应进行战略规划,制定相关标准,并按照超前布局的理念启动基础设施建设,分层级、有重点地予以推进。
赵生辉 徐丹丹 马 藤. 中文历史档案数据化整理论纲[J]. 山西档案, 2024, 275(3): 5-.