海峡两岸信息资源管理学术论坛|林巧敏教授谈档案史料之数字人文研究探索

发布日期: 2023/05/08  投稿: 崔明    部门:    浏览次数:   

2023年5月4日,中华图书资讯学教育学会、政治大学图书资讯与档案学研究所和上海大学联合主办了“海峡两岸信息资源管理学术论坛”第二场讲座。此次报告主题是《档案史料之数字人文研究探索》,旨在探讨数字人文工具为档案管理和内容加值应用带来的崭新的研究与发展。本次讲座由政治大学图书资讯与档案研究所所长、图书馆副馆长、中华图书资讯学教育学会系所主任委员会主任委员林巧敏教授主讲,由吉林大学商学与管理学院教授、中国档案学会理事、档案学基础理论学术委员会委员张卫东教授主持。此次讲座共有300余位师生相聚云端,共同探讨数字人文在档案史料领域的探索与发展。

首先,林巧敏教授从近读和远读方面分别阐释了“为什么需要数字人文”;然后指出了“数字人文研究目的”是为处理海量数据、将数据结构化、自动化作业流程、发掘文本、呈现研究结果以及结合其他技术应用;最后介绍了“数字人文研究工具”种类,包括基本工具、资料搜集工具、数据分析工具和数据呈现及研究工具。

接下来,林巧敏教授具体介绍了数字人文在档案史料内容勘探中的应用。数字工具可以为内容勘探提供词频分析、文本分析、数据勘探、信息可视化以及地理信息功能方面的支持。在确定研究主题后,档案数据勘探流程可分为五个步骤,分别为数据集汇整、自动断词、机器学习、勘探结果分析以及研究结果呈现。然后林巧敏教授指出数字勘探技术应用于档案管理与内容分析的优势之处,在优化档案管理方面包括运用自动分类工具对档案内容进行主题归类,利用主题分群找出档案展览叙事主题大纲;在促进档案内容分析方面可以分析人物网络关系、主题分布,时间趋势以及情感倾向。

林巧敏教授通过一个研究实例对档案史料的内容断词和自动分类进行展示。数据方面选择了4361笔《总裁特批》档案,对档案元数据中含有主题概念字段的词汇使用CKIP断词工具进行档案目录前处理,然后运用CATAR进行自动分类,选取合适的阈值与阶层,运用主题地图或主题树进行辅助判断,最终完成自动分类。接下来林巧敏教授又通过另一个档案新闻及网络舆论情感分析的实例展现了在社交媒体中对档案相关信息应用数字勘探技术的实况。通过对两个实例的总结,林巧敏教授指出了现阶段档案领域应用数字勘探技术待解决的问题,包括数字人文工具依旧需要人类辅助判断和研究结果无法适用全部文本等问题,也指出了数字人文工具在档案史料研究领域未来的发展方向,即从鉴定、搜集、描述、检索、数位策展等一系列档案管理工作中形成AI化档案管理流程。

在讲座的提问环节,参会人员积极与林巧敏教授展开交流。参会人员提出“在台湾地区,人文学者对数字人文的看法是什么样的”“在合作过程中,档案学科、信息学科和人文学科之间的学术分工是怎么样的”“在档案新闻情感分析实例中,为什么没有选择台湾著名论坛PTT作为数据源”等问题,林巧敏教授一一进行了解答,进一步深化了两岸图书资讯研究者的对话和交流。

本次讲座在意犹未尽中结束,林巧敏教授带来的分享内容详实,深入浅出,理论与实际相结合,让参会人员对数字人文工具在档案史料领域的应用有了更深刻的认识。(撰稿:高臻)