现代快报讯(记者 刘静妍/文 见习记者 顾闻/摄)“大案牍术”是什么?这个词,就连文史专家也觉得陌生。《长安十二时辰》热播,带火了这个虚拟现实的术语。剧中解释,相当于现代的大数据。靖安司中,徐宾最擅长在档案中发掘有用信息。
△江苏省档案馆
唐朝对档案的利用,真的这么发达吗?不知道。但进入档案数字化时代的今天,“大案牍术”真的可以实现,而且会越来越便捷。近日,现代快报记者探访了江苏省档案馆,揭秘现实版“大案牍术”。
用电脑查阅公开档案,方便快捷
“我们在电视剧《长安十二时辰》里看到的,所谓的“大案牍术”,实际上是作者的艺术创作,是一种虚构。”江苏省档案馆管理部主任蔡宜军也关注到了这部剧,他告诉现代快报记者,剧中,在很短时间内,利用档案查能到很多东西,并且很快得出结论。这在当时的历史条件下,几乎不可能实现的。
“大案牍术”依赖的是人脑的记忆,而每次都要临时调度大量人力和物力,去突击整理和分析档案。“而现在有了现代化的工具,依赖计算机,我们可以把人力、物力的投入放在平时。而当需要查询、利用的时候,就很便捷了。”
8月9日下午,在江苏省档案馆,不少人正用查档大厅电脑查询想找的档案。前来查档的,有编史修志的学者,有为办理退休手续查阅相关材料的企事业单位人员,有查阅本单位文书档案的机关人员等等。
“带着身份证过来,便可以查阅开放档案。”一位工作人员介绍,身份证验证过之后,便可以获得一个授权码。然后在查档区的计算机上登录系统,根据题名、年份、责任者、机构等进行检索。检索到想要的内容,提交申请,获得审批之后,便可以看到全文了。
揭秘数字化的幕后:环环相扣,都是精细活儿
△有破损的旧档案
现在,在档案馆的查档大厅,要检索、利用档案,已经非常便捷了。但其实,这背后是一系列的“细致活儿”。现代快报记者探访了江苏省数字档案中心,见证了纸质档案数字化的幕后全流程。从档案出库、拆卷、编页码等前处理,到修裱、扫描、著录和数据挂接,再到最后档案装订、入库……环环相扣,并且每个环节都要伴随着质量检查。
△修裱
首先是拆卷,进行初步的鉴定和简单的筛选,看看里面有没有破损的地方、重复的内容,然后进行编页码。“不是每一卷都是非常完整的,有的打开以后破损很严重,拆的时候就要很小心。参差不齐、大小不一、黑白不均,有的有老鼠咬过的,有水淹过的、有火烧过的……”江苏省数字档案中心副主任刘兢兢介绍,历史档案的纸张,会有破损、皱褶、折痕,拆卷之后,要先压平,需要修裱的要拿去修。有的破损纸张,还要经过修裱。全部都处理好了,才能进行扫描。过去的档案,并不像现在都是A4纸打印的,非常整齐。经济困难时期的老档案里,还有利用纸张反面空白页形成文件正文的。
△编页码
△著录
著录是最重要的环节,与档案的检索、查阅直接相关。90后李乐宁是著录组组长,现代快报记者采访时,她正聚精会神地对着电脑屏幕,在密密麻麻的表格中依次输入档号、文件号、责任者、题名、文种等信息。长时间盯着电子表格,不会眼花吗?她说,工作六七年,也不是没出过差错,但总体上已经练得很娴熟了。“在著录项里,要把档案的信息提取出来。比如简报,如果只把简报两个字录入在档案的题名里,那么就没有检索的意义了,因此需要提取出:什么时间、什么内容的简报。”刘兢兢介绍。而档案的文本并不统一,有繁体的、文言的、毛笔写成的,甚至还有别字、有文法不规范的,这就必须人工著录,现在的自动识别难以完成。
△数据挂接
著录完成之后,是数据上传、挂接,完成目录与扫描图片的关联。最后,普通的档案要经过装订,线装书还要恢复原貌,大小不等的便条要整齐地贴在里面,档案才能入库保存。
“文字、声像、录音、图片,各种载体的档案都要数字化。现在大批量的是纸质档案的数字化工作。数字化,是为了把纸质档案变成数字化的档案,便于跨馆、跨区域、跨时空地利用。纸质档案的数字化,是其中非常重要的一部分。”
档案原件保存在库房,得以颐养天年
档案数字化以后,珍贵的原件便可以回到库房“颐养天年”了。档案库房,对于温湿度都是有规定的,要求温度控制在14~24℃,相对湿度应控制在45~60?稳定的环境,能使档案得到妥善的保存。
江苏省档案馆的特藏库,是“镇馆之宝”的集中之地。馆藏珍贵档案,都保存在这个库房:有中国档案文献遗产《朋僚函札》《南京长江大桥建设档案》以及重点革命历史档案;有唐代以来的书画精品、明代诰命和清代翁同龢的题跋;还有3万多盒录像带、12万张照片、5000多枚印章等特殊载体档案……
其中,录像带保存了八九十年代江苏电视台播放的所有新闻类、专题类、文艺类等节目。老照片已经全部数字化了,属于公开档案的部分照片,在一楼查档大厅都能查阅到,而这些照片的原件就不再直接提供利用了。还有唱片档案,是从上世纪20年代至60年代的黑胶唱片,则保存了穿越近百年而来的声音,包括当时上海知名歌手周旋、京剧名家的唱片等等,这些现在基本上也都数字化了,但目前还没有上网公开。
“这些全部要数字化,分期分批公开。”江苏省档案馆法规宣教处处长张少敏说。
未来档案更“智慧”,将实现全文检索
在江苏省档案馆,有一个区域,整齐排列着一排排大约一人高的柜子,柜子由一格格抽屉组成,抽屉里装着满了小卡片。蔡宜军介绍,这些是最初的纸质档案检索工具,比如人名卡片。在档案数字化之前,它们在早期的“大案牍术”中扮演着重要角色。
经过一段时间的发展和演变,现在,江苏省档案馆正在进行档案的全文数字化,也就是,把原来的档案变成计算机可以识别的图片格式文件,通过题名、责任者等著录项中的关键词来检索。
“下一步的发展,是把档案转化成可以进行全文搜索的数据格式。加上现在各行各业形成的电子文档,这些都是可以进行全文数据检索的。”蔡宜军说,以这为基础,才能实现档案的“大数据”管理、检索和应用。
国家档案局原局长、中央档案馆原馆长杨冬权也曾提出:“档案数字化,是把纸质档案扫描成图片,这些图片上的档案内容,还需要人来解读,不能成为数据,由电脑来处理;今后,应该把这些图片转化为电脑可以读的字,变成电脑可以任意检索的数据,进入大数据系统,可以任意检索、主动推送、深度挖掘。”这也就是“智慧档案”,比现在的档案数字化更高级。因为档案数字化需要对扫描的档案进行文字识别、注录标题并输入电脑,工作量是非常巨大,难度也很大。今后全文内容识别的OCR技术更先进,但这也是未来必须要做的,是档案人的下一个目标方向和风口。