揭露“主要官方文件”真实版本数字化背后的秘密是一项出色的工作。

现代快报讯(记者刘景炎/文见习记者/图)什么是“大案写作技巧”?这个词连文学和历史专家都不熟悉。《长安十二小时》的流行给虚拟现实这个术语带来了火。剧中的解释相当于现代大数据。在静安公司,徐斌最擅长从档案中寻找有用的信息。

档案数字化公司

△江苏省档案馆

唐朝对档案的利用真的如此发达吗?我不知道。然而,在档案数字化时代,“大案”是可以真正实现的,而且会变得越来越方便。近日,现代快报记者走访江苏省档案馆,披露了“大案”的真实版本

是指使用计算机的公共文件,方便快捷。

“我们在电视剧《长安12小时》中看到的其实是作者的艺术创作,这是一个虚构。江苏省档案管理厅厅长蔡怡君也很关注这部戏。他告诉《现代快报》的一名记者,在这部戏中,利用档案可以在很短的时间内发现很多东西,并且很快会得出结论。在当时的历史条件下,这几乎是不可能的。

“重大公文”依靠人脑的记忆,每次都临时出动大量的人力和物力,以令人惊讶的方式组织和分析文件。“既然我们有了现代化的工具并依靠计算机,我们就可以把人力和物力投入到正常时期。但是,当需要查询和使用它时,它非常方便。“

8年9月9日下午,在江苏省档案馆,许多人在档案查询大厅用电脑查找他们要找的文件。为了检查档案,有编纂历史记录的学者、办理退休手续检查相关材料的企业和机构、检查自己的文件和档案的机构等。

“带上您的身份证,您可以查看打开的文件。”“一名工作人员说,在核实身份证后,可以获得授权码然后在文件检查区的计算机上登录系统,并根据标题、年份、负责人、组织等进行搜索。在检索所需内容、提交申请并获得批准后,您可以看到全文。

揭秘数字化的幕后:

档案数字化公司

△旧文件损坏

现在都是一件精致的工作,在档案室的搜索大厅里搜索和使用文件非常方便。但事实上,这背后是一系列“细致的工作”现代快报记者参观了江苏省数字档案馆,见证了纸质档案数字化的全过程。从文件发布、拆包和页码编排等预处理,到安装、扫描、描述和数据链接,再到最终的文件绑定和存储,所有链接都是链接在一起的,每个链接都附有质量检查。

档案数字化公司

档案数字化公司

档案数字化公司

△安装

首先通过拆包、进行初步识别和简单筛选,查看是否有任何损坏的地方和重复的内容,然后对页面进行编号“不是每个卷都很完整,有些在打开后损坏严重,所以打开时要小心参差不齐,大小不一,黑白不均,有的被老鼠咬,有的被水淹,有的被烧伤...江苏省数字档案馆副馆长刘晶说,历史档案的纸张会被损坏、起皱、起皱。拆包后,应先将其压平,需要安装的应进行修理。一些损坏的纸张必须修整和安装。扫描只能在所有处理完毕后进行。在过去,文件不是打印在A4纸上,这是非常整洁的。在经济困难时期的旧档案中,有一些是用纸张背面的空白页来形成文件正文的。

档案数字化公司

△页码

档案数字化公司

△描述

描述是最重要的环节,直接关系到文件的检索和访问90后李兰宁是描述团队的负责人。当《现代快报》的记者采访她时,她正聚精会神地盯着电脑屏幕,以密集的形式输入文件号、文件号、负责人、标题、文本类型等信息。难道你很久没有看到电子表格了吗?她说,经过六七年的工作,她没有犯任何错误,但她在整体实践中非常熟练。“在描述项中,应该提取文件的信息例如,如果在文件的标题中只输入了摘要的两个字符,则没有检索意义,因此需要提取摘要的时间和内容”刘认真的介绍道然而,档案中的文字并不统一,包括传统的、经典的、用毛笔书写的,甚至还有其他文字和不规则的语法,这些都必须手工记录,现在自动识别很难完成。

档案数字化公司

△数据链接到

后,数据被上传并链接完成目录和扫描图片的关联。最后,普通文件需要装订,线装书需要恢复到原来的样子,不同大小的笔记需要整齐地粘贴在里面,这样文件就可以存放在仓库里。

"文字、音像、录音、图片、各种载体文件应数字化目前,大量纸质文件被数字化。数字化是将纸质文件转化为数字文件,便于跨图书馆、跨地区、跨时间、跨空间使用。纸质档案的数字化是其中非常重要的一部分。“原

号文件被保存在仓库里,以便享受余生。

文件数字化后,珍贵的原件可以返回仓库“享受余生”。"档案库房有温湿度规定,要求温度控制在14 ~ 24℃,相对湿度控制在45 ~ 60?稳定的环境可以确保档案得到妥善保存。

江苏省档案馆特藏是“镇馆之宝”集中的地方。藏品中的珍贵档案保存在该仓库中:有中国档案和文献遗产“彭寮信札”、“南京长江大桥建设档案馆”和革命历史重点档案馆;这里有唐代以来的书画精品、明代的国号和清代翁同龢的题字。还有30,000多盘录像带、120,000张照片、5,000个印章和其他特殊载体文件...其中,录像带保存了江苏电视台在20世纪80年代和90年代播出的所有新闻、专题、文艺节目。旧照片已经全部数字化,一些属于公共档案馆的照片可以在一楼档案检查大厅找到,而这些照片的原件不再直接提供使用。还有唱片档案,20世纪20年代至60年代的黑胶唱片,保存了近一个世纪前的声音,包括当时上海著名歌手、京剧大师等的唱片。这些现在基本上已经数字化了,但是还没有在互联网上公开。

“所有这些都应该数字化,并分阶段分批公开。”江苏省档案局法制教育处处长张说

未来档案将更加“智能化”,实现全文检索。

在江苏省档案馆,有一个一人高的柜子排得整整齐齐。橱柜由装满小卡片的拨浪鼓抽屉组成。蔡怡君介绍说,这些是原始的纸张检索工具,如名片。在档案数字化之前,它们在早期的“大案写作”中发挥了重要作用

经过一段时间的发展和演变,现在江苏省档案馆正在对档案全文进行数字化,即将原始档案转化为计算机可识别的图片格式文件,并在标题和负责人等描述性项目中搜索关键词

”的下一个发展是将文件转换成可以全文搜索的数据格式与各行各业形成的电子文档一起,这些可以用于全文数据检索。蔡怡君说,只有在此基础上才能实现档案的“大数据”管理、检索和应用原

199国家档案局局长、原中央档案局局长杨东泉也提出:“档案数字化就是将纸质文件扫描成图片。这些图片的内容需要由人来解释,而不是由计算机处理的数据。在未来,这些图片应该被转换成计算机可以阅读的文字,转换成计算机可以随意检索的数据,转换成大数据系统,并且可以随意检索、主动推送和深度挖掘。这也被称为“智能档案”,比当前的档案数字化更先进。由于文件的数字化需要字符识别、字幕记录和扫描文件的计算机输入,工作量非常大而且困难。在未来,用于全文内容识别的OCR技术将会更加先进,但这也是未来必须做的,并且是档案工作者的下一个目标方向和出路。

大家都在看

相关专题