档案数字化服务项目技术规范书.docx
打中国华能CHINAHUANENG档案数字化服务项目技术规范书华能营口仙人岛热电有限责任公司2022年9月档案数字化服务项目技术规范书一、项目背景根据集团公司申报企业集团数字档案馆(室)建设试点单位(办联(2022)7号)以及规范传统载体档案数字化工作(办联(2021)69号)的相关要求,营口仙人岛热电有限责任公司需在2023年12月前,按照集团公司的相关要求完成营口仙人岛热电档案数字化工作并通过集团公司验收。集团公司数字档案馆建设质量评价验收要求传统载体档案数字化率不低于80%o由于时间紧、任务重,且缺乏必要的档案数字化设备,为确保顺利通过集团公司验收,拟将营口仙人岛热电从2014年至2022年间的档案(约7万份)委托第三方服务机构进行数字化规范,并按照要求将其整理至华能集团数字档案馆系统。整个工程实施过程中需要的设备,由承包方自行提供。二、档案数字化服务要求1.承包方数字化服务后必须保证华能营口仙人岛热电有限责任公司一次性通过华能集团数字档案馆建设试点的验收。2 .档案数字化加工要严格遵照中国华能集团有限公司档案数字化实施办法执行并达到要求标准。3 .承包方应在服务实施过程中负责对营口仙人岛热电有限责任公司进行数字档案馆系统管理与应用以及数字化加工进行培训。4 .承包方必须保证文书档案的原生文件在数字档案馆中可查性。5 .在项目实施期间,承包方需要培训营口仙人岛热电有限责任公司数字化加工软件的安装、调试和使用。6 .承包方负责全体施工人员及施工过程和施工设备的安全管理,并负有施工中的数据安全责任。7 ,承包方在项目开工前将施工中所需的各种设备运到现场,以保证项目的顺利进行,确保项目工期。8 ,承包方在工作中应采取节约用水和节约用电措施。9 .承包方在工作中尽量采取措施保证环境卫生和减少对空气的污染。10 .承包方在工作中必须遵守营口仙人岛热电有限责任公司的管理制度和工作标准。I1.如果发生由于承包方的责任造成重大环境事故,由承包方承担全部的责任。三、验收标准通过营口仙人岛热电有限责任公司的验收并且必须一次性通过华能集团公司的数字档案馆建设试点验收。四、付款方式合同签订后,乙方按要求交履约保证金(函)后,乙方为甲方单位开具收据后,甲方先期支付全部项目15%费用,作为项目实施预付款。2023年项目所有工作内容完成并经甲方验收合格后,乙方为甲方单位开具符合国家规定的正规发票,支付第二阶段进度款,第二阶段进度款为全部项目75%的费用;通过集团公司档案数字化验收合格后,乙方为甲方单位开具符合国家规定的正规发票,甲方支付项目剩余全部项目10%的费用。五、技术规范(一)、纸质档案数字化流程工作环节主要包括:数字化前处理、目录数据库建立、档案扫描、图像处理、数据挂接、档案还原、数据质检、数据备份、数字化成果验收与移交、档案入库等,在整个实施过程中确保档案实体及信息的安全保密。数字化加工设施设备不得与互联网连接;数字化成果应通过验收且确认无病毒,方可按要求移交并存储到集团公司数字档案馆中。1 .档案出库从档案室提卷是数字化工作的第一个步骤。要保证档案没有遗失、没有损坏、不重不漏,提卷的登记工作必不可少。主要登记以下内容:提卷人、提卷的案卷号、提卷数量、提卷时间、负责人等,以便作为核对的依据。在和加工方签字确认数量后进行档案移交。2 .数字化前处理(1)确定扫描页纸质档案原则上应将确定为数字化对象的纸质档案全部扫描,不宜进行挑扫。如有不需要扫描的页面应加以标注。(2)编制页号a.应对没有页号或页号不正确的档案重新编制页号。并根据更正后的页号打印新的卷内目录以替换原有的卷内目录。b.重新编制页号时,应在统一位置书写页号,且不压盖档案内容。C.书写页号所使用的笔、墨等不应破坏档案原件或对档案长期保存造成影响。出应将破损页面、缺页等特殊情况进行登记。(3)目录数据准备a.按照目录数据库建立时制定的数据规则,对照档案原件内容,规范档案中的目录内容。b.对需在目录数据库中进行标记的情况进行标记。(4)拆除装订应以对纸质档案的保护为原则确定是否拆除装订。如需拆除装订物,应注意保护档案不受损害,并对排列顺序不准确的档案进行重排。特殊装订且拆除装订后需恢复的档案,在拆除装订物时应采用拍照等方式记录档案原貌,以便于恢复。(5)技术修复a.破损严重或其他无法直接进行扫描的纸质档案,应先由专业技术人员进行技术修复。b.折皱不平影响扫描质量的纸质档案应先进行压平等相应技术处理。并在案卷备考表中添加档案原件修复信息。3 .扫描(1)基本要求档案扫描应根据纸质档案原件实际情况、数字化目的、数字化规模、计算机网络和存储条件等选择相应的扫描设备和进行相关参数的设置和调整。参数的设置和调整应保证扫描后数字图像清晰、完整、不失真,图像效果最接近档案原貌。(2)扫描设备a.扫描设备的选择应特别注意对档案实体的保护,尽量采用对档案实体破坏性小的扫描设备进行数字化。b.超出所使用扫描仪扫描尺寸的档案可采用更大幅面扫描仪进行扫描,也可以采用小幅面扫描仪分幅扫描后进行图像拼接的方式处理。分幅扫描时,相邻图像之间应留有足够的重叠,并且采用标板等方式明确说明分幅方法;若后期采用软件自动拼接的方式,重叠尺寸建议不小于单幅图像对应原尺寸的三分之一。C.对于极其珍贵且尺寸不规则的档案,为方便直观显示原件大小,可采用标板、标尺等方式标识原件大小等信息。出应遵循相关设备的使用规律进行定期维护、保养。(3)扫描色彩模式a.页面中有红头、印章或插有照片、彩色插图、多色彩文字等的档案,应采用彩色模式进行扫描。b.页面为黑白两色,并且字迹清晰、不带插图的档案,可采用黑白二值模式进行扫描。C.页面为黑白两色,但字迹清晰度差或带有插图的档案,也可采用灰度模式扫描。在文书档案以件为单位,采用真彩色(24位)图像、分辨率为300dpi方式进行扫描。科技档案文字部分与文书档案相同,图纸以张为单位,采用黑白二值图像,一张图纸保存为一个TIFF文件,分辨率为300dpi方式扫描,超大页面采用分辨率为200dpi方式扫描。e.档案的每一张纸都要扫描,无论单面、双面有信息的都要扫描,并且要保证不能出现重复扫描。f.主要是保证扫描后的档案线条清晰、无断线、无断字、线条不过黑、字迹不成黑团、清晰可辩,同时也保证扫描后的文件大小控制在一个合理的范围内。扫描前,对档案进行适当的处理,以保证扫描的质量。破损严重、无法直接进行扫描的档案,应先进行技术修复,折皱不平影响扫描质量的原件应先进行相应处理(压平或熨平等)后再进行扫描。4 .图像处理(1)图像拼接对分幅扫描形成的多幅数字图像,应进行拼接处理,合并为一个完整的图像,以保证纸质档案数字图像的整体性。拼接时应确保拼接处平滑地融合,拼接后整幅图像无明显拼接痕迹。(2)旋转及纠偏对不符合阅读方向的数字图像应进行旋转还原。对出现偏斜的图像应进行纠偏处理,以达到视觉上基本不感觉偏斜为准。(3)裁边如需对数字图像进行裁边处理,应在距页边最外延至少2至3毫米处裁剪图像。(4)去污如需对数字图像进行去污处理,以去除在扫描过程中产生的污点、污线、黑边等影响图像质量的杂质,应遵循展现档案原貌的原则,处理过程中不得去除档案页面原有的纸张褪变斑点、水渍、污点、装订孔等痕迹。(5)图像质量检查a.数字图像不完整、无法清晰识别或图像失真度较大时,应重新扫描。b.对于漏扫、重扫、多扫等情况,应及时改正。C.数字图像的排列顺序与档案原件不一致时,应及时进行调整。d.对数字图像拼接、旋转及纠偏、裁边、去污等处理情况进行检查,发现不符合图像质量要求时,应重新进行图像处理。5 .数据项录入依据档案著录规范或者依据客户档案的实际著录项,录入标题、责任者、归档时间、档号等各种信息,同时确定本条数据的关键字,为电子文件批量挂接做准备。6 .文件合成文件合成是将经过扫描和图像处理合格后的电子文件经过文字识别和合成,转换成符合用户方数字化加工质量标准要求的成品电子文件的过程。(1) OCR识别对于经过扫描及图像处理工序后已经形成了JPG格式的电子文件的文书档案和科技档案中的文字材料类档案,在图像质量检查合格后,可以通过OCR识别软件进行批量文字识别处理。OCR识别后,将原JPG格式的文件,转换为单页的双层PDF格式文件。OCR识别过程中,要保证文字页能够正确转换为双层PDF格式,转换后的页面不能出现倾斜、模糊、倒页等问题。(2) PDF合成通过PDF合成工具,以件为单位,将该件档案所属的所有经过OCR识别的单页双层PDF页面合成一个多页双层PDF文件。合成后的PDF文件的名称为该件档案的档号,如该件档案的档号为1207-2008-010-01-1,则合成后的PDF文件名称为。PDF合成后的文件,要保证文件的页序正确、不能出现缺页、重页、页序混乱等问题。7 .质量检验成品质量检查主要是检查数字化加工成品的质量,包括PDF格式的成品电子文件质量和目录数据质量两部分。作为数字化加工成果最终质量的检查,成品检查是对目录录入、档案扫描、图像处理、图像质量检查、文件识别与合成等工序的复检。成品电子文件质量检查:主要是检查PDF文件的图像页面的排列顺序与档案原件的排列顺序是否一致;是否存在漏扫、重复扫描等现象;对图像偏斜度、清晰度、失真度等进行检查。如果在成品质检检查时发现文件漏扫时,应及时补扫并正确插入图像;发现重复扫描的图像,应及时删除;发现不符合图像质量要求时,应重新进行图像的处理。目录数据检查:主要是检测数据项的录入正确率。成品质量检验方式:逐个文件进行全部检查。检验方式:原则上目录数据的检验方式为全检,图像质量检验方式为抽检,一般一个全宗的抽检比例不低于5%。,检验的合格率应在95%以上。8 .数据备份数据验收合格后,加工方要将数字化加工产品以硬盘备份方式移交两套给招标方。备份数据也应进行检验,备份数据的检验的内容主要包括备份数据是否打开、数据信息是否完整、文件数量是否准确等,数据备份后应在相应的备份介质上做好标签,以便查找和管理。9 .目录与电子文件的挂接(1)应借助华能数字档案馆对数据库中的目录数据与其对应的纸质档案数字图像进行挂接,以实现目录数据与数字图像的关联。数字化加工过程中形成的图像数据,通过影像质检确认“合格”后,以纸质档案目录数据库为依据,将每一份纸质档案文件扫描所得的一个或多个图像存储为一份图像文件。通过每一份图像文件的文件名与档案目录数据库中该份文件的档号的一致性和唯一性,建立起一一对应的关联关系,以实现数据库与图像文件的批量挂接。保证目录数据库与图像文件的一一对应关系,不得错挂、漏挂,确保挂接准确率达到IO0%O(2)逐条对挂接结果进行检查,包括目录数据与纸质档案数字图像对应的准确性、已挂接数字图像与实际扫描数量的一致性、数字图像是否能正常打开等,发现错误及时进行纠正。10.档案还原(1)认真核对档案页码总数是否正确,核对文件排列顺序是否正确,发现错误的地方及时纠正,不能处理的上报管理人员。(2)经核对无误的档案,以文件左边沿和下边沿为准,依次整理整齐装盒。(3)对原来已打孔装订的档案,在装订时尽量利用原孔装订,不能按原孔而需重新打孔的档案,打孔时严格按照规定沿档案文件左边适当处打孔,确保三点一线,既不漏页也不损害文件字符。(4)系线时要按照标准方法操作,线不可太长或太短,系线松紧适度。(5)装订成册的档案必须保证每页都装订成功,不可有漏装掉页情况出现。11.档案入库(1)档案装订纸质档案数字化工作完成后,拆除过装订物的档案如需装订,应注意保持档案原貌,做到安全、准确、无遗漏。(2)档案归还入库按照档案入库相关要求对纸质档案进行处理和清点,并履行档案入库手续。每批成品通过检验后,确保质量合格后方可将档案移交入库,双方同时做好记录并签字确认。12.成果验收(1)验收方式档案整理验收方法:实体档案分类、目录和备考表全部进行检查,合格率达到100%予以验收“通过”O数字化验收应采用计算机自动检验与人工检验相结合的方式对纸质档案数字化成果进行验收检验,指定人员抽检,并于完成全部加工工作后5日内完成验收。(2)验收内容a.纸质档案数字化成果包括数字图像、档案目录数据、元数据、数字化工作中产生的工作文件、存储载体等。b.应对目录数据进行验收,主要包括数据库中各条目的内容、格式等的准确程度、必填项是否填写等。C.应对元数据进行验收,主要包括元数据元素的完整性和赋值规范性等。d.应对数字图像进行验收,主要包括数字化参数、存储路径、命名的准确性、图像的完整性、排列顺序的准确性、图像质量等。e.应对数据挂接进行验收,主要包括目录数据与其对应的数字图像的挂接的准确性等。f.应对档案数字化交接登记表等工作文件进行验收。乡应对存储载体进行验收,主要包括载体的可用性、有无病毒等。(3)验收指标能够采用计算机自动检验的项目应采用计算机自动检验的方式进行IO0%检验,检验合格率应为100虬对于无法用计算机自动检验的项目,可根据情况以件或卷为单位采用抽检的方式进行人工检验。抽检比率不得低于5%,对于数据库条目与数字图像内容对应的准确性,抽检合格率应为100%,其他内容的抽检合格率应不低于95%o(4)移交a.经验收合格的完整数据应及时进行备份。为保证数据安全,备份载体的选择应多样化,可采用在线、离线相结合的方式实现多套备份。备份数据应进行检验,检验内容主要包括备份数据能否打开、数据信息是否完整、文件数量是否准确等。数据备份后应在相应的备份介质上做好标签,以便查找和管理。b.验收合格的数据及其备份数据应按照纸质档案数字化工作方案及时移交,并履行交接手续。(二)、录音与录像档案数字化流程1.数字化前处理(1)确定信息采集范围原则上应将确定为数字化对象的录音、录像档案信息全部采集,不宜进行挑选采集,确有不需要采集的对象应加以标注。(2)档案检查对录音、录像档案载体进行外观检查,如出现下列情况,应对录音录像档案载体进行适度的清洗或修复等技术处理。a.档案载体物理形态出现卷曲、变形、划伤、脆裂、粘连、磁粉脱落等情况;b.档案载体出现可见性微斑、变色、生霉等情况;c.档案载体出现受潮、灰尘附着等情况;d.影响录音录像档案数字化的其他情况。e.检查声音、画面的质量,对存在的问题进行记录。f.记录录音录像档案载体编号、载体类型等信息。乡对需在目录数据库中进行标记的情况进行标记。2.信息采集(1)基本要求a.应根据档案原件实际情况、数字化目的、数字化规模、计算机网络和存储条件等选择相应的信息采集设备,进行相关参数的设置和调整。参数的设置和调整应保证采集后的数字音视频信息清晰、完整、不失真,声音和画面效果最接近档案原貌。b.应按有关规定对从库房调用的录音录像档案进行温湿度平衡调整后方可进行信息采集。(2)信息采集设备a.信息采集设备的选择应特别注意对档案实体的保护,尽量采用对档案实体破坏性小的信息采集设备进行数字化。b.在信息采集前,应对相应的采集设备进行清洁、检查和调整,并设定正确的参数。C.应遵循相关设备的使用规律进行定期维护、保养。(3)技术参数。录音档案数字化的技术参数应满足下列要求:a.采样率:不低于44.1kHz。对于珍贵或有特别用途的录音档案,采样率不低于96kHzob.量化位数:24bitoc.声道:以原始声道数记录。出文件格式:WAVE格式。录像档案数字化的技术参数应满足下列要求:a.视频编码格式:采用H.264或MPEG-2IBPo对于珍贵或有特别用途的录像档案,可采用无压缩的方式。b.帧率:与档案原件相同。口画面宽高比:与档案原件相同。d分辨率:采集为标清视频时分辨率为720X576(档案原件为PA1.制式、SECAM制式)或720X480(档案原件为NTSC制式);采集为高清视频时分辨率不低于1920X1080。e.色度采样率:采集为标清视频时色度采样率不低于4:2:0,采集为高清视频时色度采样率不低于4:2:2。f.视频量化位数:不低于8bito对于珍贵或有特别用途的录像档案,视频量化位数不低于10bitog视频比特率:采集为标清视频时视频比特率不低于8Mbit/s,采集为高清视频时视频比特率不低于16Mbitsoh.音频编码格式:PCMo1 .音频采样率:不低于48kHzoj音频量化位数:不低于16bit。对于珍贵或有特别用途的录像档案,音频量化位数采用24bitok.声道:以原始声道数记录。1.文件格式:AV1.或MXF格式。3 .文件切分与著录(1)对于同一物理载体中记录多个不同主题录音录像档案的,应根据每个主题的起止时间,在采集时按照主题进行切分,针对每个主题按照档案著录规则(DA/T18)的要求进行著录,并根据录音录像档案的特点进行深层次的著录,将结果录入数据库,形成准确、完整的目录数据。档号的编制方法应符合中国华能集团有限公司档号编制规则。(2)音视频文件的首尾空白无内容的部分如果时间过长,可进行适当剪切,在声音或画面开始前和结束后各保留5秒左右的空白。4 .文件命名(1)应以档号为基础对音视频文件命名,并确保唯一性。(2) 一条目录对应采集后的多个音视频文件时,可按档号与顺序号的组合对音视频文件命名。(3)应科学建立音视频文件的存储路径,确保数据挂接的准确性。5 .质量检查信息采集完成后,应通过播放、对比档案原件和采集到的音视频文件等方式进行质量检查。存在音视频不清晰、不同步等差错,不符合音视频质量要求时,属于采集问题的,应对该档案进行重新采集。6 .档案恢复数字化工作完成后,应对录音录像档案进行整理恢复,对于带式档案,应在数字化完成后进行倒带操作。7 .音视频处理音视频文件在提供利用前,针对原始音视频文件的拷贝文件,可采用压缩比更高的编码格式进行文件转换;可进行适当的降噪、振幅标准化等处理以抑制和去除噪音、爆音,可对影像画面进行去蒙尘、去划痕、校色、画面稳定处理等。8 .数据挂接参照纸质版档案数字化流程。9 .数字化成果验收与移交参照纸质版档案数字化流程。10档案归还入库参照纸质版档案数字化流程。(三)、照片档案数字化流程1 .数字化前处理(1)照片检查a.检查照片保存状况,对照片破损、变形、污渍、霉斑、褪色等情况进行登记。b.在扫描前对照片的破损、变形、污渍、霉斑、褪色等情况不做任何技术复原,但在确保不会损伤照片的前提下,应对照片进行简单的清洁处理,如去除灰尘、污渍或霉点等,以提高扫描图像的质量。(2)照片档案整理a.照片档案进行数字化前,应进行必要的整理。b.对照片档案整理过程进行登记,包括目录审核、修改情况及照片检查情况等。(3)目录数据准备a.按照照片档案目录数据库建立时制定的数据规则,对照档案原件内容,规范目录内容。b.对需在目录数据库中进行标记的情况进行标记。2 .扫描(1)根据照片幅面的大小选择相应规格的扫描仪进行扫描。扫描参数的设置和调整应保证扫描后数字图像清晰、完整、不失真,图像效果最接近档案原貌。如照片幅面过大,可采用小幅面扫描后进行图像拼接的方式处理。(2)照片有底片,且底片质量较好的,可采用底片扫描仪(胶片扫描仪)直接扫描底片转化为图像。(3)扫描分辨率一般应2300dpi,确保扫描形成的图像清晰、完整,能印制出与原件同等尺寸、图像还原效果较好的照片,满足照片复制、出版、展览等多种档案利用需要。对于其它太大或太小的照片,扫描分辨率可作相应的调整;对于一些涉及重要历史事件和人物的照片,其扫描分辨率可在以上基础上适当增加。3 .翻拍(1)采用数码相机翻拍照片时,应固定机身俯拍,不使用闪光灯。(2)数码相机翻拍像素的选择,应以翻拍形成的图像清晰、完整,印制出来的照片与原件接近为宜,一般不低于600万像素。单幅数字照片不小于3MB。(3)扫描、翻拍过程中,注意对照片、底片的保护,注意防水、防光,工作人员应戴洁净的棉质薄手套,轻拿照片、底片的边缘。4 .存储格式(1)照片档案数字图像长期保存格式原则上选择JPEG、TIFF格式,建议采用无损压缩。(2)同一批照片档案的数字图像应采用相同的存储格式。5 .图像命名(1)应以档号为基础对数字图像命名。图像命名方式的选择应确保图像命名的唯一性。(2)应科学建立照片档案数字图像的存储路径,确保数据挂接的准确性。6 .图像处理(1)图像处理包括纠偏、裁边、去污、修复、图像拼接等。(2)因照片保存、冲晒等原因,造成照片褪色、变色、偏色等情况,原则上不做技术处理。泛黄的黑白照片可通过去色还原黑白,彩色照片则通过调整红、蓝、绿基色等方式取得合适的色彩效果。(3)图像质量检查a.数字图像不完整、无法清晰识别或图像失真度较大时,应重新扫描。b.对于漏扫、重扫、多扫等情况,应及时改正。c.数字图像的命名与照片档案原件档号不一致时,应及时进行调整。出对数字图像拼接、旋转及纠偏、裁边、去污等处理情况进行检查,发现不符合图像质量要求时,应重新进行图像处理。7 .数据挂接参照纸质版档案数字化流程。8 .数字化成果验收与移交参照纸质版档案数字化流程。9 .档案归还入库参照纸质版档案数字化流程。(四)、实物档案数字化流程1 .数字化方式的选择(1)实物档案根据载体的不同,可分别采用扫描或拍摄的方法进行数字化。扫描方式适合于纸质载体的实物档案,如奖状、证书等;数码相机彩色拍摄方式,适合于非纸质载体的实物档案,如奖牌、奖杯、锦旗等。(2)采取扫描方式进行数字化的实物档案数字化流程同第四章“纸质档案数字化流程”。2 .数字化前处理(1)对实物档案内容和载体质量进行检查,有残缺的应进行修补,并做好记录。(2)对实物载体进行全面彻底卫生清理。(3)设置拍照房间,具备侧主光、底光、顶光、背光等柔性照明和背景条件。(4)目录数据准备。a.按照实物档案目录数据库建立时制定的数据规则,对照档案原件内容,规范档案中的目录内容。b.对拟数字化的实物档案进行目录数据著录,并确保数据准确。3 .目录数据库建立参照纸质版档案数字化流程4 .实物拍照(1)基本要求a.应采用数码照相机彩色拍照。b.拍照时要注意被拍摄物的图像要充满取景框。C,拍摄实物档案时,要进行多角度拍摄,真实全面反映实物档案特征。d.实物档案拍摄时的图像质量一般不低于600万像素。e.被拍摄物图像表面不能有反光面或反光点。f.拍摄的图像必须曝光正确、清晰。(2)存储格式a.实物档案数字图像长期保存格式原则上选择JPEG、TIFF格式。一般选择JPEG格式,特殊需要制作大幅面照片的选择T1.FF格式。b.同一批实物档案的数字图像应采用相同的存储格式。(3)图像命名a.应以实物档案的档号为基础对数字图像命名。图像命名方式的选择应确保图像命名的唯一性。b.应科学建立实物档案数字图像的存储路径,确保数据挂接的准确性。5 .图像处理(1)图像处理包括纠偏、裁边、去污等。(2)图像质量检查。a.数字图像不完整、无法清晰识别或图像失真度较大时,应重新拍摄。b.对于漏拍、重拍等情况,应及时改正。c.数字图像的命名与实物档案原件档号不一致时,应及时进行调整。C1.对数字图像纠偏、裁边、去污等处理情况进行检查,发现不符合图像质量要求时,应重新进行图像处理。6 .数据挂接参照纸质版档案数字化流程。7 .数字化成果验收与移交参照纸质版档案数字化流程。8 .档案归还入库参照纸质版档案数字化流程。