隨著知識爆炸的到來,傳統載體檔案數字化數量增多,中共中央組織部發布《關于加強和改進新形勢下檔案工作的意見》,要求重點推進傳統載體檔案數字化,切實推進檔案保管網絡化、網絡化。
新《檔案法》修訂版還增加了檔案數字化的規定。隨著鄉鎮檔案局新館建設的完成,數字檔案館(室)的建設將是下一階段的重點,因此檔案數字化處理的重要工作將逐步展開。國家檔案館2017年8月發布的《紙質檔案數字化規范》規定了紙質檔案數字化設備的要求和管理規定,山東省也對《文書檔案目錄數據采集規范》進行了修訂。這些部門規章對市級檔案館檔案數字化具有重要意義(室)。
但是在工作進展的過程中,會因各檔案館(室)卻處于不同的情況,遇到了奇怪等細節。因此,需要根據不同情況,解決現場遇到的問題,從而檔案數字化規范處理結果的管理,便于其利用。
加工程序的選擇
檔案數字化加工主要有兩種形式。一是檔案室(室)及時組織自己的處理,二是外包給有資質的公司,各有利弊。自行處理有利于檔案的保密和保存保護。
但從預掃描、掃描、圖像處理、質檢、圖像合成、目錄描述,到數據驗收、數據勾連,每道工序一人需要8-10人,而檔案館(室)普通人分散,完全滿足工序間人員的要求。但從社會角度來看,招聘在專業性方面是可以保證的,涉及到很多人事管理問題。此外,還需要自己購買文件掃描、圖像處理等各種設施和軟件,需要投入大量資金。外包服務模式,因為公司項目專業化管理,人員設備不用擔心檔案機構。只要檔案數字化方案制定合理,檔案機構管理得當,檔案數字化的效率和質量還是可以保證的。因此,對于大規模檔案數字化加工,筆者還是以外包企業為主。
數字處理的監督和指導
(一)生產計劃的確認
紙質檔案數字化方案要求各種數字化對象、創作目標、工作內容、數字化產品方法和主要技術性能、驗收依據、人員配置、任務分工、總體方案、安全生產措施等。技術規范:根據《紙質檔案數字化規范》的基本條件,我們采用了像素分辨率為300DPI的負片掃描儀和原始掃描方式,制作了文字識別合成一個雙層PDF。這些索引完全適合檔案的存取和利用,也有利于后期的檢索系統。此外,他們基本上保證了檔案的模擬復制和展示。
生產要求。值得一提的是,檔案目錄數據庫系統的建立必須與省檔案館開始實施的《文書檔案目錄數據采集規范》中規定的字段和字段值保持一致,有利于下一步目錄數據的在線訪問和全省檔案目錄數據的統一。
(二)加工場所的監督和指導
國家檔案館(室)應指定一名負責人負責處理地各部門的溝通、指導和監督,建立問題反映機制,對處理模式中遇到的問題及時給予反饋和糾正,積極總結、指導類似問題,減少重復勞動,確保數字檔案全過程的安全、進度和質量。
1.預掃描采集注意事項
排版問題。國家檔案館館藏有大量解放后的舊檔案。這些檔案環境復雜,紙質差,掃描處理費時。有些文件是垂直排版的,從左到右,從上到下。不同的排版方法出現在同一個文件中。如果前整理者不注意,很容易造成掃描順序前后混亂。這就要求在掃描前和掃描過程中要強調這個問題,以免掃描順序混亂。
2.分段問題。主要是指涉及到很多名字的民生檔案,比如干部職工的分配函。這類檔案每年會有2-3卷,每卷100-200頁,每一頁都涉及一個人的分配和移交。這類文件建議一人一份或10人一份,記錄文件標題時要顯示每個人的姓名。基本上檔案管理軟件的檢索功能并不完善,即使有檢索功能,對筆跡的識別準確率也很低。因此,仍然需要在目錄的標題中清楚地顯示出來,或者設置一個專門的名稱目錄,這樣可以方便檢索,提高檢索效率。此外,教育局的本科生整理工作分配表、知青信息采集表等多種姓名的檔案,如何記錄便于檢索,是否設置專門的姓名目錄或以標題或備注等方式展示。,也值得討論。
3.專業檔案單獨處理問題。市級檔案館(室)一般保存較多文書檔案,但也有不少與民生相關的專業檔案館,如學籍檔案、婚姻檔案館、土地延伸檔案館等。這些專業檔案的分類和目錄信息與文書檔案不同。比如學籍檔案一般按照高校檔案的分類標準進行分類,這與文書檔案的機構(問題)在檔案號編制上的分類不同。如果文件號編譯規則為文書檔案"全宗號。-目錄號。-案件號。-PartNo。”都使用了,混淆在一起會很容易導致文件編號編譯。對于目錄信息,婚姻檔案目錄應設置姓名、婚前日期、籍貫等字段。土地擴展包的檔案是按照鄉鎮、行政村和戶主的名字排列的,這些信息需要在目錄字段中設置。因此,專業文件需要在文件系統中設置不同的節點,并根據需要設置目錄字段,以便更有效地顯示所需信息。
(三)掃描圖像處理問題
一般需要旋轉、糾偏、去污、切割掃描過程。但是,對于一些特殊尺寸的文件,我不建議剪切。例如,工作分配和就業協議或戶籍證明的存根大小為64。掃描時建議按照A4掃描,切白邊時不建議切掉,因為切白邊后的圖像會放大,印章也會隨之放大,作為證書打印時會略有失真,不利于與原印章對比,有些人會擔心作為證書。
(四)字體識別問題
難認的字大多是手寫的,或者寫得太差認不出來,或者是簡體字或者是非標準異體字。一般要根據語義的意思進行驗證。比如當時字典里沒有“威”字,搜狗輸入法里也沒有“威”字,但它是一個電子文檔。按照語義,應該是代表電的力量的單位。考慮到“kW”的換算關系,結合上下文,確定為“kW”。還有,“羅”“漢”“謝”是不規范的正字法文字,需要經歷過文字改革過程的人進行識別和確認,才能使文書的標題完整準確。*難確定的是學籍檔案中的姓名、干部職工的證明信等與姓名相關的檔案,一般只出現一次,通篇沒有語義參照。為了識別一個字,有些人需要查閱一些家譜,從幾代姓氏中確定名字中的字,有時還需要請檔案形成單位的老工人,使作為主要檢索線索的檔案標題盡可能完整準確,提高目錄描述質量。
數據接收量存在的問題
項目驗收涉及真實可靠、及時性、可及性和可靠性、掃描數據與目錄一一對應、目錄描述是否規范、是否有利于檢索利用等。在數據驗收這個環節,既要保證數量與檔案信息的對應,又要保證數據的完整性和質量符合規定。
范,終于方便使用了。我們的做法是在數據的實地驗收上采取監督機制,先由監理公司對數據進行100%的檢查驗收,再由市檔案館對監理公司提交的數據進行抽查,抽查比例為10%。如果發現超過3%的錯誤,監理公司會重新接受并修改數據。
經過兩次驗收,在使用過程中會發現一些小問題。較大的有自制標題、拼錯的字符和單詞識別問題。從這些問題來看,我們認為在驗收中,除了抽查之外,還要重點抽查可能出錯的數據。反饋問題的結果,從而避免錯誤的發生。數字檔案館(室)建設是不斷擰動檔案數字化水平,實現檔案電子書集中統一管理,推進檔案信息共享工作,充分挖掘檔案價值,讓檔案服務政府、服務公眾、服務群眾的必要手段。是基礎支撐工作,是搶抓檔案信息化建設蓬勃發展、發揚光大的難得機遇工匠精神
智能密集架:
智能密集架由底盤和導向方鋼組成的地軌組成,根據安裝空間的使用情況可分為面式、嵌入式和加強橋式。
底盤采用大梁等薄鋼板、橫檔、柱座等。并且是具有良好剛性的不可拆卸結構。
框架由立柱、隔板、面板、掛板、頂板等組成。為插入式軟鉚釘鉚接結構,可拆卸。
聯動裝置由手柄鏈、電機、減速器、電磁離合器、后輪軸、鐵輪等組成。
檔案密集柜手動:手柄-z2鏈輪-z48、Z13雙鏈輪-前軸鏈輪驅動軸旋轉-兩個滾軸鏈輪-滾軸旋轉-滾軸驅動四個滾軸同步旋轉-集中柜移動。在手動操作中,電磁離合器電源關閉并斷開,換檔鏈輪空轉。
電動,電腦控正時:電機-減速器-齒輪-半軸中間鏈輪-驅動軸轉動-兩個輥軸鏈輪-輥軸轉動-輥軸帶動四個輥同步轉動-密集柜移動,此時手柄(除手柄外)與驅動軸之間的所有密封使工作保障人員。
電動檔案密集柜結構由控制部分和機械部分組成。
控制和機械的主要部分分為:
1、驅動:臺式電腦、液晶顯示器、軟件、連接線、控制主板、控制板、電機板、按鍵板、通訊板、紅外板。
2、機械機構:地軌、底盤、車架、變速箱。