數(shù)字文化建設(shè)的有關(guān)問題分析
發(fā)布時間:2021 年 11 月 01 日 |
文章作者: 文博圈公眾號2018年7月17日 |
瀏覽次數(shù):1409
文化數(shù)據(jù)資源因其種類龐雜、數(shù)量眾多、涉及面廣而長期無法形成統(tǒng)一的數(shù)宇化模式。但在文化遺產(chǎn)保護、公共數(shù)宇文化服務(wù) 等不同領(lǐng)域均有各具特色的數(shù)字化建設(shè)成果。2001年,財政部和國家文物局聯(lián)合啟動了 “文物調(diào)查及數(shù)據(jù)庫管理系統(tǒng)建設(shè)”項目,首 次開啟以數(shù)字化手段調(diào)查完善我國文物業(yè)的國情資料,2011年,財政部和文化部又提出公共數(shù)字文化建設(shè)概念,并重點實施了文化共 享工程、數(shù)字圖書館推廣工程和公共電子閱覽室建設(shè)計劃三大公共數(shù)字文化惠民工程。文化資源數(shù)字化是一項長期、基礎(chǔ)性工作,需 要從其基本規(guī)律入手,采取科學(xué)、靈活、有效的方法,逐步實現(xiàn)聚沙成塔、集胲成裘。
一、先從概念說起
談到文化資源數(shù)字化,離不開數(shù)字文化,更要先從文化說起。文化的概念有多種說法,僅《辭?!分袑ξ幕亩x就有三種:
一是從廣義來說,指人類社會歷史實踐過程中所創(chuàng)造的物質(zhì)財富和精神財富的總和。從狹義來說,指社會的意識形態(tài),以及與之相適應(yīng)的制度和組織機構(gòu);
二是泛指一般知識,包括語文知識在內(nèi)。例如“學(xué)文化”就指的是學(xué)習(xí)文字和求取一般知識。又如對個人而言的“文化水平”,也是指一個人的語文和知識程度;
三是指中國古代封建王朝所施的文治和教化的總稱。如南齊王融《曲水詩序》:“設(shè)神理以景俗,敷文化以柔遠。”[1]文化是民族生存和發(fā)展的重要力量,是強大的精神支撐。
當(dāng)今世界,文化更是融人政治、經(jīng)濟等各領(lǐng)域,作為軟實力的體現(xiàn),其地位和作用更是無可替代。
數(shù)字化則是近年出現(xiàn)的新概念,百度定義說:數(shù)字化就是將許多復(fù)雜多變的信息轉(zhuǎn)變?yōu)榭梢远攘康臄?shù)字、數(shù)據(jù),再以這些數(shù)字、數(shù)據(jù)建立起適當(dāng)?shù)臄?shù)字化模型,把它們轉(zhuǎn)變?yōu)橐幌盗卸M制代碼,引入計算機 內(nèi)部,進行統(tǒng)一處理,這就是數(shù)字化的基本過程①。
簡單理解,數(shù)字化工作是對現(xiàn)實世界信息的一個描述。采用數(shù)字化手段可以產(chǎn)生一個現(xiàn)實世界的鏡像, 當(dāng)然也可以產(chǎn)生一個不同于現(xiàn)實世界的新環(huán)境。作為一種技術(shù)手段,數(shù)字化不能完全無縫的復(fù)制、記錄下現(xiàn)實世界的所有信息,但卻為建立起一個對應(yīng)于現(xiàn)實世界的物質(zhì)模型和表述其蘊含信息提供了技術(shù)上的可能。
作為文化與數(shù)字的結(jié)合體,數(shù)字文化是信息社會特有的文化概念,是文化與科技融合的新形態(tài),是文 化表現(xiàn)形式的新階段,是促進文化繁榮發(fā)展的新手段。數(shù)字文化的興起不僅僅促進了文化產(chǎn)生、傳導(dǎo)、 表現(xiàn)形式的多元化和高效率,更將促進文化內(nèi)容的極大豐富和文化產(chǎn)品的不斷創(chuàng)新,在有效緩解人民日益增長的文化生活需要和不平衡不充分的發(fā)展之間的矛盾中必將發(fā)揮重要作用。[2]
二、數(shù)字文化特征
相較于傳統(tǒng)文化而言,融入現(xiàn)代信息技術(shù)手段的數(shù)字文化具有較多新特點,比如開放性、共享性、虛擬性、創(chuàng)新性、平等性,還有更多的趨同化、草根性等等特點,如此不勝枚舉。但從其本質(zhì)而言,建議我們不妨從兩個方面予以關(guān)注:
一是文化的數(shù)字形態(tài);
二是數(shù)字的文化表征。[3]
“文化的數(shù)字形態(tài)”是指利用現(xiàn)代信息技術(shù)對文 化和文化信息的數(shù)字化呈現(xiàn),通俗理解為“文化的數(shù)字”。1946年世界上第一臺電子數(shù)字計算機——ENINC的誕生,標(biāo)志著人類從此拉開了信息化時代的序幕,數(shù)字化開始成為人類新的技術(shù)手段。后來,隨著存儲器的出現(xiàn),人類發(fā)現(xiàn)計算機不僅僅用于科學(xué)計算,還可以用于管理。當(dāng)我們把文化的信息存儲于計算機系統(tǒng)并進行管理時,“文化的數(shù)字”就出現(xiàn)了。
文化的數(shù)字形態(tài)包含多重含義,它不僅僅是文化信息的數(shù)字化呈現(xiàn),更是文化實體表現(xiàn)的新形態(tài),也是對文化內(nèi)涵抽象表達的新模式。文化資源數(shù)字化工作是獲取文化數(shù)字形態(tài)的重要途徑。
“數(shù)字的文化表征”是指數(shù)字化的文化環(huán)境和數(shù)字文化所蘊涵與表達的文化信息,通俗理解為“數(shù)字的文化”。數(shù)字的文化表征既包括了數(shù)字文化的信息,也包括數(shù)字化環(huán)境自身的文化特征。計算機出現(xiàn)的同時也標(biāo)志著數(shù)字的文化環(huán)境應(yīng)運而生。
眾所周知,截至目前已經(jīng)出現(xiàn)了以個人計算機普及應(yīng)用為標(biāo)志的第一次信息化浪潮,以互聯(lián)網(wǎng)大規(guī)模應(yīng)用為標(biāo)志的第二次信息化浪潮,以物聯(lián)網(wǎng)、云計算、大數(shù)據(jù)、人工智能等廣泛應(yīng)用為標(biāo)志的第三次信息化浪潮也正在風(fēng)起云涌。這些變化無一不體現(xiàn)出數(shù)字文化環(huán)境的變遷與發(fā)展,也促進了數(shù)字文化信息表達手段的極大豐富與提高。
三、文化數(shù)據(jù)特點
數(shù)字化是產(chǎn)生現(xiàn)代信息資源的新手段,通過數(shù)字化方式獲取的信息資源也叫數(shù)據(jù)資源。文化數(shù)據(jù)資源同其他數(shù)據(jù)資源一樣,具有可復(fù)制、可再生、可關(guān)聯(lián)、可共享等基本特征。
圖:中國絲綢博物館藏品數(shù)字化互動裝置 @文博圈
隨著現(xiàn)代信息網(wǎng)絡(luò)技術(shù),尤其是云計算、大數(shù)據(jù)、物聯(lián)網(wǎng)、移動互聯(lián)等新理念、 新技術(shù)的普及與應(yīng)用,數(shù)據(jù)資源越來越海量化、越來越復(fù)雜化。文化數(shù)據(jù)資源與其他類型的數(shù)據(jù)資源一樣,也變得更加海量與復(fù)雜。
由于文化的范疇更廣闊、內(nèi)容更豐富,不可否認,相較于其他領(lǐng)域而言, 文化數(shù)據(jù)資源的海量性和復(fù)雜度有過之而無不及。
除此之外,文化數(shù)據(jù)還有兩個有別于其他數(shù)據(jù)資源的獨有特性,即價值“永續(xù)”和范圍“無界”。
文化具有傳承性和發(fā)展性。博古而通今,溫故而知新。沒有傳承,就沒有發(fā)展。既有傳承,必需保留;若要創(chuàng)新,必先知舊。因此,與其他門類的數(shù)據(jù) 資源相比而言,文化數(shù)據(jù)資源的價值是永遠存在的。
當(dāng)我們記錄下一件文物的質(zhì)地、度量等本體屬性時, 就相當(dāng)于留下了一份真實的檔案。文物存在時,為了保護,有必要利用這一數(shù)據(jù)提供應(yīng)用服務(wù);萬一文物不在時,也只有這一數(shù)據(jù)可資利用了。
從對文化的基礎(chǔ)定義和理解上可以看出,文化內(nèi)涵博大精深,輻及萬事萬物,普蓋古今中外,既涉及璀璨輝煌的古代文明,也包容豐富多彩的現(xiàn)實世界, 更通達遙遠無盡的未來創(chuàng)造。凡有人類活動的痕跡, 必能留下文化的烙印。因此,據(jù)文化數(shù)字化而形成的文化數(shù)據(jù)也必然擁有無界的范圍。更何況現(xiàn)代數(shù)字化技術(shù)更在其自身數(shù)字空間的基礎(chǔ)上不斷創(chuàng)新生產(chǎn)著新的文化。
四、文化數(shù)據(jù)分類
既然明確了文化數(shù)據(jù)范圍的無界特征,要對其分類確非易事。但這項工作又是必須要做的。在文化領(lǐng)域,國家管理部門根據(jù)業(yè)務(wù)管理工作需要,已有不同類別的劃分。
比如,黨的十九大報告中指出“中國特色社會主義文化,源自于中華民族五千多年文明歷史 所孕育的中華優(yōu)秀傳統(tǒng)文化,熔鑄于黨領(lǐng)導(dǎo)人民在革命、建設(shè)、改革中創(chuàng)造的革命文化和社會主義先進文化,植根于中國特色社會主義偉大實踐?!保?]
根據(jù)原文化部和國家文物局的管理工作需要劃分,現(xiàn)代的有書法、美術(shù)、戲曲、音樂、舞蹈等等,傳統(tǒng)的文化遺產(chǎn)又分為文物和非物質(zhì)文化遺產(chǎn),文物又可細分為可移動文物和不可移動文物等等?,F(xiàn)在我們不妨換個角度,嘗試從信息技術(shù)和應(yīng)用服務(wù)的角度對文化 數(shù)據(jù)作一切分。據(jù)此,可將描述文化內(nèi)涵與外延的數(shù)據(jù)資源劃分為三類,分別是基礎(chǔ)數(shù)據(jù)、業(yè)務(wù)數(shù)據(jù)和管理數(shù)據(jù)。
文化基礎(chǔ)數(shù)據(jù)即是按照特定標(biāo)準(zhǔn)對文化資源的數(shù)字化描述,是文化資源提供服務(wù)的核心。常見的對文物本體的描述、采集非遺的影音資料、書法美術(shù)作品的影像等等都屬于這一范疇。
文化業(yè)務(wù)數(shù)據(jù)是文化生產(chǎn)部門在業(yè)務(wù)工作中產(chǎn)生的統(tǒng)計、分析等業(yè)務(wù)型數(shù)據(jù),目的是為了滿足文化業(yè)務(wù)運行的需要。常見的調(diào)研報告、文化評論都屬于此 類數(shù)據(jù)資源。
文化管理數(shù)據(jù)是實現(xiàn)文化管理的機構(gòu)、人員、財務(wù)等管理型數(shù)據(jù),目的是為了保證文化行業(yè)管理的需要。常見的年鑒統(tǒng)計資料、財務(wù)統(tǒng)計報表等均屬此類數(shù)據(jù)。
文化基礎(chǔ)數(shù)據(jù)、業(yè)務(wù)數(shù)據(jù)、管理數(shù)據(jù)三者之間既有關(guān)聯(lián)聚合,也有重疊交叉,并非嚴(yán)格割裂的。很多專項數(shù)據(jù)資源往往包括其中兩者,甚至三者都有。
比如我們常說的政務(wù)信息資源既包括基礎(chǔ)數(shù)據(jù),也有業(yè)務(wù)數(shù)據(jù),更有管理數(shù)據(jù)。之所以作此種劃分,無非是希望能夠從技術(shù)角度作一切分,以便于文化數(shù)據(jù)資源的統(tǒng)籌規(guī)劃、標(biāo)準(zhǔn)制定、存儲管理和應(yīng)用服務(wù)而已。
五、數(shù)據(jù)采集
數(shù)據(jù)釆集工作也是永遠在路上的。文化數(shù)據(jù)采集工作是文化建設(shè)領(lǐng)域的一項基礎(chǔ)工作,也是一項長期的艱巨任務(wù)。文化數(shù)據(jù)采集與資金、技術(shù)、人才、體 制機制等多項因素有關(guān),既不能一蹴而就,也不能一勞永逸,往往需要設(shè)置專門的機構(gòu),設(shè)立專項的資金用于此項工作的長期開展,通過多種途徑實現(xiàn)文化遺產(chǎn)數(shù)字資源的釆集和完善。文化數(shù)據(jù)采集工作應(yīng)遵循 “方法多樣、規(guī)模適度、內(nèi)容真實、方式夠用、服務(wù) 應(yīng)用”的基本原則。
(一)采集途徑——多樣
“等閑識得東風(fēng)面,萬紫千紅總是春”。數(shù)據(jù)采集的方式方法多種多樣,豐富多彩,切勿執(zhí)著單一而局促受限,只要能夠?qū)崿F(xiàn)目標(biāo),在合理合規(guī)的情況下,不妨能用盡用。以下列出幾種常用的數(shù)據(jù)釆集途徑,以供參考。
1.依托重點工作,采集基礎(chǔ)數(shù)據(jù)。數(shù)據(jù)采集工作耗資大、歷時長,需要調(diào)配的資源眾多,專項的普查、調(diào)查工作是獲取文化基礎(chǔ)數(shù)據(jù)的最佳機會。國家文物局已經(jīng)開展的“文物調(diào)查及數(shù)據(jù)庫管理系統(tǒng)建設(shè)”項目、第三次全國文物調(diào)查、長城資源調(diào)查、國有可移動文物普查等,文化部開展的數(shù)字圖書館推廣工程、文化信息資源共享工程、非物質(zhì)文化遺產(chǎn)調(diào) 查、全國美術(shù)館藏品普查等專項工作都在一定程度上 采集了大量的文化基礎(chǔ)數(shù)據(jù)資源。由于專項工作在覆蓋面、投入量、管理力度等方面均有較大優(yōu)勢,所釆集的基礎(chǔ)數(shù)據(jù)也相對全面,權(quán)威,真實。
2.結(jié)合行政管理,積累管理數(shù)據(jù)。通過推進電子政務(wù)和政務(wù)信息系統(tǒng)整合共享,建設(shè)并運行統(tǒng)一的行政審批管理平臺,持續(xù)積累各類政務(wù)信息資源數(shù)據(jù), 加強業(yè)務(wù)檔案和資料數(shù)據(jù)管理,是獲取管理數(shù)據(jù)的有效途徑。相比于重點專項工作來說,通過行政管理采 集的數(shù)據(jù)較為散亂、無序,但其優(yōu)勢是權(quán)威、可持續(xù),只要持之以恒的累積、整理,往往能夠形成專題系列,達到意想不到的效果。
3.圍繞課題項目,豐富業(yè)務(wù)數(shù)據(jù)。課題研究也是行業(yè)常態(tài)性的工作之一。圍繞文化領(lǐng)域的專項課題研究是獲取文化業(yè)務(wù)數(shù)據(jù)的重要來源之一。這種數(shù)據(jù)采集的內(nèi)容不僅僅包括課題本身的研究成果,更要關(guān)注與其相關(guān)的調(diào)研、分析等背景性數(shù)據(jù)資料。一項優(yōu)秀的課題研究成果往往能帶動一個體系的數(shù)據(jù)采集標(biāo)準(zhǔn)、方法、管理與應(yīng)用服務(wù)的發(fā)展建設(shè)。
圖:敦煌研究院官網(wǎng)|孫志軍
4.整理資料檔案,實現(xiàn)文本數(shù)字化。系統(tǒng)整理已有的各類業(yè)務(wù)檔案、學(xué)術(shù)專著、專題出版物、錄音影像等資料,持續(xù)開展數(shù)字化采集工作,是建立專題資料數(shù)據(jù)庫的重要手段之一。尤其很多早期開展的專項工作,因為沒有數(shù)字化的資料留存,只能通過文字錄 入、圖片掃描等數(shù)字化手段加以整理。這種資料檔案整理工作往往帶有較強的針對性和搶救保護性質(zhì),是耗時、費力、枯燥的事情。但其意義重大,應(yīng)用普遍,往往是不得不用的辦法。
5.搭建共享平臺,探索交換模式。通過多種有效機制和技術(shù)手段,搭建文化資源共享交換平臺,通過資源整合、數(shù)據(jù)共享方式,擴展數(shù)據(jù)資源的來源渠道,促進基層文化單位在數(shù)據(jù)共享與交流的過程中不斷完善數(shù)據(jù)資源建設(shè)的形式,充實基礎(chǔ)數(shù)據(jù)內(nèi)容,更在此基礎(chǔ)上形成國家層面的數(shù)據(jù)體系。數(shù)據(jù)交流才能共生,資源共享方顯價值。探索數(shù)據(jù)共享交換模式是促進數(shù)據(jù)釆集工作實現(xiàn)良性循環(huán)的有效途徑。
6.加強國際交流,擴充數(shù)據(jù)來源。廣義的說,文化是人類共有的財富。通過加強國際文化的信息交流與合作,在保證安全穩(wěn)妥的前提下,探索文化數(shù)據(jù)資源的相互交流合作模式,也是豐富文化資源類型和數(shù)據(jù)覆蓋范圍的有效途徑之一。文化因包容共生而繁榮,文明因交流互鑒而發(fā)展。良好的國際交流氛圍, 暢通的資源共享渠道,必將為實現(xiàn)世界文化數(shù)據(jù)資源的繁榮發(fā)展創(chuàng)造有利條件。
7.創(chuàng)新釆集模式,探索資源采集的社會化途徑。曾有廣告說,大數(shù)據(jù)時代,隨著指尖每敲動一下鍵盤就將產(chǎn)生出新的數(shù)據(jù)信息。這話有些夸張,但很形象。隨著移動互聯(lián)網(wǎng)的應(yīng)用普及,也同時開啟了自媒體時代。類似于微信、微博等平臺上也擁有眾多有深度、有價值的文化數(shù)據(jù)資源。通過主題活動征集、社交平臺收集、網(wǎng)絡(luò)爬蟲搜索等方式方法,都可以獲取 到數(shù)量眾多且又擁有不可估量價值的文化數(shù)據(jù)資源。
(二) 采集規(guī)?!m度
“量力而行,先謀而后動”。注重規(guī)模適度是數(shù)字化釆集工作的必修課,切忌眼大肚子小,貪多嚼不爛。
在國家層面的數(shù)據(jù)釆集過程中,應(yīng)注重宏觀數(shù)據(jù)的獲取,重點放在數(shù)據(jù)廣度的擴展上,適當(dāng)選取有代表性、有重要價值的文化遺產(chǎn)實施深度采集?;鶎游幕瘑挝粍t應(yīng)根據(jù)自身的人力、財力和實際應(yīng)用情況等,可以在保證重點項目的前提下,適當(dāng)把重心放在微觀數(shù)據(jù)的采集上,以保證本單位的日常運行管理和研究應(yīng)用為目的。
(三) 采集內(nèi)容——真實
保證原始數(shù)據(jù)的原真性是數(shù)字化采集工作的基本原則之一。數(shù)據(jù)真實性的意義無庸多言,虛假數(shù)據(jù)的危害性非常大。很難想象一條不真實的數(shù)據(jù)能夠在管 理與應(yīng)用中發(fā)揮出積極、正面的作用。但如何保證數(shù)據(jù)的真實性卻非常復(fù)雜,排除出現(xiàn)虛假數(shù)據(jù)的主觀因素外,也不僅僅是工作理念的正確認識問題,還包括有技術(shù)性和方法性問題。
首先,要保證采集對象的真實性。例如在采集文化遺產(chǎn)的原始數(shù)據(jù)時,不可片面的依照已有檔案的資料數(shù)據(jù)記載。已有檔案可以作為一個歷史記錄,但隨著時間推移,文化遺產(chǎn)本身也可能會發(fā)生一些變化, 比如文物會存在殘損、缺失等情況。
此外,也不能完 全保證已有檔案記載的絕對真實性。因此,即使受時 間、人力等條件所限,不得不利用已有檔案資料的數(shù) 字化成果,也要在后期進行必要的復(fù)核。但對文物影 像的拍攝一定要選取原物,切忌翻拍雜志、圖錄等出版物,否則就失去了此項數(shù)字化工作的物證意義。
其次,要保證采集方法的科學(xué)性?!肮び破涫?,必先利其器。”先進、成熟、可靠的數(shù)據(jù)采集工 具對數(shù)字化采集工作具有重要意義。在經(jīng)濟許可范圍內(nèi)要盡量選取高質(zhì)量的設(shè)備,提高數(shù)據(jù)精度、減少出錯率。當(dāng)然一些小的技巧也能產(chǎn)生很好的效果,比如 照片拍攝過程中,在不易確定高度的器物邊放一把尺子,在不好分辨色彩的書畫、雕塑等作品后放一幅參考性的背景色譜等,這些都是不錯的選擇。
第三,要重視質(zhì)量管理的嚴(yán)謹(jǐn)性。獲取高質(zhì)量數(shù)據(jù)的最關(guān)鍵之處不在技術(shù)而在于管理。大規(guī)模的數(shù)據(jù)采集過程中,難免會因大量的重復(fù)性勞動造成人員疲勞、工作松懈等情況。即使在日常的業(yè)務(wù)工作中也可能會因為疏忽而造成數(shù)據(jù)信息出錯。如何保證數(shù)據(jù)質(zhì)量,需要規(guī)劃合理的工作流程、制定科學(xué)的工作管理機制,減少采集工作的復(fù)雜度,加大數(shù)據(jù)審核的頻度和工作力度,把數(shù)據(jù)質(zhì)量管理的關(guān)口前移。
(四)采集方式——夠用
數(shù)字化采集工作往往受當(dāng)時的工藝水平、經(jīng)濟實力、人才能力等條件所限,是不可能達到盡善盡美的。因此,建議擯棄一些投資大、收益少,費工時、 意義小的采集方式。怎樣才能保證采集數(shù)據(jù)資源達到夠用標(biāo)準(zhǔn),首先一條是必須要有業(yè)務(wù)人員的參與。一定要堅持業(yè)務(wù)主導(dǎo)原則:數(shù)據(jù)采集工作不僅僅屬于信息化的工作范疇,更是業(yè)務(wù)工作的重點。排除必須的技術(shù)要素外,數(shù)據(jù)采集的標(biāo)準(zhǔn)實質(zhì)上就是業(yè)務(wù)需求的 標(biāo)準(zhǔn)。
圖 16素材網(wǎng)
(五)采集目的一應(yīng)用
數(shù)據(jù)采集的目的毫無疑問是為了應(yīng)用。但在實際工作中,我們經(jīng)常忽視這一點,往往變成了為了釆集而釆集。如果失去了數(shù)據(jù)采集的方向,就無從談起釆集方法的科學(xué)性。
概括地說,數(shù)據(jù)應(yīng)用需求有三個層 面:宏觀管理、科學(xué)研究和公眾服務(wù)。根據(jù)不同應(yīng)用層面,其數(shù)據(jù)采集的規(guī)模、方法等都有所不同。
宏觀管理需求的數(shù)據(jù)應(yīng)用一般在國家層面,重視數(shù)據(jù)的廣度;
科學(xué)研究需求的數(shù)據(jù)一般是部門層面,重視數(shù)據(jù)的深度;
公眾服務(wù)需求的數(shù)據(jù)一般在教育和娛樂層面,重視數(shù)據(jù)的知識性、趣味性。
根據(jù)不同層面的應(yīng)用需求,釆集整理不同類別的數(shù)據(jù)至為重要。只有量體裁衣,方能事半功倍。
六、數(shù)據(jù)管理
數(shù)據(jù)管理是文化資源數(shù)字化工作的核心內(nèi)容之一,是數(shù)據(jù)資源應(yīng)用的基礎(chǔ),其內(nèi)容包括數(shù)據(jù)存儲、 整理、傳輸、交換、共享等諸多環(huán)節(jié)。數(shù)據(jù)傳輸依托于有形或無形的網(wǎng)絡(luò)體系,數(shù)據(jù)交換與共享在技術(shù)層面的關(guān)鍵要素是遵循統(tǒng)一的標(biāo)準(zhǔn),其核心難點在于機制、 體制問題。以下我們重點談一下數(shù)據(jù)存儲和資源整理。
(一)數(shù)據(jù)存儲
存儲的最終目的是為了使用。因此,數(shù)據(jù)存儲工 作的重點是保證數(shù)據(jù)的安全和應(yīng)用的便捷性。針對文化數(shù)據(jù)資源實際,有以下幾點關(guān)于數(shù)據(jù)存儲的建議可供參考。
圖:騰訊云
1.集中與分布相結(jié)合。隨著信息技術(shù)的迅猛發(fā)展,網(wǎng)絡(luò)帶寬不斷擴充,數(shù)據(jù)存儲與傳輸?shù)钠款i問題會越來越小。因此,數(shù)據(jù)集中與分布存儲都有可能, 可以根據(jù)實際情況靈活選擇。
建議在國家與省級行政管理層面可以集中存儲文化管理數(shù)據(jù)和必須的業(yè)務(wù)數(shù)據(jù),以及基層單位的數(shù)據(jù)資源目錄;基層文化單位則可以分布存儲詳細的、豐富的全部數(shù)據(jù)。以此形成統(tǒng)分結(jié)合的動態(tài)數(shù)據(jù)存儲體系,既便于統(tǒng)一管理,也便 于各自維護。
2.小成本,多副本。文化的數(shù)據(jù)量龐大,就目前現(xiàn)狀而言不可采用完全統(tǒng)一的存儲模式,應(yīng)該靈活選擇。針對更新實時性不高的數(shù)據(jù)(比如文物、藝術(shù)品的本體描述信息,在一定時間內(nèi)基本上不會發(fā)生大的變化),在數(shù)據(jù)存儲介質(zhì)的選擇上建議以適用為原則,注重多材質(zhì)、多套件、經(jīng)濟型的選擇。比如,采取磁盤陣列、磁帶、光盤等多種組合方式,保留多個存儲副本,以保證數(shù)據(jù)安全。
3.應(yīng)用與保存分開。無須多言,估計很多部門都 不會把自己的核心數(shù)據(jù)直接拿出來提供應(yīng)用服務(wù)。這 種管理方式不能簡單的定義為保守主義,保護核心數(shù) 據(jù)的安全應(yīng)是第一位的,沒有錯誤可言。只是在具體操作時,可以通過一些技術(shù)處理,達到既保證數(shù)據(jù)安全,又能廣泛提供應(yīng)用的目的。
首先是將核心存儲數(shù)據(jù)與應(yīng)用數(shù)據(jù)分開,“應(yīng)用”數(shù)據(jù)由核心數(shù)據(jù)中提取加工而來,與“原始”數(shù)據(jù)要做到物理上的分隔;其次,可以分散提供應(yīng)用內(nèi)容,做到小規(guī)模、多層面, 既保證應(yīng)用效率,也避免整體安全隱患,當(dāng)然這種“分散”絕不是“散亂”,在機制、架構(gòu)上應(yīng)是統(tǒng)一的,否則就加大了管理的難度。
4.重視備份。數(shù)據(jù)備份的重要性毋庸置疑,但如 何做到科學(xué)、合理的備份卻并不容易。如果對所有文 化數(shù)據(jù)都采用系統(tǒng)應(yīng)用級備份,多多少少是有些浪費 資源的,不妨根據(jù)實際情況多采用常態(tài)、多點的冷備 方式。在條件不具備的情況下,甚至不必要一定將存 儲介質(zhì)存放在環(huán)境要求較高的機房環(huán)境,只要采用多 點模式,能夠保護備份介質(zhì)的不丟失、不損壞,就能 滿足數(shù)據(jù)備份的基本要求了。但數(shù)據(jù)備份點的選擇卻 非常重要,一定要選擇安全的場所,條件允許的情況 下,既要考慮同城備份,也要考慮異地容災(zāi)。
(二)數(shù)據(jù)整理
文化數(shù)據(jù)整理是對文化數(shù)據(jù)進行的審核、校正、 梳理、加工,建立各類專題數(shù)據(jù)庫,為不同需求的應(yīng) 用服務(wù)做好準(zhǔn)備的過程。數(shù)據(jù)整理既有對原始“數(shù) 據(jù)”的使其“規(guī)范”化操作過程,也包括把原始“數(shù)據(jù)”轉(zhuǎn)化為“資源”、“信息”、“知識”和“產(chǎn) 品”的過程[5]。但數(shù)據(jù)整理不是一項孤立的工作,與文化數(shù)據(jù)資源建設(shè)的諸多環(huán)節(jié)都有著廣泛聯(lián)系。
1.整理以應(yīng)用為目的。數(shù)據(jù)整理工作一定是以數(shù) 據(jù)應(yīng)用為目的的,否則就只能是盲目的“調(diào)整”,而 且調(diào)整以后還要調(diào)整。只有充分考慮并科學(xué)的分析應(yīng) 用需求,才能合理規(guī)劃、有效部署數(shù)據(jù)整理的方式 方法。
2.整理從采集開始。嚴(yán)格意義上說,數(shù)據(jù)整理工 作在數(shù)據(jù)采集時就需要同步開展了,具體表現(xiàn)為數(shù)據(jù) 質(zhì)量的監(jiān)督管理和實時審核,實現(xiàn)數(shù)據(jù)質(zhì)量管理的關(guān) 口前移。如果采集的原始數(shù)據(jù)就已經(jīng)非常規(guī)范、科 學(xué)、有效了,后期的數(shù)據(jù)整理重點就可以放在組合歸 類、挖掘分析等層面’勢必就減少了工作的復(fù)雜度。
3.整理不是改變。數(shù)據(jù)整理的目的是使已有的數(shù) 據(jù)更規(guī)范、更科學(xué)、更易用,但一定要注意方式、方 法,隨意改變數(shù)據(jù)的性質(zhì)’ 內(nèi)容是一大禁忌。在數(shù)據(jù) 整理過程中,可以有類似于合并同類項、釆用標(biāo)準(zhǔn)用 詞替代習(xí)慣用語等操作手段,但不可隨意擴大數(shù)據(jù)內(nèi) 容范圍、更不可無中生有。為了保證數(shù)據(jù)的原真性, 在做數(shù)據(jù)整理工作前,一定要對原始“數(shù)據(jù)”做好妥 善的備份,以備整理過程中若發(fā)生錯誤時可以隨時查 看原始檔案,及時修正錯誤。
七、數(shù)據(jù)應(yīng)用
(一)應(yīng)用對象
前文提過,數(shù)據(jù)應(yīng)用有三個層面:宏觀管理、科學(xué)研究、公眾服務(wù),分別對應(yīng)于管理人員、研究人員和社會公眾,各自服務(wù)于政府、行業(yè)和社會。
管理人員的數(shù)據(jù)應(yīng)用重點在于數(shù)據(jù)的統(tǒng)計、分析、查詢等, 數(shù)據(jù)內(nèi)容一般在內(nèi)部網(wǎng)絡(luò)體系中運行,其目的是為業(yè)務(wù)管理和行政決策提供科學(xué)的參考依據(jù),同時,也為相關(guān)部門協(xié)同管理提供數(shù)據(jù)支持;研究人員的數(shù)據(jù)應(yīng)用大部分在單機或者內(nèi)部網(wǎng)絡(luò)體系,少量在外網(wǎng)運行,對數(shù)據(jù)的深度要求較高,要求提供數(shù)據(jù)查詢和信息定制服務(wù);社會公眾的數(shù)據(jù)應(yīng)用主要在于數(shù)據(jù)的查 詢和產(chǎn)品的使用,需要數(shù)據(jù)有足夠的知識性和趣味性。
也可以適應(yīng)教育、科研、娛樂等需要,為影視、 動漫、游戲生產(chǎn)提供基礎(chǔ)數(shù)據(jù)資料,促進相關(guān)文化產(chǎn)業(yè)的發(fā)展。因此,針對不同的數(shù)據(jù)應(yīng)用對象需要通過不同的途徑,提供不同的數(shù)據(jù)類型。
(二)應(yīng)用方式
文化數(shù)據(jù)資源應(yīng)用的方式多種多樣,包括內(nèi)部查詢、網(wǎng)站發(fā)布、研究報告、資料出版、產(chǎn)品制作等。 按數(shù)據(jù)應(yīng)用的內(nèi)容劃分,有簡單數(shù)據(jù)應(yīng)用(如數(shù)據(jù)查詢)和復(fù)雜數(shù)據(jù)應(yīng)用(如數(shù)據(jù)挖掘分析);按數(shù)據(jù)應(yīng)用的渠道劃分,有在線數(shù)據(jù)應(yīng)用(如網(wǎng)上發(fā)布)和離線數(shù)據(jù)應(yīng)用(如光盤發(fā)行);按數(shù)據(jù)應(yīng)用的商業(yè)模式劃分,有免費數(shù)據(jù)應(yīng)用和收費數(shù)據(jù)應(yīng)用。
數(shù)據(jù)應(yīng)用的總體原則應(yīng)是多種類型結(jié)合,多條渠道結(jié)合。具體采用什么樣的數(shù)據(jù)應(yīng)用方式,與數(shù)據(jù)應(yīng)用的對象和數(shù)據(jù)提供的內(nèi)容有關(guān),應(yīng)該靈活處理、區(qū)別對待。
八、小結(jié)
數(shù)字文化建設(shè)是一項復(fù)雜、龐大的工程,涉及面廣、工作量大,在實施文化資源普查、文化遺產(chǎn)保護、文化藝術(shù)創(chuàng)作、公共文化服務(wù)、文化市場管理、 文化產(chǎn)業(yè)發(fā)展、對外文化交流等各項工作中都發(fā)揮著重要作用。
以上僅是結(jié)合文化數(shù)字化領(lǐng)域的工作實踐,對數(shù)字文化及其文化數(shù)據(jù)采集、管理和應(yīng)用環(huán)節(jié)的一些膚淺認識,內(nèi)容不夠全面,也不成體系,且難免存在偏頗與錯誤之處,在此提出來與大家共同分享、討論,以期為數(shù)字文化建設(shè)工作的科學(xué)發(fā)展略盡微薄之力。
數(shù)字文化建設(shè)是一項復(fù)雜、龐大的工程,涉及面廣、工作量大,在實施文化資源普查、文化遺產(chǎn)保護、文化藝術(shù)創(chuàng)作、公共文化服務(wù)、文化市場管理、 文化產(chǎn)業(yè)發(fā)展、對外文化交流等各項工作中都發(fā)揮著重要作用。
以上僅是結(jié)合文化數(shù)字化領(lǐng)域的工作實踐,對數(shù)字文化及其文化數(shù)據(jù)采集、管理和應(yīng)用環(huán)節(jié)的一些膚淺認識,內(nèi)容不夠全面,也不成體系,且難免存在偏頗與錯誤之處,在此提出來與大家共同分享、討論,以期為數(shù)字文化建設(shè)工作的科學(xué)發(fā)展略盡微薄之力。
作者簡介:??讖姡?,文化部信息中心總工程師,主要研究方向:網(wǎng)絡(luò)安全和信息化規(guī)劃管理、電子政務(wù)和數(shù)據(jù)資源建設(shè)。
文中圖片為編者所加,出處見標(biāo)注
①參見百度百科:數(shù)宇化,https://bailee.baidu.com/i1;em/%E6%95%B0%E5%AD%97%E5%8C%96/6l3878?f「=alacMin。
參考文獻:
[1] 辭海編輯委員會.辭海[Z].上海:上海辭書出版社,1979: 3510.
[2] 新華網(wǎng).習(xí)近平:決勝全面建成小康社會奪取新時代中國 特色社會主義偉大勝利一在中國共產(chǎn)黨第十九次全國代表 大會上的報告[R/0L].(2017-1 0/27)[201 8.3.31], http;//www. xinhuanet. com/pol itics/19cpcnc/2017—10/27/c_1121867529.htm.
[3] 鄭建明,王錳.數(shù)字文化治理的內(nèi)涵、特征與功能[」].圖書館 論壇,2015 (10) : 15-19.
W同[2]
[5]??讖?關(guān)于文物數(shù)據(jù)庫框架設(shè)計的研究與探討[」].文博, 2010 (5).
轉(zhuǎn)載文章僅代表作者觀點,不代表我館立場。