編者按:10月27-28日,2021中國文化計算大會在北京、云南兩地連線同步舉辦。中宣部文化體制改革和發展辦公室一級巡視員、中國公共關系協會文化大數據產業委員會副主任委員高書生受邀作大會報告。高書生在主旨報告中指出,黨的十九屆五中全會講到文化的時候講了兩個數字化,一個叫作公共文化數字化建設,一個叫作文化產業數字化戰略。這就意味著文化數字化已經從工程項目上升為國家戰略。但當前文化數字化還面臨“四大難題”,如何有效破解?以下為報告實錄。
中宣部文改辦一級巡視員、中國公共關系協會文化大數據產業委員會副主任委員高書生作報告。中國網記者胡俊 攝
文化數字化我們10年前已經提了,從“十二五”時期開始推動這項工作,實施文化數字化建設工程,從文化資源到文化生產再到文化傳播,最后到文化消費,實現全面數字化。
去年黨的十九屆五中全會講到文化的時候講了兩個數字化,一個叫作公共文化數字化建設,一個叫作文化產業數字化戰略。這就意味著文化數字化已經從工程項目上升為國家戰略。
文化數字化本身就是文化和科技融合的產物,要實施國家文化數字化戰略,一定要依靠科技的支撐。下面我從四方面給大家介紹一下在推動文化數字化戰略的實施和文化大數據建設過程中遇到的一些難點問題。
第一個難題是數據關聯
為什么提出這樣的問題?因為經過10年的努力,宣傳文化領域當中數據量非常大,比如說我們的新聞單位有好多圖片庫,廣播電臺、電視臺有大量的媒資庫,還有出版社、文化機構有大量的數據庫。數字化之后形成了許多的數據庫,隨之出現了一個問題,就是數據的孤島。數據庫很多都是各個單位自建自用,量是非常大的,但都是孤島,使用率很低。
數據關聯的本意是要把這些數據連到一起,能夠共享,這是我們的出發點。怎么實現這種關聯?拆成兩個方面:
一個是實現內關聯,擁有數據的文化機構能夠把這些數據關聯起來,我們稱之為內關聯。內關聯主要是三個步驟。一是分類。我們現在就是按照聯合國教科文組織2009年版的文化統計框架進行分類的,分成6個類別。在這個基礎上再做編目,編目主要是依靠我們各個行業、各個領域的專業化知識圖譜做編目。在完成這兩個工作的基礎上,數據的坐標定好了,再對這些數據的特征進行描述,我們叫標注,實際上就是標簽化。通過這三個步驟實現內關聯。
二是實現外關聯。內關聯基本上很容易做到,但是最難的就是外關聯。我們想到了依托有線電視網絡,把所有的文化機構的數據中心貫通,連一起,形成一張生產的互聯網。
一說國家文化專網,馬上就想到搞重復建設,不是的。我們依托現有的有線電視網絡、正在建的廣電5G網絡和互聯互通的平臺,就能實現外關聯。
國家文化專網有三個功能:一是閉環運行,二是標識解析,三是結算制度。這三個功能我們一定要具備,如果沒有的話,我們的外關聯還是實現不了。
為什么閉環運行,是保障數據的安全。
下面我想重點解釋一下標識解析,我們的標識解析主要是依托中國主導的一項國際標準,即信息和文獻的關聯標識國際標準作為依托,在有線電視網絡部署標識編碼的注冊登記和解析系統,這樣就完成了第一步標識解析。這樣就等于有線電視網絡要新開展一項業務,國家文化專網接入服務,就是要把各個文化機構的數據中心貫通,實現互聯互通,最終的目的是達到外關聯。
外關聯最后要達到的是把零散的文化數據和不同領域的文化數據,比如說文化旅游、文物、新聞出版、廣播電視、電影、網絡文化,把這些數據貫通起來。還有一個是不同形態的,比如說文字、圖片、音頻、視頻關聯起來,還有一些是把文化資源的源和實體關聯起來,最后實現內關聯和外關聯統籌,最終形成關聯數據,這是文化數字化重要的成果。而這種關聯數據由于凝結了專業工作者的勞動價值,所以說這種關聯資產要實現資產化,就可以實現交易,讓這種數據能夠變現,成為文化機構一個重要的收入來源。
在這個過程中我們需要大量的技術,不管是內關聯技術還是外關聯技術,特別是在數據的傳輸、安全、存儲方面,需要大量技術。
第二個難題是數據加工
每一個文化機構先接入國家文化專網,第二步部署一個底層關聯集成系統,這也是剛才提到的標識解析的第二個方面,就是依托我們國家主導的國際標準,在各文化數據中心部署這樣一種底層關聯的引擎和應用軟件,最后實現互聯互通。
在兩個條件具備以后,每個文化機構或者若干個文化機構結合在一起的形成數字化文化生產線。這個文化生產線當中主要是解決解構這些數據和關聯這些數據以及解構數據、重現數據的功能,最后形成兩個產品,一個是通過解構形成的文化資源數據,另外一個是通過關聯、重構和呈現形成的文化數字內容,這樣就進入了數據的分發和內容的分發階段。最后往下接的實際上就是數據超市,能夠把這些數據變現,把生產單位的生產成果能夠轉化為資產,轉化為產品,最后形成共享的東西。
生產線一定要堅持守正。怎么實現守正呢?我們提了四個方面:第一個是數據要保真,第二創作要嚴謹,第三內容要把關,第四互動要有序。只有這樣才能實現守正。如果不能夠守正,也就談不上創新,如果不能夠守正,也就不能贏得人民的信任,這個產品的生命力就會大打折扣。
數據加工能夠關注兩個方面,一方面是把大家的積極性調動起來;第二是要改造業務流程,讓每一家傳統文化機構都能夠搭上數字化這輛快車。
第三個難題是全景呈現
現在數據也有了,也有人加工,也有人傳輸,也有地方交易,最后我們最關注的問題是在消費環節,大家所看到的東西是和過去不一樣的,如果說和過去一樣,那么這個數字化就沒有意義。我們現在,尤其是去年疫情以來,都在推線上的活動,線上內容確實是多但也有問題,就是現在大量的內容都是平移過來的,就是把線下的內容平移到了線上,也有一些博物館,也有一些云演藝等等,這些活動比過去要多,但是看起來不方便,沒有完全體現出數字化以后的那種新體驗,這方面差。文化數字化不能止步于網頁化,把過去一些東西搬到網頁上就萬事大吉了。我們能不能改寫展陳史,能夠讓展陳方式發生根本變化,比如說我們能不能場景化,有些東西現在已經做到了,但大量的東西還沒有。包括戲劇的形式,怎么能在線上看的和在劇場一樣,同時又有比劇場更近一步的東西,空間還是很大的,我們把它叫做全景呈現。
下一步要推動數字化的文化文化消費新場景,包括線上和線下,線上關注大屏和小屏,大屏是電視機,小屏就是移動終端。線下關注文化體驗園、文化體驗館和文化體驗廳,形成了在所有的體驗場合都能有文化數字體驗產品能夠體現,這是我們最終的目的。
第四個難題是數據安全
這些年每個單位都有大量的數據,但為什么沒有拿出來?經過調研發現大家還是有些擔心,擔心數據拿出來之后很難識別數據是誰的,結果我們也用了很多技術,比如說區塊鏈等,但是什么東西都依靠打官司,這個社會是沒法運轉的。
能不能有一些前置和有效的手段來確保數據安全?
我們現在想到的數據安全,主要是三道門:第一道門是建國家文化專網,這也是我們為什么依托現有的有線電視網絡做這件事,因為互聯網和公網是物理隔離,數據沒有流失,而且也不可能盜??;第二道門是數據存儲的方式,文化機構最害怕的一件事就是把數據拿走,所以我們現在提出了一個基本原則,就是所有的數據中心即使貫通了,但還是按照物理分布、邏輯關聯部署,別人需要你的數據,必須要經過授權才能使用;第三道門是剛才提到的標識解析,所有的數據一出來,就形成了唯一的標識符,可以實現溯源,但這是我們被動的手段,前兩道是最關鍵的。
以上問題中涉及到大量的技術問題,特別是最近幾年在和北京郵電大學一起合作的時候,發現還有一些基礎學科研究的問題,希望有更多的機構和更多的專家學者能夠加入到這個行列當中,破解我們在文化數字化過程中這些難題,共同推動國家文化數字化戰略的實施以及文化大數據的建設。