隨著數(shù)字化轉(zhuǎn)型深化,數(shù)據(jù)要素的流通、共享、分發(fā)頻次大幅提升,但與此同時(shí),數(shù)據(jù)泄漏事件也是逐年增長。
根據(jù)《2024年中國政企機(jī)構(gòu)數(shù)據(jù)安全風(fēng)險(xiǎn)研究報(bào)告》,互聯(lián)網(wǎng)、政府及事業(yè)單位是數(shù)據(jù)泄露的重災(zāi)區(qū)。數(shù)據(jù)流通的“便利性”和“安全性”面臨嚴(yán)重的挑戰(zhàn)。
面對(duì)挑戰(zhàn),國家和行業(yè)已明確“亮劍” 。從國家數(shù)據(jù)局、發(fā)改委等部門聯(lián)合印發(fā)的《關(guān)于完善數(shù)據(jù)流通安全治理更好促進(jìn)數(shù)據(jù)要素市場化價(jià)值化的實(shí)施方案》(簡稱“方案”) ,到國家衛(wèi)健委發(fā)布的《加強(qiáng)醫(yī)療機(jī)構(gòu)電子病歷信息使用管理的通知》 ,再到各地方數(shù)據(jù)條例 ,均明確要求或鼓勵(lì)建設(shè)數(shù)據(jù)溯源技術(shù)。
其中,數(shù)據(jù)水印因其出色的溯源與取證能力,被明確列為關(guān)鍵技術(shù)措施 。例如,方案提出:“要融合數(shù)字水印、區(qū)塊鏈等技術(shù),支撐數(shù)據(jù)流通過程中的取證定責(zé)。 ”衛(wèi)健委的通知中也明確提到“支持通過數(shù)字水印等技術(shù)手段,確保使用過程留痕” 。
真實(shí)的數(shù)據(jù)流通場景遠(yuǎn)比想象的復(fù)雜 。
· 數(shù)據(jù)類型多樣: 涉及結(jié)構(gòu)化數(shù)據(jù)與非結(jié)構(gòu)化數(shù)據(jù) 。
· 流轉(zhuǎn)形式多樣: 包含庫表交換、API接口交換、數(shù)據(jù)導(dǎo)出、頁面查看等 。
· 涉及角色多樣: 數(shù)據(jù)運(yùn)維人員、數(shù)據(jù)使用人員、數(shù)據(jù)訂閱人員等 。
· 風(fēng)險(xiǎn)無處不在: 數(shù)據(jù)訂閱方在查看訂閱數(shù)據(jù)時(shí),通過頁面截圖方式造成數(shù)據(jù)泄露 ;運(yùn)維人員可批量導(dǎo)出數(shù)據(jù)庫造成泄露 ;用戶也可通過API接口調(diào)用造成數(shù)據(jù)泄漏 。
顯然,單一的數(shù)據(jù)水印手段難以實(shí)現(xiàn)全場景覆蓋 。市場真正需要的是一套能夠全方位綜合防護(hù)的整體方案,必須整合 API 水印、數(shù)據(jù)動(dòng)態(tài)水印、數(shù)據(jù)靜態(tài)水印、文檔水印等多種技術(shù)工具 。
針對(duì)上述復(fù)雜場景,一套全場景的數(shù)據(jù)水印防護(hù)方案應(yīng)運(yùn)而生。

場景一:應(yīng)用系統(tǒng)批量導(dǎo)出結(jié)構(gòu)化數(shù)據(jù)
數(shù)據(jù)通過應(yīng)用程序?qū)С鰰r(shí),調(diào)用數(shù)據(jù)靜態(tài)水印溯源系統(tǒng),自動(dòng)對(duì)導(dǎo)出的數(shù)據(jù)嵌入水印信息。在此過程中,數(shù)據(jù)靜態(tài)水印溯源系統(tǒng)通過標(biāo)準(zhǔn)API接口與應(yīng)用系統(tǒng)數(shù)據(jù)導(dǎo)出流程對(duì)接,自動(dòng)執(zhí)行水印嵌入任務(wù),不會(huì)影響數(shù)據(jù)導(dǎo)出人員的操作方式,更無法知道水印信息具體嵌入在什么數(shù)據(jù)上,規(guī)范業(yè)務(wù)人員數(shù)據(jù)使用行為。
場景二:應(yīng)用系統(tǒng)批量導(dǎo)出非結(jié)構(gòu)化數(shù)據(jù)
如果導(dǎo)出的是 Word、PDF 這類非結(jié)構(gòu)化文檔,可以利用文檔水印系統(tǒng)進(jìn)行水印嵌入。文檔水印可以嵌入靜態(tài)可見水印,此種方式在文檔中固定顯示類似“內(nèi)部機(jī)密”文字;動(dòng)態(tài)可見水印,顯示的內(nèi)容可以包含當(dāng)前使用數(shù)據(jù)的人的用戶信息、終端信息等;不可見水印,通過修改文件本身特征,或者在文件里添加隱藏信息。
場景三:數(shù)據(jù)動(dòng)態(tài)實(shí)時(shí)訪問
此類場景有兩種情況,一是前端通過API接口訪問應(yīng)用系統(tǒng)中的數(shù)據(jù),可利用應(yīng)用/API水印,對(duì)傳輸?shù)臄?shù)據(jù)嵌入字符水印,或者利用無損水印技術(shù),形成特征水印;一種是運(yùn)維人員直連數(shù)據(jù)庫,實(shí)時(shí)訪問數(shù)據(jù)庫中的數(shù)據(jù),可利用數(shù)據(jù)動(dòng)態(tài)水印溯源系統(tǒng),通過無損水印技術(shù)形成特征水印,便用事后追蹤溯源。
場景四:用戶通過數(shù)據(jù)應(yīng)用平臺(tái)WEB頁面訪問數(shù)據(jù)
此類場景下,用戶可以通過截圖、拍照等方式泄漏數(shù)據(jù),利用應(yīng)用/API水印可以在訪問頁面嵌入頁面水印。頁面水印的關(guān)鍵信息包括:訪問者用戶信息、訪問時(shí)間、客戶端信息等,而且水印的顏色、透明度、旋轉(zhuǎn)角度、橫縱向間距等參數(shù)可根據(jù)實(shí)際需求靈活調(diào)整,能做到既不影響查看,又能對(duì)用戶形成威懾。
場景五:數(shù)據(jù)通過共享數(shù)據(jù)庫對(duì)外共享
利用數(shù)據(jù)靜態(tài)水印溯源系統(tǒng)從源數(shù)據(jù)庫抽取數(shù)據(jù),嵌入相應(yīng)的水印信息后再保存到共享庫中,對(duì)外共享時(shí),從共享庫中提取數(shù)據(jù)。如此,所有共享數(shù)據(jù)都攜帶有水印信息,一旦出現(xiàn)數(shù)據(jù)泄露,即可快速溯源、定位。

(全場景數(shù)據(jù)水印防護(hù)方案部署示意圖)
真正的數(shù)據(jù)水印防護(hù),絕非“頭痛醫(yī)頭”。本方案覆蓋了結(jié)構(gòu)化數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù);針對(duì)結(jié)構(gòu)化水印有嵌入式水印、無損水印方式,非結(jié)構(gòu)化數(shù)據(jù)有可見水印、不可見水印方式;全面覆蓋了API接口調(diào)用、數(shù)據(jù)庫訪問、數(shù)據(jù)導(dǎo)出、數(shù)據(jù)查看等核心場景。我們的目標(biāo)是數(shù)據(jù)流通的最終平衡—— “數(shù)據(jù)流得通、安全守得住”。

