12月16日,由國家信息中心《信息安全研究》雜志社主辦,公安部第一研究所、中國網(wǎng)絡(luò)安全產(chǎn)業(yè)聯(lián)盟、新華網(wǎng)客戶端等單位共同協(xié)辦的“2021網(wǎng)絡(luò)安全創(chuàng)新發(fā)展高峰論壇”在京順利舉行。
北京明朝萬達(dá)科技股份有限公司助理總裁兼研發(fā)中心總經(jīng)理安鵬受邀出席此次會(huì)議,并在數(shù)據(jù)安全分論壇以“AI技術(shù)在數(shù)據(jù)安全治理的應(yīng)用與探索”為題發(fā)表演講,向與會(huì)領(lǐng)導(dǎo)、專家們分享了明朝萬達(dá)在AI技術(shù)在數(shù)據(jù)安全治理的應(yīng)用和實(shí)踐,介紹了公司成功的應(yīng)用效果和項(xiàng)目實(shí)踐。

近年來國內(nèi)外數(shù)據(jù)泄露事件頻發(fā),為了使數(shù)據(jù)合法合規(guī)使用,充分發(fā)揮價(jià)值,國家出臺(tái)了多項(xiàng)政策法規(guī)要求加強(qiáng)針對數(shù)據(jù)的安全管理,數(shù)據(jù)安全治理勢在必行。作為國內(nèi)數(shù)據(jù)安全領(lǐng)域的代表廠商,明朝萬達(dá)認(rèn)為數(shù)據(jù)安全治理需要由政府、企業(yè)組織牽頭,以策略規(guī)范和技術(shù)工具為支撐,圍繞數(shù)據(jù)生命周期,經(jīng)過組織梳理、資產(chǎn)梳理、策略制定、過程控制、行為稽核、持續(xù)完善六個(gè)階段進(jìn)行,從而讓數(shù)據(jù)使用更安全。
安鵬講到,數(shù)據(jù)安全治理并非僅由單一產(chǎn)品或平臺(tái)所構(gòu)建,而是圍繞數(shù)據(jù)生命周期,結(jié)合企業(yè)或組織自身數(shù)據(jù)現(xiàn)狀,建立與制度流程配套的技術(shù)和工具,持續(xù)提升企業(yè)或組織的數(shù)據(jù)安全防護(hù)能力。他一一列舉了當(dāng)前政府機(jī)構(gòu)在數(shù)據(jù)安全治理六個(gè)階段分別需要具備的技術(shù)能力,然后挑選其中數(shù)據(jù)資產(chǎn)識(shí)別、數(shù)據(jù)分類分級、異常行為分析、數(shù)據(jù)指紋溯源、控制策略推薦5項(xiàng)技術(shù)能力,逐一介紹了明朝萬達(dá)是如何用AI為其賦能的。
數(shù)據(jù)資產(chǎn)識(shí)別
政務(wù)系統(tǒng)中包含豐富的高敏感數(shù)據(jù),但不同部門間數(shù)據(jù)標(biāo)準(zhǔn)不一,文件數(shù)量龐大、類型多,所涉及專業(yè)知識(shí)存在差異,人工難以實(shí)現(xiàn)自動(dòng)化對敏感信息進(jìn)行識(shí)別。傳統(tǒng)數(shù)據(jù)資產(chǎn)識(shí)別方式主要采用正則表達(dá)式技術(shù)手段,依靠人工經(jīng)驗(yàn),設(shè)定數(shù)據(jù)資產(chǎn)識(shí)別規(guī)則,存在工作量大、實(shí)施難度大、誤報(bào)、漏報(bào)率高的問題。
應(yīng)用AI技術(shù),使用自然語言處理技術(shù),在正則表達(dá)式基礎(chǔ)上,分析上下文語義,識(shí)別敏感數(shù)據(jù),具備識(shí)別類型寬泛、識(shí)別顆粒度細(xì)、識(shí)別準(zhǔn)確度高的優(yōu)勢。
應(yīng)用效果:

數(shù)據(jù)分類分級是數(shù)據(jù)安全治理的重要環(huán)節(jié),數(shù)據(jù)分級后才能根據(jù)訪問權(quán)限在安全的前提下使用,推動(dòng)數(shù)據(jù)跨部門、跨層級的共享共用。傳統(tǒng)數(shù)據(jù)分類分級主要依據(jù)文件名中關(guān)鍵字或員工經(jīng)驗(yàn)核驗(yàn)文件內(nèi)容對數(shù)據(jù)進(jìn)行分類分級,此種方式存在分類依據(jù)欠缺、類別結(jié)構(gòu)混亂、校驗(yàn)工作量大的問題。
應(yīng)用AI技術(shù),基于文件內(nèi)容,使用自然語言處理技術(shù),構(gòu)建N元中文語言模型與文檔分類模型,具備分類依據(jù)充分、統(tǒng)一分類結(jié)構(gòu)、自動(dòng)分類分級的優(yōu)勢。
實(shí)現(xiàn)效果:

異常行為分析
異常行為分析通過分析內(nèi)部用戶產(chǎn)生的行為日志,如操作日志、審批記錄等數(shù)據(jù),檢測并發(fā)現(xiàn)異常訪問行為,分析并追溯異常產(chǎn)生原因,從而防范敏感數(shù)據(jù)泄露與數(shù)據(jù)濫用的安全風(fēng)險(xiǎn)。傳統(tǒng)方式是在發(fā)現(xiàn)安全事件后,主要通過人工依據(jù)企業(yè)組織軟硬件日志來進(jìn)行分析用戶行為,存在事后分析滯后、行為日志數(shù)量大、關(guān)聯(lián)分析難度大的問題。
應(yīng)用AI技術(shù),基于UEBA框架,使用機(jī)器學(xué)習(xí)、深度學(xué)習(xí)模型,構(gòu)建用戶行為基線,判斷異常行為,具備分析用戶行為全面、發(fā)現(xiàn)異常行為及時(shí)的優(yōu)勢。
實(shí)現(xiàn)效果:

數(shù)據(jù)指紋溯源
數(shù)據(jù)指紋技術(shù)能夠基于數(shù)據(jù)內(nèi)容生成數(shù)據(jù)指紋。數(shù)據(jù)指紋能夠使用較少的存儲(chǔ)容量,快速識(shí)別文件的相似性。即便員工違規(guī)拷貝并泄露敏感數(shù)據(jù),也能通過對比數(shù)據(jù)指紋,對原始文件進(jìn)行匹配溯源。傳統(tǒng)的數(shù)據(jù)溯源,主要通過一對一的掃描比對方式對數(shù)據(jù)文件的內(nèi)容進(jìn)行對比,存在數(shù)據(jù)溯源范圍大、數(shù)據(jù)比對時(shí)間長、全面溯源成本高的問題。
應(yīng)用AI技術(shù),基于自然語言處理方法及特征提取技術(shù),構(gòu)建數(shù)據(jù)指紋庫,具備指紋特征存儲(chǔ)容量小 、數(shù)據(jù)唯一標(biāo)識(shí)、識(shí)別數(shù)據(jù)快速且高效的優(yōu)勢。
實(shí)現(xiàn)效果:

控制策略推薦
為保障政務(wù)系統(tǒng)安全,安全管理人員需要配置大量的控制策略。目前控制策略的配置與下發(fā),均采用人工的方式進(jìn)行操作,主要依靠安全管理人員的經(jīng)驗(yàn)以及各部門員工的要求,此種方式不僅對運(yùn)維人員的經(jīng)驗(yàn)要求高,在多次更改個(gè)人或部門的控制策略后,易存出現(xiàn)數(shù)據(jù)安全漏洞。
應(yīng)用AI技術(shù),智能控制策略推薦結(jié)合知識(shí)圖譜與推薦算法,幫助安全管理人員實(shí)現(xiàn)靈活精準(zhǔn)管控,當(dāng)需要需要優(yōu)化調(diào)整某部門的控制策略時(shí),可尋找相似部門的優(yōu)秀控制策略作為推薦,過濾不相關(guān)的系統(tǒng)及控制策略,極大縮小安全管理人員的選擇范圍,大幅提升控制策略優(yōu)化調(diào)整效率。
在演講結(jié)尾部分,安鵬還跟大家分享了明朝萬達(dá)用AI技術(shù)賦能數(shù)據(jù)安全治理的成功案例--某省移動(dòng)警務(wù)數(shù)據(jù)安全治理項(xiàng)目。介紹了該項(xiàng)目的建設(shè)背景,業(yè)務(wù)需求,以及項(xiàng)目中涉及的產(chǎn)品、技術(shù)等,其中重點(diǎn)介紹了數(shù)據(jù)安全治理的應(yīng)用效果。