數據分析是常見的挖掘數據價值的手段,數據分析場景根據使用數據的方式一般可分為離線數據分析和在線數據分析兩種類型。離線數據分析需要將生產數據導出并共享至第三方環境,在線數據分析需要直接連接生產環境的數據。如果不對分析數據中使用的敏感數據加以管控,無論哪種數據分析類型都容易造成敏感數據泄漏。例如在離線數據分析中,如果包含大量真實的敏感數據,能夠接觸到這些數據的人員,就可以通過拷貝、復制、導出等手段將敏感信息泄露;同樣在線數據分析場景中,數據分析過程直接訪問生產數據進行分析統計,分析人員可以隨意查詢重要未經處理的敏感數據,也可以通過復制、導出、拍照等手段將敏感信息泄露。
離線數據分析場景下,采用靜態數據脫敏技術實現數據掩碼,對離開生產環境的敏感數據進行脫敏處理。這種情況下,為了保障分析數據可用,需要將特定數據保留其格式和特性。例如一些數據分析場景中需要分析用戶的地域特性,在只需要知道用戶的所在省份情況下,這種情況在脫敏中只需要保留用戶地址信息中的省份信息,同時為了避免用戶地址信息泄露,可以對省份后面的具體地址信息進行遮蔽或者替換處理。
在線數據分析場景下,可以采用動態脫敏技術,對實時返回的生產數據中的敏感信息進行掩碼處理。這種情況下,即要保證分析數據可用,又不能對生產數據造成影響。安華金和動態數據脫敏技術基于“語句改寫”技術路線,能夠實現高性能、高擴展性的動態數據屏蔽和脫敏。其技術原理是在數據庫通訊協議層面,通過SQL代理技術,實現完全透明的、實時的敏感數據掩碼;在不需要對生產數據庫中的數據進行任何改變的情況下,依據不同的分析模塊和其他定義規則,動態的對生產數據庫返回的數據進行專門的屏蔽、加密、隱藏和審計,確保數據分析訪問生產環境的敏感數據安全。