人工智能、大數據、云計算、物聯網、移動互聯等為代表的新一輪信息技術,帶動信息技術快速向前發展,創新型應該用不斷出現和普及,各類組織機構都在被信息技術帶動著向前發展,驅動組織機構不斷提升信息化程度。來自業務端的系統開發需求大量劇增,這對于開發測試所需的數據質量提出更嚴格的要求,但另一方面,生產數據用于開發測試將加劇敏感數據泄露的安全風險。國家及行業監管機構對于數據安全提出明確要求:用于開發測試的生產數據必須經過脫敏處理。這就帶來了一系列的問題:
1、開發測試環境中是否使用生產數據?
2、其中的敏感數據是否有人在使用?誰在用?
3、這些敏感數據脫敏了嗎?
4、面對行業監管,如何證明生產數據使用的合規性?
5、敏感數據的管理有效嗎?是否可以持續開展?
6、敏感數據管理與開發測試工作是否有沖突?如何解決?
通過靜態數據梳理技術自動發現開發測試環境中的敏感數據并實現清單化管理,包括:數據庫分布在哪些IP網段、數據庫類型、實例信息、表結構信息、源數據信息等。
通過動態梳理技術,對數據庫訪問流量進行解析,獲取數據庫訪問源、訪問對象、訪問行為及返回值,從而獲知是否有開發測試賬戶使用了敏感數據,哪些用戶或系統在使用哪些敏感數據,是怎樣的使用的。
將數據脫敏流程分解為敏感數據發現、敏感數據梳理、脫敏方案制定、脫敏任務執行四大步驟,結合完善的敏感數據字典管理、數據發現算法管理、脫敏算法管理模塊,實現全面的敏感數據管理。
脫敏數據的高度仿真和關聯關系保留,才能保證開發出的系統與現有系統的兼容性。所以需要保證脫敏后的數據能夠準確反應原始數據的業務屬性和數據分布特征,脫敏后的數據滿足業務系統的數據關系特征,保留原有的數據關系,例如身份證號在多個表中出現,需要保證脫敏后也是一樣的,時間等序列關系的數據,需保證脫敏后仍然能夠保持原有的時間序列。