構建數據分析匿名化流水線 Building an Anonymization Pipeline: Creating Safe Data

Luk Arbuckle,Khaled EI Emam 譯者 杜春曉

商品描述

數據使用,如何才能做到既保護個人隱私,又能讓數據分析有用處、有意義?
數據架構師和工程師可從本書學習到如何以可持續方式,
建立安全和可複用的匿名化流水線,並將其整合到數據流和分析工作中。
 本書作者在解決真實業務需求所用採集模型和應用場景的基礎上,
探討設備和物聯網數據匿名化的端到端解決方案。
書中示例來自人們對其有著迫切需求的數據環境,
如衛生保健,這些示例所用方法都已經過時間的檢驗。

作者簡介

Luk Arbuckle

是Privacy Analytics公司首席方法官,為負責任地使用和分享數據提供策略指導,為隱私增強技術和方法提供創新。
Luk曾擔任加拿大隱私專員辦公室主任。

 

Khaled EI Emam

是Replica Analvtlcs公司合夥人和CEO,該公司致力於開發合成數據。
他還是加拿大渥太華大學醫學院教授、東安大略兒童醫院研究所資深研究員。

目錄大綱

目錄
前言
第1章 簡介
可識別性
術語介紹
法律法規
數據狀態
匿名化作為數據保護措施
許可或同意
目的說明
重識別攻擊
匿名化落地
小結

第2章 可識別性範圍
法律環境
披露風險
披露類型
數據隱私的維度
重識別科學
確定群體
匹配方向
數據結構
總體可識別性
小結

第3章 風險管理實用框架
“五個安全”匿名化框架
安全項目
安全人員
安全環境
安全數據
安全輸出
“五個安全”框架落地
小結

第4章 明識數據
需求收集
應用場景
數據流
數據和數據主體
從主要到次要用途
處理直接標識符
處理間接標識符
從明識到匿名
明識數據和匿名數據相混合
將匿名化應用於明識數據
小結

第5章 偽匿名數據
數據保護和法律權威
偽匿名化服務
法定權力
合法權益
匿名化第一步
重新反思“從主要到次要用途”
分析平台
合成數據
生物統計特徵標識符
小結

第6章 匿名數據
再思考可識別性範圍
源頭匿名化
匯總匿名數據
從源頭採集數據的利弊
從源頭採集數據的方法
安全匯總
訪問存儲數據
反哺源頭匿名化
小結

第7章 安全使用
信任基礎
信任算法
AIML技術
技術難點
信任失控的算法
負責任AIML技術的原則
管理和監督
隱私倫理
數據監控
小結
作者介紹
封面介紹