정보보안기사/정보보안 관리 및 법규
[정보보안기사] 가명처리
CyberRanger
2024. 8. 7. 16:49
1. 가명처리 관련 주요 용어
용어 | 설명 |
가명처리 | · 개인정보의 일부를 삭제하거나 일부 또는 전부를 대체하는 등의 방법으로 추가정보 없이는 특정 개인을 알아볼 수 없도록 처리하는 것. |
익명정보 | · 시간, 비용. 기술 등을 합리적으로 고려할 때 다른 정보를 사용하여도 더 이상 개인을 알아볼 수 없는 정보. · 개인정보 파기 방법 중 하나로 익명화 기법이 있다. |
추가정보 | · 가명처리 과정에서 생성 또는 사용된 정보로서 특정 개인을 알아보기 위하여 사용, 결합될 수 있는 정보. · salt, 암호 키, 매핑정보 등 |
재식별 | · 특정 개인을 알아볼 수 없도록 처리한 가명정보에서 특정 개인을 알아보는 것. |
결합키 | · 결합대상 가명정보의 일부로서 해당 정보만으로는 특정 개인을 알아볼 수 없으나 다른 결합대상 정보와 구별할 수 있도록 조치한 정보로서, 서로 다른 가명정보를 결합할 때 매개체로 이용되는 값. |
결합대상 정보 | · 결합 신청자가 결합을 위해 결합전문기관에 제공하는 가명정보에서 결합키를 제외한 정보. |
개인정보보호법 가명정보처리
제28조의2(가명정보의 처리 등)
1. 개인정보처리자는 통계작성, 과학적 연구, 공익적 기록보존 등을 위하여 정보주체의 동의 없이 가명정보를 처리할 수 있다.
2. 가명처리 절차
1단계: 목적 설정 등 사전 준비
2단계: 위험성 검토(특이치 파악 - 데이터 자체 식별 위험성)
3단계: 가명처리
4단계: 적정성 검토
5단계: 안전한 관리
3. 가명처리 기법
3.1. 가명처리 (일반화/범주화) 기법
기법 | 설명 |
일반 라운딩 | · 올림, 내림, 반올림 등을 적용하여 집계 처리하는 방법. · 일반적으로 세세한 정보보다는 전체 통계 정보에 많이 사용. |
랜덤 라운딩 | · 수치 데이터를 임의의 수인 자릿수, 실제 수 기준으로 올림, 내림 하는 기법. |
제어 라운딩 | · 라운딩 적용 시 값의 변경에 따라 행이나 열의 합이 원본과 일치하지 않는 단점을 해결하기 위해 원본과 합계 결과가 동일하도록 라운딩을 적용하는 기법. |
상하단 코딩 | · 정규분포의 특성을 가진 데이터에서 양쪽 끝에 치우친 정보는 적의 수의 분포를 가져 식별성을 가질 수 있음. · 이를 해결하기 위해 적은 수의 분포를 가진 양 끝단의 정보를 범주화 등의 기법을 적용하여 식별성은 낮추는 기법. |
3.2. 가명 · 익명처리를 위한 기법
기법 | 설명 |
동형 비밀분산 | · 식별정보 또는 기타 식별 기능 정보를 메시지 공유 알고리즘에 의해 생성된 두 개 이상의 쉐어(Share, 기밀을 재구성하는데 사용되는 하위집합)로 대체한다. |
차분(차등) 프라이버시 | · 특정 개인에 대한 사전지식이 있는 상태에서 데이터베이스 질의에 대한 응답 값으로 개인을 알 수 없도록 응답값에 임의의 숫자 잡음(Noise)를 추가하여 특정 개인의 존재 여부를 알 수 없도록 하는 기법. |
3.3. 익명화 기법
기법 | 설명 |
k - 익명성 | 주어진 데이터 집합에서 같은 값이 적어도 k개 이상 존재하도록 하여 쉽게 다른 정보로 결합할 수 없도록 하는 것. |
l - 다양성 | k - 익명성에 대한 두 가지 공격(동질성 공격, 배경지식에 의한 공격)을 방어하기 위한 모델로서, 주어진 데이터 집합에서 함께 비식별되는 레코드들은 적어도 l개의 서로 다른 민감한 정보를 가져야 함. |
t - 근접성 | 값의 의미를 고려하는 프라이버시 모델로 l - 다양성의 취약점(쏠림 공격, 유사성 공격)을 보완하기 위해 활용, 동질 집합에서 특정 정보의 분포와 전체 데이터 집합에서 정보의 분포를 각각 계산하여 두 분포가 t 이하의 차이를 보여야 함. |