본문 바로가기
자기계발

[빅데이터분석기사] - Chapter1. 빅데이터의 이해 - 3

by 스터디마형 2024. 9. 10.

04. 개인정보 개요

1) 개인정보의 정의와 판단 기준

① 개인정보의 정의

- 살아 있는 개인에 관한 정보로서 개인을 알아볼 수 있는 정보이다.

② 개인정보 판단기준

- 생존하는 개인에 관한 정보 / 정보의 내용 형태 등은 제한 없음 / 개인을 알아 볼 수 있는 정보 

- 다른 정보와 쉽게 결합하여 개인을 알아볼 수 있는 정보도 포함 

 

2) 개인정보의 이전

①  개인정보의 처리 위탁 - 개인정보를 제공하는 자의 업무 처리와 이익을 위하는 경우
② 개인 정보의 제3자 제공 - 개인정보를 제공받는 자의 업무처리와 이익을 위하는 경우

 

3) 개인정보의 보호
① 개인정보 보호 조치
② 빅데이터 개인정보 보호
③ 개인정보 보호를 위한 고려사항

 

4) 개인정보보호 관련 법률

 

05. 개인정보 법 • 제도

1) 개인정보보호법

① 개인정보보호법의 개요

- 당사자의 동의 없는 개인정보 수집 및 활용하거나 제3자에게 제공하는 것을 금지

 

② 개인정보의 범위

- 광범위한 데이터가 개인정보에 해당하여 이 법이 적용될 수 있다는 점을 유의

- 특정 개인을 알아볼 수 있는 정보 뿐 아니라 다른 정보와 결합되어 특정 개인을 알아 볼 수 있는가에 따라 결정


2) 정보통신망법( 정보통신망 이용 촉진 및 정보보호 등에 관한 법률)

① 개요

- 이용자의 동의를 받지 않고 개인정보를 수집하거나 제3자에게 개인정보를 제공X

 

3) 신용정보보호법

① 개요

- 개인신용정보를 신용정보회사 등에 제공하는 경우 동의가 필요
- 신용정보주체는 본인에 관한 신용정보를 제공하는 때에는 제공받은 자, 이용 목적, 주요 내용 등을 통보하도록 요구하거나 인터넷을 통해 조회할 수 있도록 요구할 수 있다.

- 보유한  본인정보의 데이터와 실제 데이터가 다르면 신용정보주체에 데이터 정정을 요구할 수 있다.

 

② 신용정보 범위

- 특정 신용정보주체를 식별할 수 있는 정보
- 신용정보주체의 거래내용을 판단할 수 있는 정보
- 신용정보주체의 신용도를 판단할 수 있는 정보
- 신용정보주체의 신용거래능력을 판단할 수 있는 정보
- 그 밖의 위의 항목들과 유사한 정보

 

③ 개인신용정보

- 개인신용정보란 신용정보 중 개인의 신용도와 신용거래능력 등을 판단할 때 필요한 정보를 말한다.

* 성명과 연락처만을 처리하는 경우에는 개인정보를 처리하는 것이며 함께 처리하는 경우에는 개인신용정보를 처리하는 것으로 해석된다.

 

4) 데이터 3법의 주요 개정 내용

* 데이터 3법

- 개인정보 보호법

- 정보통신망 이용촉진 및 정보보호 등에 관한 법률

- 신용정보의 이용 및 보호에 관한 법률

 

 

[ 개정 내용 ]

- 데이터 이용 활성화를 위해 가명정보의 개념을 도입하고, 데이터간 결합 근거를 마련
- 개인정보보호 관련 법률의 유사하거나 중복된 규정을 정비 및 거버넌스 체계 효율화
- 데이터 활용에 따른 개인정보처리자의 책임을 강화
- 다소 모호했던 개인정보의 판단기준을 명확화

 

*개인정보를 개인정보, 가명정보, 익명정보로 구분
*가명정보는 연구, 공익적 목적을 위하여 사용.

 

* 가명정보란 무엇인가? 

개인정보 일부를 삭제, 대체하는 등 가명처리함으로써 원래 상태로 복원하기 위한 추가 정보의 사용, 결합 없이는 특정개인을 알아볼 수 없는 정보

 


06. 개인정보 비식별화

1) 개인정보 비식별화의 개용

① 비식별 정보

- 개인정보 비식별 조치 가이드라인에 따라 '비식별조치'된 정보

 

* 익명데이터는 데이터를 수집하는 단계에서 특정 개인을 식별할 수 없는 형태로 수집하는 것으로 비식별 정보와는 특성이 다르다.

 

② 비식별 조치

- 정보의 집합물에서 개인을 식별 할 수 있는 요소를 전무 또는 일부 삭제, 대체 등의 방법을 통해 개인을 알아볼 수 없도록 조치

 

③ 비식별 정보의 활용

- 개인정보가 아닌 정보로 추정되므로 정보주체로부터으ㅟ  별도의 동의없이 해당 정보를 이용하거나 제3자에게 제공할 수 있다.

 

④ 비식별 정보의 보호

- 새로운 결합 기술이 나타나거나 결합 가능한 정보가 증가하며 정보주체가 재식별 될 가능성이 존재하는데, 이 경우 정보 이용자는 반드시 개인정보를 파기하여야 한다

 

2) 개인정보 비식별 조치 가이드 라인

- 데이터를 이용 과정에서 개인정보 침해 방지를 위해 개인정보를 비식별 조치하는 정차 및 방법에 대한 가이드라인으로 개인정보를 비식별 조치하여 이용 또는 제공하는 사업자 등이 준수해야할 기준

 

[개인정보 비식별화 조치 가이드라인의 단계별 조치사항]

단계 조치사항 데이터
사전검토 개인정보에 해당되는지 여부 검토 개인정보, 식별정보
비식별조치 개인을 식별할 수있는 요소 전부 또는 일부 삭제 또는 대체하여 알아보지 못하게 조치 가명, 총계, 범주화, 마스킹
적정성 평가 다른 정보와 쉽게 결합하여 개인을 식별할 수 있는지를 평가 k - 익명성, l - 다양성, t - 근접성
사후 관리 비식별 정보 안전초이, 재식별 가능성 모니터링 등 재식별 방지를 위해 필요한 조치 수행 관리적 / 기술적 보호조치

출처 : http://www.itdaily.kr/news/articleView.html?idxno=100243

 

* k - 익명성, l - 다양성, t - 근접성 상세 참조 : https://12bme.tistory.com/163

 

 

 [개인정보 비식별화 조치 가이드라인의 단계별 조치방법]

가명처리 • 개인정보 중 주요식별요소를 다른 값으로 대체 ex) 홍길동 : 35세, 한국대 재학
> 임꺽정 : 30세, 국제대 재학
총계 처리 • 데이터의 총합 값을 보여주고 개별 값을 보여 주지 않는 방법 ex) 임 : 180cm , 홍 : 170cm, 이 : 160 cm
> 학생 키 합 : 510 cm / 평균 170 cm
데이터 삭제 데이터 공유나 개방 목적에 따라 필요없는 값 또는 개인식별에 중요한 값을 삭제하는 방법 ex) 주민등록번호 901206-xxxxxx
> 90년대생, 남자
데이터 범주화 데이터 값을 범주의 값으로 변환하여 값을 숨기는 방법 ex) 홍길동 35세
> 홍씨 , 30~40세
데이터 마스킹 개인을 식별하는게 기여가 높은 식별자는 보이지 않게 처리 ex) 홍길동 35세, 서울 거주, 한국대 재학
>> 홍ㅇㅇ, 서울 거주, ㅇㅇ대 제학

 

 

07. 개인정보 활용

1) 데이터 수집의 위기와 통제 방안

① 사생활 침해로 위기 발생

* 사생할 침해 우려는 민간 뿐만이 아닌 정부의 정보 수집에서도 나타나고 있다.

- 특정  데이터가 본래 목적 외로 가공되어 다른 목적으로 사용될 가능성이 커지고 있다.

* 개인정보는 본래의 1차목정 외 가공, 유통, 활용되고 있다.(법률과 규정이 정한 범위 내에서 가공하고 활용하는 것이 허용)

 

② 동의에서 책임으로 강화하여 통제

* 개인정보 활용에 대해 개인이 매번 동의하는 것은 어려운 일이며, 경제적으로 비효율적이므로 사용자 책임을 강화

- 개인정보 사용으로 발생하는 피해에 대해서는 개인정보 사용자가 책임을 지게 한다.

- 개인정보를 사용하느 주체가 익명화 기술 같은 더 적극적인 보호 장치를 마련하게 하는 효과가 있을 것으로 기대된다.

 

* 익명화 : 사생활 침해를 방지하기 위해 데이터에 포함된 개인정보를 삭제하거나 알아볼 수 없는 형태로 변환하는 방법

2) 데이터 활용의 위기 요인과 통제 방안

①책임 원칙 훼손으로 위기 발생
빅데이터 분석에 따른 예측 기술의 향상으로 분석대상이 되는 사람들이 알고리즘의 희생양이 되는 것

 

② 결과 기반 책임 원칙 고수로 해결
ex) 범죄 예측 프로그램으로 아직 범죄를 저지르지 않았는데 체포됨


3) 데이터 처리의 위기 요인과 통제 방안
① 데이터 오용으로 위기 발생

- 빅데이터가 잘못된 예측 결과를 도출한다.

* 잘못된 인사이트를 도출하여 비즈니스에 활용할 경우 더 많은 손실이 발생할 수 있다.

 

② 알고리즘 접근을 허용하여 통제