[ET단상]빅데이터에 관한 단상

빅데이터, 빅데이터에 기반을 둔 인공지능(AI), 사물인터넷(IoT) 등으로 대표되는 제4차 산업혁명이 사회 전반에 걸쳐 뜨거운 이슈로 떠올랐다.

빅데이터 등에 관심을 기울이는(기울일 수밖에 없는) 까닭은 이런 4차 산업혁명이 본격화되면 투자자본수익률(ROI:투자비용 대비 수익률)이 높은 순서대로 직업군이 사라질 것이라는 예측이 난무하고, 직업으로는 변호사가 늘 상위에 거론되고 있기 때문이다.

빅데이터의 가장 큰 효용은 예측 기능, 빅데이터의 가장 큰 문제는 개인 정보 침해라고 한다.

찾아오는 의뢰인 대부분은 사건의 결과(승패 또는 그 확률)를 예측해 달라고 요구한다. 이에 반해 의뢰인이 말하고 제시한 증거 등에 기초해 볼 때 다퉈볼 만한 가치가 있는 경우 예측 의미 없음(또는 부질없음)을 애써 설명하고, 결과를 예측하는 대신 합심해서 최선을 다해 다퉈 볼 것을 권유하는 쪽으로 상담을 한다.

빅데이터든 알파고든 “이 케이스는 이러이러한 사실에 기초해서 판단하건대 승소율이 53.29%이겠군요”라고 예측한다면 의뢰인 입장에서는 (소수점 아래 숫자 때문인지는 몰라도) 왠지 모르게 더욱 신뢰할 수 있을 것 같다는 점은 부인하기 어렵다.

하지만 살아가면서 예측을 통해 어떤 결론을 예측할 `필요`가 있는 경우가 과연 얼마나 있을까 하는 것이 내 주관에 따른 생각이다. (역시 지극히 주관에 따른 생각이지만) 어떠한 결론을 예측하기보다 개별 사안에 당면해 그 개별성에 집중하는 과정을 중시하면서 일단 판단을 유보하고, 그러한 유보 속에서 천천히 자연스럽게 결론이 도출되게 만드는 것이 훨씬 바람직하다고 생각한다.

왜냐하면 예측은 어디까지나 숫자에 불과한 확률일 뿐이고, 그 확률이 주는 무거움은 결국 반대 결과가 나왔을 때 순식간에 단순한 숫자에 불과한 것으로 전락할 것이기 때문이다.

또 모든 케이스가 그 자체로 고유하듯 모든 개인 정보(해당 정보만으로는 특정 개인을 알아볼 수 없다 하더라도 다른 정보와 쉽게 결합해 알아볼 수 있는 이른바 개인 식별 `가능` 정보를 포함해)는 개별 정보 주체의 고유한 영역이기 때문에 이와 같은 개별 및 구체화된 개인 정보가 `차세대 창조경제의 무궁무진한 먹거리 산업` `4차혁명의 도래` 등 추상성 구호에 양보해서는 안 된다.

정부는 지난 30일 관련 부처 `합동`으로 개인 정보 비식별화 가이드라인과 법령 해설서를 발표하면서 “개인정보 보호에 대한 규정이 발달한 EU의 최신 익명화 기술과 평가방법을 참조해 마련한 것으로, EU의 익명화 수준과 비교할 때 `전반적으로` 비슷하거나 엄격한 수준”이라고 강조했다.

관련 부처 `합동`으로 마련한 가이드라인 등이 `전반적으로` 엄격한 수준의 개인 정보 보호를 이뤄낼 수 있을지 의구심이 드는 것은 가이드라인 및 해설 지침이 데이터를 많이 보유한 대기업에 유리한 기준이라는 등의 비판이 있기 때문만은 아닐 것이다. 정부의 발표와 대책이 국민 실생활에서 적용될 때마다 반복돼 온 부조리한 경험칙 때문일 것이다.

사법연수원 시절에 들은 김훈 선생님의 특강 내용(아래와 같은 전문가가 된다면 `알파고 따위는 전혀 두렵지 않을 텐데`라는 자책 내지 희망을 포함해서)으로 마친다.
“의사나 법률가나 모두 개인의 개별 문제를 진단하고 처방하는 전문가지요. 허리가 아파 병원에 간 적이 있습니다. 의사는 묻더군요. `앉을 때와 일어설 때 언제 더 아픕니까?` 저는 대답할 수 없었습니다. 앉을 때는 앉을 때의 아픔, 일어설 때는 일어설 때의 (참을 수 없기는 마찬가지인) 아픔이 있었기 때문이지요. 의사는 약간 짜증스럽게 다시 묻더군요. `그래도 더 아픈 쪽이 있을 것 아닙니까?` 아마도 그 의사의 텍스트에는 일어설 때 더 아픈 경우와 앉을 때 더 아픈 경우 처방 매뉴얼이 다르게 나와 있기 때문일 겁니다. 저는 여러분이 이런 전문가가 되지 않기를 바랍니다. 개별 사건의 그 고유한 개별성을 무겁게 받아들이고 그 개별 문제를 해결하기 위해 천착하는 법률가가 되길 기대합니다.”

[ET단상]빅데이터에 관한 단상

민우기 민우기법률사무소 변호사 minwoogi0111@gmail.com