티스토리 뷰

데이터 거버넌스 - 사람, 기술, 도구, 프로세스

 

지인의 선물로 데이터 거버넌스 : 사람, 기술, 도구, 프로세스를 읽었습니다. 요즘 거버넌스는 너무 폭넓은 뜻으로 해석되고 있는데 이 책에서는 데이터를 다루는 데 있어서 필요한 전부를 칭합니다. 책의 저자가 이야기하는 데이터 거버넌스는 아래와 같이 정의됩니다.

데이터 거버넌스(data governance)는 무엇보다도 조직이 수집한 데이터의 품질, 무결성, 보안, 사용성을 보장하는 하나의 데이터 관리 기능(data management funcion)이다. 데이터 거버넌스는 데이터를 수집, 생성한 시점부터 데이터를 폐기, 보관하는 시점까지 내내 작동해야 한다. 데이터의 그러한 수명 주기 전체에서 데이터 거버넌스는 데이터를 모든 이해관계자가 각자 손쉽게 접근할 수 있는 형태로 만드는 데 주력한다. 또한 이해관계자가 원하는 사업상의 결과물 (통찰, 분석)을 얻고 필요하다면 각종 규제 표준(regulatory standard)을 준수하는 데 데이터를 활용할 수 있게끔 하는 것도 데이터 거버넌스의 역할이다.

 

이렇게 정의된 내용을 기반으로 책 전반에 걸쳐서 데이터 거버넌스에 대해 설명합니다. 그런데... 쉽지 않습니다. 어려운 책입니다. 설령 현업에서 데이터와 관련된 직무를 맡고 있더라도 말이죠. 비즈니스 모델에 따라 데이터 거버넌스가 다르게 정의되거나 (어쩌면) 필요하지 않을 수도 있기 때문에 생소한 부분도 많을 겁니다. 하지만, 데이터의 수명주기, 데이터 품질 향상, 데이터 보호(보안)와 같은 부분의 대부분이 (데이터를 다루는) 소프트웨어 엔지니어가 고민했을 부분이라 재밌을 겁니다.

이 책에서 클라우드 예시가 필요한 경우 Google Cloud를 중심으로 설명합니다. AWS나 Azure도 언급이 되긴 하지만요. 그럴만한 게 지은이가 구글 클라우드 엔지니어들이기 때문입니다. 그렇기 때문에 부록에서 다뤄지는 "구글의 내부 데이터 거버넌스"도 아주 알찹니다. 쉽지 않은 책이지만 데이터 거버넌스에 대해 깊이 있게 배우고 싶은 분들께 일독을 권합니다. 

아래는 책을 읽으며 기억에 남는 단락입니다. 앞뒤 문장을 자르니 데이터 거버넌스와 직접적인 연관은 없어 보이지만 아주 중요한 부분이네요.

일상적으로 보도되는 보안 위험과 침해 사고의 상당수는 공용 클라우드와 관련된 것이다. 1장에서 설명했듯이, 이처럼 공용 클라우드에서 사고가 많이 일어나는 이유는 공용 클라우드에 문제가 있어서가 아니라, 공용 클라우드가 제공하는 향상된 보안 모니터링 및 감사 능력 덕분에 온프레미스에서는 오랫동안 드러나지 않았던 침해 사고가 많이 드러나기 때문일 뿐이다. 하지만 그런 사고가 언론에 많이 보도되다 보니, 다음 피해자가 자신이 될 수도 있다고 걱정하는 조직이 생기기 마련이다.
댓글
최근에 올라온 글
최근에 달린 댓글
글 보관함
Total
Today
Yesterday