영상의학 (Radiology)/빅데이터 (Big data)

Big data _ day 01 (빅데이터 공부 1일차)

Felix89 2020. 5. 29. 21:00

오늘은 심흥섭 교수님의 강의 중 1강 "빅데이터 넌 누구니?"와 2강 "빅데이터 니가 병맛을 알아?"를 공부하게 되었다. 처음 입문하는 강의로 1강을 좀 더 집중해서 들었고, 다양한 예시를 포함한 2강은 상대적으로 즐겁고 편하게 들을 수 있었다.


제 1강. "빅 데이터 넌 누구니?"

 a) 빅 데이터: "너무 방대하여 기존의 방법이나 도구로 1)수집/2)저장/3)분석 등이 어려운 정형 + 비정형 데이터"

 b) 데이터의 진화 과정 (강의를 바탕으로 간략히 정리해보았다.)

 c) 빅데이터의 특징

  "V"로 대표되는 특징들이 있다. 위의 3V가 기본이고 4V (Veracity - 정확성 or Value - 가치)/ 5V(veracity + value)가 될 수도 있다. 특히나 최근 Value 부분이 강조되고 있다고 말씀하셨다.

  또한 빅데이터의 특징으로 "시각화(Visualization)"을 말씀해주셨다.

  결론적으로 아직 빅데이터는 제대로 정의되지 않았지만, 여러 실시간으로 범람하는 많은 다양한 "비정형 + 정형 데이터"에서 정확하게 필요한 가치가 있는 것들을 뽑아내는 모든 과정을 의미하는 것 같다. (최대한 말씀해주신 특징들을 종합해보았다.)


제 2강. "빅데이터 니가 병맛을 알아?"

 2강은 빅데이터의 활용 유형들에 대한 설명이었고, 금융, 사회, 의료 등 전반적으로 사용된다는 설명을 포함하고 있었다.

 여러 분야에서 과거 과학적인 다양한 데이터들을 이용해서 미래를 좀 시각적으로, 사람들이 알아보기 쉽게 예측을 하는 것을 목적으로 하는 프로그램들을 소개해주셨다. 


빅 데이터에 대한 introduction으로 생각되는 1강과 2강을 들었다.

이름 그대로 "빅 데이터"라는 데이터 개념뿐 아니라 "크기가 큰 여러 비정형, 정형 데이터들을 잘 수집하고, 저장하고, 이를 분석/활용하는 일련의 과정들"을 모두 포함하는 것이 빅 데이터 분야인 것 같다.

영상의학과에서 다루는 여러 영상자료들(이미지)과 판독문, 해당하는 다양한 환자들의 임상정보 등을 종합, 이를 체계적으로 수집, 저장하고, 분석/활용하는 것들이 결국 과에서 얘기하는 빅 데이터라는 것을 알게된 느낌이다. 여러 병원에서 이런 빅 데이터 센터 등을 만들고 있는 것으로 아는데, 윤리적인 부분들도 그렇고 해결될 부분들이 많다는 얘기를 들었다. 좀 더 공부하면서 이에 대해서도 생각해 볼 수 있었으면 좋겠다.