영상의학 (Radiology)/빅데이터 (Big data) 8

Big data_day 07 (빅 데이터 공부 7 일차)

오늘은 심흥섭 교수님의 남은 강의 2강을 끝내고, 마침내 시험까지 마무리 지었고, 최종적으로 자격증을 취득할 수 있었다. 제 19강. "데이터 불러오기" 실제로 저장된 데이터를 처리하고 활용하기 위해서 가장 먼저 해야할 일이다. a) 텍스트 데이터 불러오기 텍스트 데이터의 경우에는 read.table() 함수로 불러올 수 있고, 세부적으로 "(1) 구분자가 공백인 경우", "(2) 구분자가 ,(comma)인 경우", "(3) 구분자가 tap인 경우" 3가지로 구분하여 배웠다. 함수 내부에 sep, 즉 구분자들에만 차이를 주면 된다. 참고로 header=TRUE는 텍스트 데이터 내부의 head들을 그대로 적용하는 것을 의미한다. (ex: 이름, 성명, 나이 등...) (1) 구분자가 공백인 경우 불러올 데..

Big data_day 06 (빅 데이터 공부 6일차)

오늘은 심흥섭 교수님의 강의 중에서 제 16강 데이터 프레임 생성하기, 제 17강 패키지의 개념, 제 18강 패기지의 활용을 연속으로 이어서 들을 수 있었다. 이제 내일 20강까지 들으면 수업이 끝난다. 제 16강. "데이터 프레임 생성하기" a) 데이터 프레임(Data frame): 행렬처럼 행과 열로 구성되어 있으나, 행렬과 달리 여러 가지 데이터 유형을 가질 수 있음! - 생성하는 방법: 외부 데이터(CSV, Excel) 등을 읽어오는 경우, 데이터 프레임으로 형성이 되며, 새롭게 만들려면 data.frame()함수를 사용하여 만들 수 있다. - 기본적으로 data.frame() 함수에서 내부는 요인(factor)으로 구분되나 "stringsAsFactors=FALSE"라고 해주면 내부는 그 원형의..

Big data_day 05 (빅 데이터 공부 5일차)

오늘은 심흥섭 교수님의 강의 중에서 제 13강 데이터의 구분/벡터의 속성, 14강 요인/행렬, 15강 배열/리스트 총 3가지 강의를 들었다. 3개의 강의가 상당히 연속성이 있는 강의로 느껴졌다. 뭔가 Python이 상대적으로 쉬운 언어라는 얘기를 들은 적이 있는데, 맞는 말인 거 같다 ?! 제 13강. "데이터의 구분/벡터의 속성" a) 벡터(Vector)의 속성 "데이터의 유형" + "원소(element)의 개수" + "원소(element)의 이름" 1) 데이터 유형을 확인하는 방법: mode(v), is.numeric(v), is.character(v), is.logical(v), is.complex(v) 2) 원소의 개수 확인하는 방법: length(v) 3) 원소의 이름은 새롭게 부여하는 방법: ..

Big data_day 04 (빅데이터 공부 4일차)

오늘은 심흥섭 교수님의 강의 4가지 강의를 몰아서 들었다. 본격적으로 연산자들을 배우고, 벡터 생성에 대한 여러가지 함수들을 배워보았다. 아직까지는 초급 단계를 배우고 있는 거 같다. 제 9강. "R의 연산자" a) 연산자의 종류 1) 산술 연산자 (Arithmetic operator) 산술 연산자 종류 설명 예시 예시 결과 + 더하기 2+7 9 - 빼기 2-7 -5 * 곱하기 2*7 14 / 나누기 7/2 3.5 ** 거듭제곱 2^10 1024 ^ 거듭제곱 2**10 1024 %/% 몫 17%/%4 4 %% 나머지 17%%4 1 --> 평소 계산할 때와 마찬가지로 순서가 있고, 평소와 동일하게 생각하면 되는 것 같다. (1) () 괄호 먼저 계산 --> 거듭제곱 --> 곱하기, 나누기 --> 더하기, ..

Big data_day 03 (빅데이터 공부 3일차)

오늘은 심흥섭 교수님의 강의 중 6강 "R의 기본 사용법/R Studio 프로그램의 기능/R studio 프로그램 설치 단계", 7강 "R studio 프로그램 실행하기", 8강 "R/R Studio 설치 후 체크 포인트" 총 3개의 강의를 들었다. 역시나 아직까지 설치단계 위주로 본격적인 수업에 앞선 준비 단계인 듯했다. 제 6강. "R의 기본 사용법/R Studio 프로그램의 기능" www.rstudio.com 위 홈페이지에 접속해서 install을 찾아서 설치해주면 된다. 교수님 설명은 조금 예전 version으로 차이가 있다. 다음과 같이 product의 RStudio에서 open source를 선택해서 다운로드를 진행하면 된다. 다운로드 진행 후 설치 하기 이전에 이전 R 설치시의 주의점과 같이..

Big data_day 02 (빅데이터 공부 2일차)

오늘은 심흥섭 교수님의 강의 중 3강 "빅데이터 해석과 분석 그리고 R", 4강 "R 프로그램 설치하기", 5강 "R의 실행과 활용 R지?" 총 3개의 강의를 몰아서 들었다. 다행히 주말인데다가 강의들도 길지 않아서 쉽게 들을 수 있었다. 특히 4-5강의 경우에는 들으면서 쉽게 따라할 수 있을 정도로 설명을 잘 해주셔서 좋았다. 제 3강. "빅 데이터의 해석과 분석 그리고 R" a) R 프로그램의 역사: "S 언어" (by 벨 연구소 John Chambers) 기반으로 뉴질랜드의 로스이하카 (Ross Ihaka)와 로버트 젠틀맨(Robert Gentleman)가 개발함 --> 이후 0.49 version (1997.04.23)이 현재 "CRAN" (일종의 저장공간)에서 사용할 수 있는 가장 오래된 ver..

Big data _ day 01 (빅데이터 공부 1일차)

오늘은 심흥섭 교수님의 강의 중 1강 "빅데이터 넌 누구니?"와 2강 "빅데이터 니가 병맛을 알아?"를 공부하게 되었다. 처음 입문하는 강의로 1강을 좀 더 집중해서 들었고, 다양한 예시를 포함한 2강은 상대적으로 즐겁고 편하게 들을 수 있었다. 제 1강. "빅 데이터 넌 누구니?" a) 빅 데이터: "너무 방대하여 기존의 방법이나 도구로 1)수집/2)저장/3)분석 등이 어려운 정형 + 비정형 데이터" b) 데이터의 진화 과정 (강의를 바탕으로 간략히 정리해보았다.) c) 빅데이터의 특징 "V"로 대표되는 특징들이 있다. 위의 3V가 기본이고 4V (Veracity - 정확성 or Value - 가치)/ 5V(veracity + value)가 될 수도 있다. 특히나 최근 Value 부분이 강조되고 있다고..

Big data _ 빅데이터 전문가 자격증 도전!! (한국자격검정평가진흥원)

영상의학과 전공의 생활을 하면서 느꼈던 앞으로 가장 각광받는 분야로는 "인공지능(artificial intelligence)"와 "빅 데이터(Big data)"가 아니었나 싶다. 실제로 학회에 가면 이와 관련된 강연도 굉장히 많았고, 논의가 많이 이루어졌던 것 같다. 인공지능에 대해서는 작년 1년간의 펠로우 생활을 하면서 급격하게 관심을 많이 가지게 되었고, 이에 따라서 금년에 "2020년도 의료 인공지능 전문가 양성과정"에 지원해보았지만, 아쉽게도 서류발표에서도 떨어지고 말았다. 덕분에 시간이 조금 여유가 생겨서 어떤 공부를 해볼까 하다가 "빅 데이터 전문가 자격증 (한국자격검정평가진흥원)"이라는 것이 있다는 것을 알게 되었고, 이에 공부를 시작해보게 되었다. 온라인 강의를 들으며 출석률 60% 이상을..