영상의학 (Radiology)/빅데이터 (Big data)

Big data_day 02 (빅데이터 공부 2일차)

Felix89 2020. 5. 31. 16:44

오늘은 심흥섭 교수님의 강의 중 3강 "빅데이터 해석과 분석 그리고 R", 4강 "R 프로그램 설치하기", 5강 "R의 실행과 활용 R지?" 총 3개의 강의를 몰아서 들었다. 다행히 주말인데다가 강의들도 길지 않아서 쉽게 들을 수 있었다. 특히 4-5강의 경우에는 들으면서 쉽게 따라할 수 있을 정도로 설명을 잘 해주셔서 좋았다.


제 3강. "빅 데이터의 해석과 분석 그리고 R"

 a) R 프로그램의 역사:

   "S 언어" (by 벨 연구소 John Chambers) 기반으로 뉴질랜드의 로스이하카 (Ross Ihaka)와 로버트 젠틀맨(Robert Gentleman)가 개발함

   --> 이후 0.49 version (1997.04.23)이 현재 "CRAN" (일종의 저장공간)에서 사용할 수 있는 가장 오래된 version

   --> 현재 (2020.05.30) 최신 버젼은 4.0.0 version

 b) R 프로그램의 주요특징

  1) Open source: 무료!

  2) 데이터 분석

  3) 강력한 그래프 기능: 시각화에 용이함

  4) 데이터 핸들링 기능: CSV, Excel, SPSS, SAS 등 다양한 데이터를 불러오고 다룰 수 있음!

  5) 메모리: RAM을 이용하여 데이터 처리가 빠름

 c) GUI (Graphical user interface)의 종류: RGui, R studio, Microsoft Visual Studio, R Commander, 그 외 (Ex: Atom)

 d) R의 주요 기능

    1) 통계분석 2) 데이터 마이닝 3) 빅데이터 분석 4) Geophraphic information system 5) 웹 크롤링 6) 텍스트 마이닝


제 4강. "빅 데이터의 해석과 분석 그리고 R"

 www.r-project.org

 위 사이트로 들어가서 교수님이 설명해주시는 데로 따라하면 쉽게 설치할 수 있었다. 다만 강의가 2018년도 강의로 몇 가지 차이가 있었는데, 먼저 CRAN mirrors 중 우리나라(Korea)에서 설명해주신 Kt NexR은 더이상 존재하지 않아서 다른 걸 클릭해서 진행했고, 다음으로 현재 프로그램 (2020.05.30 기준)은 4.0.0. version 이었다.

 또한 설치 전에 "1) 컴퓨터의 이름, 2) 사용자 이름, 3) 폴더 이름" 은 모두 특수 문자나 공백 없이, 또한 한글을 쓰지 않고 영어로 지정해야 오류가 잘 나지 않는다고 하셨다.


제 5강. "빅 데이터의 해석과 분석 그리고 R"

 R 화면의 구성은 아래와 같다.

RGui 화면 구성: 메뉴, 도구 모음, 콘솔(console) + 콘솔 내의 프롬프트 (>)

 처음에는 한글로 설치하였는데, 교수님께서 R을 이용할 적에는 영어로 이용하는 것이 나중에 공부할 때도 편리하고, 이용에도 좋다고 하셔서 영어로 화면 설정을 변경해주었다.

 변경 방법도 강의 자료를 바탕으로 해주면 된다. 현재 R studio가 설치되어 있지 않은 관계로 메모장을 이용해서 수정해주었다.

 1) 먼저 메모장을 켜고, 파일 열기에서 "R-4.0.0" 폴더의 "etc" 폴더로 들어가서 Rconsole 파일을 연다. (파일은 txt 파일이 아니기 때문에, 모든 파일을 볼 수 있도록 한 뒤 골라주면 된다.)

 2) 파일 내부에 language를 찾은 후 내용을 "language=en"으로 설정 변경해주면 된다.


짧은 강의들을 잘 들을 수 있었고, 뭔가 이제 시작이라는 느낌이다.

최근 Python을 혼자 공부하고 있는데, 뭔가 비슷한 느낌이다.