오늘은 심흥섭 교수님의 강의 중 3강 "빅데이터 해석과 분석 그리고 R", 4강 "R 프로그램 설치하기", 5강 "R의 실행과 활용 R지?" 총 3개의 강의를 몰아서 들었다. 다행히 주말인데다가 강의들도 길지 않아서 쉽게 들을 수 있었다. 특히 4-5강의 경우에는 들으면서 쉽게 따라할 수 있을 정도로 설명을 잘 해주셔서 좋았다.
제 3강. "빅 데이터의 해석과 분석 그리고 R"
a) R 프로그램의 역사:
"S 언어" (by 벨 연구소 John Chambers) 기반으로 뉴질랜드의 로스이하카 (Ross Ihaka)와 로버트 젠틀맨(Robert Gentleman)가 개발함
--> 이후 0.49 version (1997.04.23)이 현재 "CRAN" (일종의 저장공간)에서 사용할 수 있는 가장 오래된 version
--> 현재 (2020.05.30) 최신 버젼은 4.0.0 version
b) R 프로그램의 주요특징
1) Open source: 무료!
2) 데이터 분석
3) 강력한 그래프 기능: 시각화에 용이함
4) 데이터 핸들링 기능: CSV, Excel, SPSS, SAS 등 다양한 데이터를 불러오고 다룰 수 있음!
5) 메모리: RAM을 이용하여 데이터 처리가 빠름
c) GUI (Graphical user interface)의 종류: RGui, R studio, Microsoft Visual Studio, R Commander, 그 외 (Ex: Atom)
d) R의 주요 기능
1) 통계분석 2) 데이터 마이닝 3) 빅데이터 분석 4) Geophraphic information system 5) 웹 크롤링 6) 텍스트 마이닝
제 4강. "빅 데이터의 해석과 분석 그리고 R"
www.r-project.org
위 사이트로 들어가서 교수님이 설명해주시는 데로 따라하면 쉽게 설치할 수 있었다. 다만 강의가 2018년도 강의로 몇 가지 차이가 있었는데, 먼저 CRAN mirrors 중 우리나라(Korea)에서 설명해주신 Kt NexR은 더이상 존재하지 않아서 다른 걸 클릭해서 진행했고, 다음으로 현재 프로그램 (2020.05.30 기준)은 4.0.0. version 이었다.
또한 설치 전에 "1) 컴퓨터의 이름, 2) 사용자 이름, 3) 폴더 이름" 은 모두 특수 문자나 공백 없이, 또한 한글을 쓰지 않고 영어로 지정해야 오류가 잘 나지 않는다고 하셨다.
제 5강. "빅 데이터의 해석과 분석 그리고 R"
R 화면의 구성은 아래와 같다.
처음에는 한글로 설치하였는데, 교수님께서 R을 이용할 적에는 영어로 이용하는 것이 나중에 공부할 때도 편리하고, 이용에도 좋다고 하셔서 영어로 화면 설정을 변경해주었다.
변경 방법도 강의 자료를 바탕으로 해주면 된다. 현재 R studio가 설치되어 있지 않은 관계로 메모장을 이용해서 수정해주었다.
1) 먼저 메모장을 켜고, 파일 열기에서 "R-4.0.0" 폴더의 "etc" 폴더로 들어가서 Rconsole 파일을 연다. (파일은 txt 파일이 아니기 때문에, 모든 파일을 볼 수 있도록 한 뒤 골라주면 된다.)
2) 파일 내부에 language를 찾은 후 내용을 "language=en"으로 설정 변경해주면 된다.
짧은 강의들을 잘 들을 수 있었고, 뭔가 이제 시작이라는 느낌이다.
최근 Python을 혼자 공부하고 있는데, 뭔가 비슷한 느낌이다.
'영상의학 (Radiology) > 빅데이터 (Big data)' 카테고리의 다른 글
Big data_day 05 (빅 데이터 공부 5일차) (0) | 2020.06.02 |
---|---|
Big data_day 04 (빅데이터 공부 4일차) (0) | 2020.06.01 |
Big data_day 03 (빅데이터 공부 3일차) (0) | 2020.05.31 |
Big data _ day 01 (빅데이터 공부 1일차) (0) | 2020.05.29 |
Big data _ 빅데이터 전문가 자격증 도전!! (한국자격검정평가진흥원) (0) | 2020.05.29 |