모든 과정의 출처는 개인적으로 수강 중인 강의에 있습니다. 

 

1. 라인 차트 꾸미기 (하이라이트, 주석)

 

2. 영역 차트, 워드 클라우드, 히스토그램

 

3. 방탄소년단 앨범 워드 클라우드

앨범을 선택하면 그에 따른 워드 클라우드 사진을 보여준다.

워드 클라우드는 파이썬으로 만든 것이다. (강사님이)

 

'Software > Tableau' 카테고리의 다른 글

[Tableau] 기초 시각화 연습  (0) 2021.02.07
[Tableau] 기초 연습  (0) 2021.02.07
[Tableau] 태블로 & 지도 시각화  (2) 2021.01.17

1. 색으로 시각화한 라인 차트

 

 

2. 맵에 시각화한 차트

 

3. 크기로 시각화한 막대 차트

 

4. 원과 색으로 시각화한 파이 차트

'Software > Tableau' 카테고리의 다른 글

[Tableau] 초급 데이터 시각화 활용  (0) 2021.02.07
[Tableau] 기초 연습  (0) 2021.02.07
[Tableau] 태블로 & 지도 시각화  (2) 2021.01.17

따로 명시하지 않은 모든 데이터는 태블로에 기본적으로 저장되어 있는 Sample - Superstore 데이터를 활용했다.

 

1. 막대 차트

 

 

2. 서버 데이터 - 구글 스프레드 시트 활용하여 연결

 

www.worldometers.info/coronavirus/

 

Coronavirus Update (Live): 106,400,532 Cases and 2,321,743 Deaths from COVID-19 Virus Pandemic - Worldometer

COVID-19 Coronavirus Pandemic Last updated: February 07, 2021, 10:11 GMT Coronavirus Cases: 106,400,532 Active Cases 25,876,367 Currently Infected Patients 25,917,355 (99.6%) in Mild Condition 104,335 (0.4%) Serious or Critical Show Graph Closed Cases 80,5

www.worldometers.info

 

 

3. 데이터 전처리, 피벗 사용

 

 

4. 데이터 관계

 

 

 

'Software > Tableau' 카테고리의 다른 글

[Tableau] 초급 데이터 시각화 활용  (0) 2021.02.07
[Tableau] 기초 시각화 연습  (0) 2021.02.07
[Tableau] 태블로 & 지도 시각화  (2) 2021.01.17

0. R과 R Studio 설치

R 설치: http://cran.r-project.org 

 

The Comprehensive R Archive Network

 

cran.r-project.org

 

R Studio 설치: http://www.rstudio.com 

 

RStudio | Open source & professional software for data science teams

RStudio provides free and open source tools for R and enterprise-ready professional software for data science teams to develop and share their work at scale.

rstudio.com

 

1. 저장할 폴더 지정하기 (Working Directory)

Session 메뉴에서 Set Working Directory > Choose Directory 를 누른 뒤 원하는 폴더를 선택하면 그 폴더에 앞으로 스크립트 등이 저장된다. 그리고 이 작업은 매번 RStudio를 실행할 때마다 해주어야 한다.

 

2. attach( ) & detach( )

attach(변수명) , detach(변수명)

 

원래 R에서 데이터를 이용할 때에는 일일히 데이터명$변수명 형식으로 입력을 해주어야 했다.

예를 들어 student 데이터의 grade 속성의 평균을 구하려면 mean(student$grade) 이렇게 입력해야 하는 것이다.

하지만, attach 함수를 이용하면 student$ 는 입력하지 않고, 그냥 mean(grade) 라고 적을 수 있다.

그리고, attach 함수를 해제하는 함수가 detach() 이다. 

detach를 한 후에는 다시 데이터명$변수명 형식으로 써야한다.

 

이번 예제에서는 Rstudio에서 기본적으로 제공하는 mtcars 데이터를 이용했다.

3. 산포도 plot( )

plot(x) / plot(x, y)

 

plot함수는 기본적으로 값을 점으로 나타내는 산포도를 그리는 함수이다.

변수를 한 개만 넣으면 자동으로 index가 생성된다.

이번 예제에서는 자동차의 연비와 무게의 관계를 보기 위해 무게를 x축으로, 연비를 y축으로 설정했다.

 

 

plot(x, y, type = "l") 과 같이 타입을 적어주면 직선으로 연결된 그래프를 보여준다.

l(line), d(density) 등이 있다.

col = "blue" 와 같이 입력해주면 색을 바꿀 수 있다.

 

type = "o" 는 선과 점을 같이 표현한다.

4. abline( )

abline(a= , b= ) / abline(h= ) / abline(v= )

 

abline은 그래프에 선을 긋는 함수이다.

첫번째 식은 대각선을 긋는 함수이다. y=a+bx 인 직선함수를 넣는 것이다. 따라서 a는 y절편, b는 기울기를 말한다.

두번째 식은 수평선을 긋는 함수이다. h=3 을 넣으면 y=3 직선을 그린다.

세번째 식은 수직선을 긋는 함수이다. v=4 를 넣으면 x=4 직선을 그린다. 

이 식도 col=" " 속성으로 색을 바꿀 수 있다.

 

 

이 예제에서는 abline 안에 lm(mpg~wt) 를 넣었다. 

lm( ) 은 단순회귀분석을 하는 함수이다. 

아래 콘솔에 lm(mpg~wt)를 실행시켜보았더니 intercept가 37.285, wt가 -5.344가 나왔다.

이것은 두 변수가 mpg(y) = 37.285 - 5.344wt 의 관계를 갖는다는 것이다.

 

따라서 이 함수를 abline에 넣으면 위와 같은 직선이 그려진다.

 

그리고 title(" ") 함수는 plot 위에 제목을 붙여주는 함수이다.

 

5. 그래프 PDF로 저장

 

dev( ) 함수는 여러 그래픽 기능을 제어하는 함수이다.

dev.set( )으로 시작하고, dev.off( )로 끝낸다. 사실 dev.set( )은 안해도 된다.

 

plot결과를 pdf로 저장하기 위해 pdf("제목") 함수를 실행한다.

 

그리고 위의 예제와 똑같이 그래프를 그려준 뒤 dev.off( )를 해주면 처음에 지정해준 폴더에 pdf파일이 저장된다.

 

이렇게 파일이 저장된 것을 확인할 수 있다.
pdf파일을 실행하면 이렇게 그래프가 저장된 것을 볼 수 있다.

 

pdf 외에도 이미지 저장 함수로는 win.metafile(), png(), jpeg(), bmp(), tiff(), xfig(), postscript() 가 있다.

5-1. 바로 이미지/PDF로 저장하기 

plot을 만들고 Export를 누르면 다음과 같이 이미지 또는 PDF 파일로 저장할 수 있다.

 

1. 태블로 시작하기

www.tableau.com/ko-kr/trial/tableau-software?utm_campaign_id=2017049&utm_campaign=Prospecting-CORE-ALL-ALL-ALL-ALL&utm_medium=Paid+Search&utm_source=Naver&utm_language=KR&utm_country=SoKOR&kw=TABLEAU&adgroup=brandsearchad&adused=

 

질문이 떠오르는 즉시 답해 보십시오

질문이 떠오르는 즉시 답해 보십시오 Tableau 무료 평가판 사용해 보기 풀-버전 평가판 신용 카드가 필요하지 않습니다.

www.tableau.com

태블로는 이곳에서 다운로드 받을 수 있다.

원래는 구매를 해야 하는데, 대학생과 교수한테는 학교 이메일을 사용하면 무료로 프로그램을 제공해준다.

 

태블로는 비즈니스 인텔리전스와 분석 소프트웨어로, 데이터 시각화 프로그램이다. 

아직 우리나라에서 많이 쓰이진 않지만 전세계적으로는 아주 많이 사용되는 프로그램이라고 한다.

 

2. 데이터 다운로드 하기

직접 데이터를 수집할 수도 있지만, 정부에서 제공하는 공공 데이터를 활용할 수 있다.

data.seoul.go.kr/

 

서울 열린데이터광장

모든 서울시민을 위한 공공데이터 열린데이터광장에서 서울시와 연계 기관이 공개한 공공데이터를 확인하실 수 있습니다. 서울시와 관련된 다양한 공공데이터를 확인해 보세요.

data.seoul.go.kr

www.data.go.kr/

 

공공데이터 포털

국가에서 보유하고 있는 다양한 데이터를『공공데이터의 제공 및 이용 활성화에 관한 법률(제11956호)』에 따라 개방하여 국민들이 보다 쉽고 용이하게 공유•활용할 수 있도록 공공데이터(Datase

www.data.go.kr

각각 서울시 데이터 광장과 전국 공공데이터 포털이다. 

생각보다 많은 데이터들을 공유하고 있어서 스스로 프로젝트를 진행할 수도 있을 것 같다.

 

이번 실습은 공공데이터 포털에서 서울과 부산의 상가 정보 데이터를 활용했다.

 

3. 태블로 시작하기

태블로를 시작하면 이렇게 화면이 뜬다. 

왼쪽 배너에서 사용할 데이터 타입을 선택하고, 파일을 불러오면 된다.

이번 실습에서 사용할 데이터는 csv 파일로, 텍스트 파일을 선택하면 된다.

 

상가 데이터를 불러온 모습이다. 

 

가장 위에 파란 글씨로 써져있는 것은 데이터 타입 느낌의 분류체계이다. Abc는 문자열, #은 상수, 지구 모양은 지리에 관한 것이다. 그리고, 이 파일의 경우는 분류가 F1, F2 등으로 되어있는데, 이 부분을 더블클릭해서 원하는 인덱스명으로바꿀 수 있다. 뒤에서 시각화 할 때 구분하기 쉽도록 미리 바꿔놓는 것이 좋다.

 

이러한 식으로 분류할 수 있다.

 

본격적으로 시각화를 하기 위해 시트1 옆에 있는 작은 버튼 (새 워크시트) 을 눌러준다.

 

그러면 이러한 창이 뜬다.

 

1) 막대 그래프

 

"필터" 부분에 '시도명' 테이블을 가져와서 서울과 부산 중 서울만 선택했다.

표는 대분류를 열로, 측정값을 행으로 하여 대분류에 따른 데이터 수를 막대 그래프로 시각화했다.

간단하게 옆의 테이블에서 끌어와서 원하는 부분에 놓으면 된다.

 

필터에 '시군구' 테이블을 가져와서 용산구의 값만 나타냈다. 

그래프 왼쪽에 Y축 부분에 마우스를 가져가면 오름차순, 내림차순 정렬도 할 수 있다.

 

2) 지도

 

다음은 지도에 시각화하기 위해 데이터 파일에 포함되어 있었던 '경도'와 '위도'를 각각 열과 행에 넣어줬다.

그러면 이렇게 지도가 나온다. 맵 - 맵 계층에 들어가서 스타일도 변경할 수 있다.

 

서울에 있는 데이터들만 표현한 것이다.

"마크"에서 모양, 크기, 색상 등을 변경할 수 있다.

 

확대해보면 한강 위에 정보가 찍혀있는 오류도 발견할 수 있다.

 

"마크"에서 모양을 변경하여 밀도도 확인할 수 있다.

 

"필터"에 '시군구'와 '대분류'를 포함하여 용산구에 있는 학문/교육 시설만 나타낸 것이다.

이러한 식으로 원하는 정보를 지도 위에서 시각화하고, 비교할 수 있다.

'Software > Tableau' 카테고리의 다른 글

[Tableau] 초급 데이터 시각화 활용  (0) 2021.02.07
[Tableau] 기초 시각화 연습  (0) 2021.02.07
[Tableau] 기초 연습  (0) 2021.02.07

+ Recent posts