데이터시각화(R)_Covid19
https://ourworldindata.org/는 잉글랜드와 웨일즈에 등록된 자선단체인 Global Change Data Lab 의 프로젝트로 빈곤, 질병, 기아, 환경 문제, 전쟁, 사회적 불평등 등의 대규모 국제 문제를 다 루는 과학 온라인 간행물이다. 2020년 코로나19로 인해 Our World in Data는 코로나19 대유행 에 대한 글로벌 데이터 및 연구를 게시하는 선도적인 조직 중 하나가 되었다.
https://github.com/owid/covid-19-data/tree/master/public/data 에서 download한 owid-coviddata.csv 의 자료 중 한국에 대한 자료만을 KOREA-covid19.csv에 저장하였다.
KOREA-covid19.csv를 살펴보고 해석하시오
KOR = read_csv("./data/KOREA-covid19.csv")
library(tidyverse)
KOR = read_csv("./data/KOREA-covid19.csv")
KOR
View(KOR)
ggplot(KOR,aes(date,new_cases))+geom_line()
KOR$date[1]
- 데이터 프레임 KOR의 date 열 중 첫 번째 항목을 출력
class(KOR$date[1])
- KOR 데이터 프레임의 date 열 중 첫 번째 항목의 데이터 타입을 확인
KOR$date[1]-KOR$date[2]
- KOR 데이터 프레임의 date 열의 첫 번째 항목과 두 번째 항목 간의 날짜 차이를 계산
"2020-01-01"
as.Date("2020-01-01")
문자열 "2020-01-01"을 날짜 형식으로 변환
"2020-01-01"-"2020-12-31"
as.Date("2020-01-01")-as.Date("2020-12-31")
ggplot(KOR,aes(date,new_cases))+geom_line()+
+ xlim(as.Date("2020-01-01"),as.Date("2020-12-31"))
- ggplot을 사용하여 데이터 프레임 KOR에서 날짜(date)와 신규 확진자 수(new_cases)를 시각화합니다. xlim 및 ylim을 사용하여 x축과 y축의 범위를 설정합니다. 이를 통해 2020년 1월 1일부터 2020년 12월 31일까지의 신규 확진자 수를 시각화하고 그래프의 x축 범위를 "2020-01-01"에서 "2020-12-31"로 제한하고 y축 범위를 0에서 1500으로 제한
ggplot(KOR,aes(date,new_cases))+geom_line()+
+ xlim(as.Date("2020-01-01"),as.Date("2020-12-31"))+
+ ylim(0,1500)
ggplot(KOR,aes(date,new_cases))+geom_line()+
+ xlim(as.Date("2021-01-01"),as.Date("2021-12-31"))
ggplot(KOR,aes(date,new_cases))+geom_line()+
+ xlim(as.Date("2021-01-01"),as.Date("2021-12-31"))+
+ ylim(0,10000)
ggplot(KOR,aes(date,new_cases))+geom_line()+
+ xlim(as.Date("2022-01-01"),as.Date("2022-12-31"))
ggplot(KOR,aes(date,new_cases))+geom_line()+
+ xlim(as.Date("2023-01-01"),as.Date("2023-12-31"))
https://en.wikipedia.org/wiki/Variants_of_SARS-CoV-2
Error: unexpected '/' in "https:/"
ggplot(KOR,aes(date,new_deaths))+geom_line()
ggplot(KOR,aes(date,new_vaccinations))+geom_line()
death = c(KOR$new_deaths)
case = c(KOR$new_cases)
vaccin = c(KOR$new_vaccinations)
death = c(KOR$new_deaths)
case = c(KOR$new_cases)
vaccin = c(KOR$new_vaccinations)
dateAll = rep(c(KOR$date),3)
plot.data = data.frame(date = dateAll,
+ var = c(rep("new_cases",length(case)),
+ rep("new_deaths",length(death)),
+ rep("new_vaccinations",length(vaccin))),
+ value = c(case,death,vaccin))
ggplot(plot.data,aes(date,value))+
+ geom_line()+
+ facet_wrap(~var)
ggplot(plot.data,aes(date,value))+
+ geom_line()+
+ facet_wrap(~var,ncol=1)
ggplot(plot.data,aes(date,value))+
+ geom_line()+
+ facet_wrap(~var,ncol=1,scale="free_y")
plot.data$year = year(plot.data$date)
ggplot(plot.data,aes(date,value))+
+ geom_line()+
+ facet_grid(var~year,scale="free")
ggplot(plot.data[plot.data$year==2020,],aes(date,value))+
+ geom_line()+
+ facet_grid(var~year,scale="free")