Data visualization/데이터시각화(R)
데이터시각화(R)_USA-covid19
뉴욕킴
2023. 10. 3. 05:58
1. USA-covid19.csv 자료를 읽어 USAcovid 라는 이름으로 저장하시오.
USAcovid <- read.csv("C:/Users/eznay/USA-covid19.csv")
2. 자료의 개수는?
nrow(USAcovid)
3. 변수에는 어떤 것들이 있으며 변수의 type은 무엇인가?
head(USAcovid)
str(USAcovid)
4. new_cases의 추이를 알아보려고 한다. 이에 알맞는 그림을 그리고 해석하시오.
library(ggplot2)
head(USAcovid)
USAcovid_cleaned <- na.omit(USAcovid)
ggplot(USAcovid,aes(date,new_cases))+geom_line()+labs(x='date',y='new_cases')+ggtitle('New Cases Over Time')
5. new_death의 추이를 알아보려고 한다. 이에 알맞는 그림을 그리고 해석하시오.
ggplot(USAcovid, aes(date, new_deaths)) + geom_line() + labs(x = "date", y = "new_deaths") + ggtitle("New Deaths Over Time")
6. new_vaccinations의 추이를 알아보려고 한다. 이에 알맞은 그림을 그리고 해석 하시오.
ggplot(USAcovid, aes(date, new_vaccinations)) + geom_line() + labs(x = "date", y = "new_vaccination") + ggtitle("New Vaccinations Over Time")
7. new_cases, new_death, . new_vaccinations의 추이를 함께 살펴보려고 한다. 이에 알맞은 그림을 그리고 해석하시오.
ggplot(USAcovid, aes(date)) +
geom_line(aes(y = new_cases, color = "new_cases")) +
geom_line(aes(y = new_deaths, color = "new_deaths")) +
geom_line(aes(y = new_vaccinations, color = "new_vaccinations")) +
labs(x = "Date", y = "Count", color = "Variable") +
ggtitle("Trends of New Cases, New Deaths, and New Vaccinations Over Time") +
scale_color_manual(values = c("new_cases" = "blue", "new_deaths" = "red", "new_vaccinations" = "green"))
8. total_cases,total_deaths, total_vaccinations의 관계를 살펴보기 위한 알맞은 그림 을 그리고 해석하시오
ggplot(USAcovid, aes(date)) +
geom_line(aes(y = total_cases, color = "total_cases")) +
geom_line(aes(y = total_deaths, color = "total_deaths")) +
geom_line(aes(y = total_vaccinations, color = "total_vaccinations")) +
labs(x = "Date", y = "Count", color = "Variable") +
ggtitle("Trends of Total Cases, Total Deaths, and Total Vaccinations Over Time") +
scale_color_manual(values = c("Total Cases" = "blue", "Total Deaths" = "red", "Total Vaccinations" = "green"))