R 강의

세번째 시간

김형준
Data Analyst

Contents

  1. 분석예시
  2. WordCloud
pre_processing<-function(data, start_line, end_line)
{
bodydata<-data[start_line:end_line]
bodydata<-gsub("<P align=justify></P>","",bodydata)
bodydata<-str_replace_all(bodydata, "[[:punct:]]|[a-zA-Z]|[\t+]", " ")
bodydata<-str_replace_all(bodydata, "[[:space:]][[:space:]]+", "")
bodydata<-bodydata[bodydata!=""&bodydata!=" "]
return(bodydata)
}
wordcloud_proc<-function(bodydata)
{
nouns<-sapply(bodydata,extractNoun)
wordcount <- table(unlist(nouns))
wordcount <- wordcount[nchar(names(wordcount))!=1]
return(wordcount)
}

박근혜 대통령 취임사 전문 (한겨레)

이명박 대통령 취임사 전문 (머니투데이)

노무현 대통령 취임사 전문 (한겨레)

박근혜 - 노무현

alt text

노무현 - 박근혜

alt text