글 읽기 지도에 워드 클라우드를 활용하는 방법 : 워드 아트Word Art
페이지 정보
본문
오늘은 워드클라우드 Rstudio를 활용해서 워드클라우드를 만드는 방법을 알아보려고 해요.어떤 직렬에 있던지 수요조사가 중요합니다.평균이나 빈도 처럼 정량 데이터는 분석이 쉽고 간편하지만,정성 데이터는 받으면 막막한 경우가 있습니다.물론 자료들을 범주화 하여 다시 정량화 시킬수도 있지만,단순히 어떤 의견을 썼는지 보고싶은 경우는 워드클라우드(wordcloud)가 참 좋습니다.워드클라우드는 텍스트 데이터를 시각화하는 방법 중 하나로, 텍스트에서 가장 많이 등장하는 단어를 시각적으로 표현하는 도구입니다. 주로 단어의 빈도에 따라 크기와 색상이 결정되며, 이로 워드클라우드 인해 텍스트의 주요 주제나 핵심 키워드를 한눈에 파악할 수 있습니다. 워드클라우드는 다음과 같은 장점이 있습니다:물론 '워드클라우드 생성기'사이트에서도 쉽게 만들 수 있지만,저는 발표용 ppt에는 해당 사이트에서 생성하면 생기는 워터마크가 마음에 들지 않아서Rstudio를 통해 직접 만들어서 사용합니다.먼저 RStudio는 통계 분석과 데이터 시각화를 위한 강력한 통합 개발 환경(IDE)입니다. R 프로그래밍 언어를 기반으로 하며, 데이터 과학자들과 분석가들이 데이터 분석 작업을 보다 효율적으로 수행할 수 워드클라우드 있도록 돕는 도구입니다.RStudio는 사용자 친화적인 인터페이스를 제공하며, R 코드를 작성, 실행, 시각화하는 과정을 단순하고 직관적으로 만들어 줍니다. 특히, 데이터 전처리, 분석, 시각화까지의 모든 과정을 하나의 환경에서 통합적으로 관리할 수 있어 매우 편리합니다.자 그럼 이제 코드를 공유하도록 하겠습니다.install.packages(wordcloud2) #워드클라우드 생성 패키지install.packages(tm) #텍스트 마이닝 페키지install.packages(readxl) #엑셀파일을 R로 불러오는 패키지install.packages(RColorBrewer) #데이터 시각화 생상 팔레트library(wordcloud2)library(tm)library(readxl)library(RColorBrewer)# 파일 경로 설정file_path <- C:/Users/Administrator/Desktop/sample.xlsx# 밑줄친 부분은 사용자의 PC환경에 워드클라우드 따라서 바꿔주세요.# 엑셀 파일 불러오기data <- read_excel(file_path)# 텍스트 데이터 확인head(data)# Corpus 생성corpus <- Corpus(VectorSource(data$text_column))# 데이터 전처리corpus <- tm_map(corpus, removePunctuation) # 구두점 제거corpus <- tm_map(corpus, removeNumbers) # 숫자 제거corpus <- tm_map(corpus, stripWhitespace) # 공백 제거# Term-Document Matrix 생성dtm <- TermDocumentMatrix(corpus)matrix <- as.matrix(dtm)# 단어 빈도 계산 및 데이터프레임 생성word_freqs <- sort(rowSums(matrix), decreasing =TRUE)# 1음절 단어 제거 (2음절 이상 단어만 남기기)data_frame 1, ]# 워드클라우드 워드클라우드 생성set.seed(1234) # 결과 재현성을 위해 설정# 워드클라우드 생성 및 커스터마이징wordcloud2(data_frame, size ϑ.5, # 단어 크기 조정 shape ='circle', # 워드클라우드 모양 (circle, star, diamond, triangle 등) color ϛrewer.pal(8, Dark2), # 색상 팔레트 backgroundColor =white, # 배경색 설정 rotateRatio ϐ.5) # 단어 회전 비율# 볼드처리 한 부분은 커스터마이징 부분입니다. 사용자에 따라서 바꿔서 사용하세요.자 그러면 결과를 볼까요?네 이렇게 나옵니다.좀 더 깔끔하게 워드클라우드 하기 위해서는 조사나 종결어미 등을 제거하는 작업을 하면 좋지만,다소 복잡하고, 아직 tm이 100% 마음에 들게 되지 않아서 저는 이렇게 사용합니다.기회가 된다면 2탄으로 올려보도록 할께요^^#RStudio #데이터시각화 #WordCloud #텍스트분석 #데이터분석 #데이터과학 #빅데이터 #데이터시각화툴 #R프로그래밍 #통계분석 #워드클라우드 #데이터전처리 #데이터비주얼라이제이션 #텍스트마이닝 #데이터사이언스
- 이전글청주룸싸롱 O1O.5950.5527 청주노래클럽 가경동룸싸롱 가경동노래궁 하복대룸싸롱 24.09.15
- 다음글토이말티푸 애완용강아지분양 파티푸들 보자마자 Pick! 24.09.15
댓글목록
등록된 댓글이 없습니다.