로고

메시프코리아
로그인 회원가입
  • 고객센터
  • 자료실
  • 고객센터

    유용한 자료입니다.

    자료실

    유용한 자료입니다.

    글 읽기 지도에 워드 클라우드를 활용하는 방법 : 워드 아트Word Art

    페이지 정보

    profile_image
    작성자 Ringo
    댓글 댓글 0건   조회Hit 8회   작성일Date 24-09-15 09:41

    본문

    오늘은 워드클라우드 Rstudio를 활용해서 워드클라우드를 만드는 방법을 알아보려고 해요.어떤 직렬에 있던지 수요조사가 중요합니다.평균이나 빈도 처럼 정량 데이터는 분석이 쉽고 간편하지만,정성 데이터는 받으면 막막한 경우가 있습니다.​물론 자료들을 범주화 하여 다시 정량화 시킬수도 있지만,단순히 어떤 의견을 썼는지 보고싶은 경우는 워드클라우드(wordcloud)가 참 좋습니다.​워드클라우드는 텍스트 데이터를 시각화하는 방법 중 하나로, 텍스트에서 가장 많이 등장하는 단어를 시각적으로 표현하는 도구입니다. 주로 단어의 빈도에 따라 크기와 색상이 결정되며, 이로 워드클라우드 인해 텍스트의 주요 주제나 핵심 키워드를 한눈에 파악할 수 있습니다. 워드클라우드는 다음과 같은 장점이 있습니다:​물론 '워드클라우드 생성기'사이트에서도 쉽게 만들 수 있지만,저는 발표용 ppt에는 해당 사이트에서 생성하면 생기는 워터마크가 마음에 들지 않아서Rstudio를 통해 직접 만들어서 사용합니다.​먼저 RStudio는 통계 분석과 데이터 시각화를 위한 강력한 통합 개발 환경(IDE)입니다. R 프로그래밍 언어를 기반으로 하며, 데이터 과학자들과 분석가들이 데이터 분석 작업을 보다 효율적으로 수행할 수 워드클라우드 있도록 돕는 도구입니다.​RStudio는 사용자 친화적인 인터페이스를 제공하며, R 코드를 작성, 실행, 시각화하는 과정을 단순하고 직관적으로 만들어 줍니다. 특히, 데이터 전처리, 분석, 시각화까지의 모든 과정을 하나의 환경에서 통합적으로 관리할 수 있어 매우 편리합니다.​자 그럼 이제 코드를 공유하도록 하겠습니다.​install.packages(wordcloud2) #워드클라우드 생성 패키지install.packages(tm) #텍스트 마이닝 페키지install.packages(readxl) #엑셀파일을 R로 불러오는 패키지install.packages(RColorBrewer) #데이터 시각화 생상 팔레트​library(wordcloud2)library(tm)library(readxl)library(RColorBrewer)​# 파일 경로 설정file_path <- C:/Users/Administrator/Desktop/sample.xlsx# 밑줄친 부분은 사용자의 PC환경에 워드클라우드 따라서 바꿔주세요.​​# 엑셀 파일 불러오기data <- read_excel(file_path)​# 텍스트 데이터 확인head(data)​# Corpus 생성corpus <- Corpus(VectorSource(data$text_column))​# 데이터 전처리corpus <- tm_map(corpus, removePunctuation) # 구두점 제거corpus <- tm_map(corpus, removeNumbers) # 숫자 제거corpus <- tm_map(corpus, stripWhitespace) # 공백 제거​# Term-Document Matrix 생성dtm <- TermDocumentMatrix(corpus)matrix <- as.matrix(dtm)​# 단어 빈도 계산 및 데이터프레임 생성word_freqs <- sort(rowSums(matrix), decreasing =TRUE)​# 1음절 단어 제거 (2음절 이상 단어만 남기기)data_frame 1, ]​# 워드클라우드 워드클라우드 생성set.seed(1234) # 결과 재현성을 위해 설정​# 워드클라우드 생성 및 커스터마이징wordcloud2(data_frame, size ϑ.5, # 단어 크기 조정 shape ='circle', # 워드클라우드 모양 (circle, star, diamond, triangle 등) color ϛrewer.pal(8, Dark2), # 색상 팔레트 backgroundColor =white, # 배경색 설정 rotateRatio ϐ.5) # 단어 회전 비율​# 볼드처리 한 부분은 커스터마이징 부분입니다. 사용자에 따라서 바꿔서 사용하세요.자 그러면 결과를 볼까요?​​네 이렇게 나옵니다.좀 더 깔끔하게 워드클라우드 하기 위해서는 조사나 종결어미 등을 제거하는 작업을 하면 좋지만,다소 복잡하고, 아직 tm이 100% 마음에 들게 되지 않아서 저는 이렇게 사용합니다.​기회가 된다면 2탄으로 올려보도록 할께요^^​​#RStudio #데이터시각화 #WordCloud #텍스트분석 #데이터분석 #데이터과학 #빅데이터 #데이터시각화툴 #R프로그래밍 #통계분석 #워드클라우드 #데이터전처리 #데이터비주얼라이제이션 #텍스트마이닝 #데이터사이언스

    댓글목록

    등록된 댓글이 없습니다.



    --> ------ 메인 스크립트 ------