텍스트마이닝 3

Gutenberg project_Alice's Adventures in Wonderland

1. Gutenberg project 접속 Free eBooks | Project Gutenberg 2. 텍스트 마이닝 하고 싶은 E-BOOK 고르기 3. 코드 짜보기 pip install wordcloud import pandas as pd import numpy as np from collections import Counter from wordcloud import WordCloud import matplotlib.pyplot as plt from PIL import Image import requests from bs4 import BeautifulSoup from collections import Counter from wordcloud import WordCloud import matplotl..

데이터시각화(R)_Oxboys/faithful

Oxboys data: - Oxford에 있는 26명 소년에 대한 자료로 소년이 나이가 들어감에 따라 키가 커가는지 보기 위해 9번 측정한 자료 - 변수 설명: subject(각 소년의 ID), age(표준화된 나이), height(키), occasion(키가 측정된 순서) library(nlme) data(Oxboys) library(tidyverse) head(Oxboys) Grouped Data: height ~ age | Subject Subject age height Occasion 1 1 -1.0000 140.5 1 2 1 -0.7479 143.4 2 3 1 -0.4630 144.8 3 4 1 -0.1643 147.1 4 5 1 -0.0027 147.7 5 6 1 0.2466 150.2 6 g..

텍스트 마이닝_필수 라이브러리 설치

1. 텐서플로우 설치 머신러닝과 딥러닝을 직관적이고 손쉽게 할 수 있도록 설계되어 있음 pip install tensorflow 2. 케라스 설치 딥러닝 프레임워크인 텐서플로우에 대한 추상화 된 API 제공 pip install keras 3. 젠심 머신러닝을 사용하여 토픽 모델링과 자연어 처리 등을 수행할 수 있게 해주는 오픈 소스 라이브러리 pip install gensim 4. 사이킷런 파이썬 머신러닝 라이브러리 pip install scikit-learn 5. 자연어 처리_NLTK, NLTK DATA 설치 pip install nltk import nltk nltk.download() 설치 확인 6. 자연어 처리_KoNLPy 설치 한국어 자연어 처리를 위한 형태소 분석기 패키지 pip instal..

728x90