文本探勘:小技術大應用 (附範例光碟)
許健將、劉福蒝
- 出版商: 全華圖書
- 出版日期: 2020-10-27
- 定價: $350
- 售價: 9.0 折 $315
- 語言: 繁體中文
- 頁數: 240
- ISBN: 9865035081
- ISBN-13: 9789865035082
-
相關分類:
R 語言、Web-crawler 網路爬蟲
立即出貨 (庫存 < 3)
買這商品的人也買了...
-
$348$331 -
$350$350 -
$301R語言入門與實踐
-
$720$569 -
$505R語言入門經典
-
$800$720 -
$420$328 -
$800$760 -
$352RFID應用指南——面向用戶的應用模式、標準、編碼及軟硬件選擇(第2版)
-
$704R語言之書 編程與統計
-
$580$458 -
$954$906 -
$560$437 -
$352概率、決策與博弈: 基於R語言介紹 (Probability, Decisions and Games: A Gentle Introduction Using R)
-
$403Python 數據分析
-
$356數據可視化——基於R語言
-
$709高級 R語言編程指南, 2/e
-
$560$504 -
$352深入淺出 R語言數據分析
-
$254文本數據挖掘與 Python 應用
-
$600$468 -
$505統計建模與 R軟件, 2/e
-
$560$442 -
$350$315 -
$720$562
相關主題
商品描述
本書特色
1. 利用R語言的文本探勘能力做中、英文小說的情感分析。
2. 利用R語言進行網路爬蟲,在非結構化的文字中擷取資訊。
3. 學習上列的技術後,能從各類非結構化的文字中擷取有用的資訊,以利未來決定與決策之用。
內容簡介
本書之撰寫,是針對完全不具備R語言能力之初學者為主要對象,以手把手的方式進行教學,讀者只要跟隨書本的章節和範例,一步一步地練習,相信必能在最短的時間內學會文本探勘的基本技術,並能應用在自身所屬的領域上。包括語料庫的建立與相關套件的使用;利用文本探勘對中、英文小說進行各種分析;以及利用文本探勘進行網路爬蟲。全書由淺入深、按部就班地指導讀者學會文本探勘技術,進而能從各類非結構化的文字當中擷取有用的資訊,以做為後續進行下決定(decision-making)或形成政策(policy-making)之用。
目錄大綱
Chapter 1 - R語言的下載與安裝
1.1 R語言
1.2 RStudio
1.3 R語言的套件
Chapter 2 - 學習文字探勘前的R基礎
2.1 變數
2.2 資料型態與資料結構
2.3 缺失值
2.4 管線運算子
2.5 正規表達式(Regular expression)
2.6 基本字符串函數
2.7 stringr套件
2.8 資料的讀取與匯出
2.9 建立R函數
2.10 條件執行
2.11 迴圈
2.12 apply相關函數
Chapter 3 - 文本探勘
3.1 文字探勘的基本概念
3.2 套件介紹
3.3 英文語料庫
3.4 中文語料庫
Chapter 4 - 中、英文小說
4.1 套件介紹
4.2 認識Gutenberg Project
4.3 tidy文本格式
4.4 情感詞庫
4.5 英文小說分析 - Little Women
4.6 英文小說 - n元語法
4.7 中文小說分析 - 三國演義
Chapter 5 - 網路爬蟲與文字探勘
5.1 網路爬蟲介紹
5.2 靜態擷取網頁
5.3 動態擷取網頁