命令行中的數據科學 (Data Science at the Command Line:Facing the Future with Time-Tested Tools) 命令行中的数据科学 (图灵程序设计丛书)

Name: 命令行中的數據科學 (Data Science at the Command Line:Facing the Future with Time-Tested Tools)
Price: 294 TWD
Availability: Discontinued
Author: 詹森斯(Jeroen Janssens)
ISBN: 7115391688

詹森斯(Jeroen Janssens)

出版商: 人民郵電
出版日期: 2015-06-01
售價: $294
語言: 簡體中文
頁數: 169
ISBN: 7115391688
ISBN-13: 9787115391681
相關分類: Command Line、Data Science
此書翻譯自: Data Science at the Command Line: Facing the Future with Time-Tested Tools (Paperback)

已絕版

買這商品的人也買了...

~~$580~~ $458

Hadoop 管理手冊 (Hadoop Operations)
~~$780~~ $616

精通 Python｜運用簡單的套件進行現代運算 (Introducing Python: Modern Computing in Simple Packages)
$294

貝葉斯思維 : 統計建模的 Python 學習法 (Think Bayes : Bayesian Statistics in Python)
$229

Spark Cookbook (中文版)
~~$580~~ $458

高效率資料分析｜使用 Python (Foundations for Analytics with Python)
$354

Spark內核機制解析及性能調優
$474

面向機器學習的自然語言標註 (Natural language annotation for macbhine learning)
$418

算法圖解 (Grokking Algorithms: An illustrated guide for programmers and other curious people)
$606

計算機視覺 : 模型、學習和推理 (Computer Vision)
$474

深度學習與計算機視覺 : 算法原理、框架應用與代碼實現 (Deep Learning & Computer Vision:Algorithms and Examples)
$805

奔跑吧 Linux 內核
~~$480~~ $379

初探機器學習｜使用 Python (Thoughtful Machine Learning with Python)
$228

遊戲開發入門：數學和物理
~~$680~~ $537

精通機器學習｜使用 Python (Introduction to Machine Learning with Python: A Guide for Data Scientists)
$294

計算機體系結構基礎
$294

統計思維：程序員數學之概率統計（第2版） (圖靈程序設計叢書)
~~$450~~ $270

演算法圖鑑：26種演算法 + 7種資料結構，人工智慧、數據分析、邏輯思考的原理和應用 step by step 全圖解
~~$354~~ $336

Linux 二進制分析
$351

Mesos 實戰
$294

PySpark 實戰指南 : 利用 Python 和 Spark 構建數據密集型應用並規模化部署 (Learning PySpark)
$300

MicroPython 入門指南
$402

Docker 實踐
~~$420~~ $357

野營技術教本詳細圖解 - 大自然就是我的遊樂場
~~$590~~ $502

Python 資料運算與分析實戰：一次搞懂 NumPy, SciPy, Matplotlib, Pandas 最強套件
~~$480~~ $379

初探深度學習｜使用 TensorFlow (TensorFlow for Deep Learning: From Linear Regression to Reinforcement Learning)

商品描述

本書集實用性和先進性於一身，為數據分析人員使用命令行這個靈活的工具提供了重要參考。作者講解了眾多實用的命令行工具，以及如何使用它們高效地獲取、清洗、探索和建模數據。無論你使用Windows、OS X，還是Linux，都可以安裝包含80多個命令行工具的“數據科學工具箱”，迅速建立自己的數據分析環境。無論你是否已經習慣於使用Python或R語言，都能夠通過本書體會到使用命令行的快捷、靈活與伸縮自如。

目錄大綱

前言

第1章簡介
1.1 概述
1.2 數據科學就是OSEMN
1.2.1 數據獲取
1.2.2 數據清洗
1.2.3 數據探索
1.2.4 數據建模
1.2.5 數據解釋
1.3 插入的幾章
1.4 什麼是命令行
1.5 為什麼用命令行做數據科學工作
1.5.1 命令行的靈活性
1.5.2 命令行可增強
1.5.3 命令行可擴展
1.5.4 命令行可擴充
1.5.5 命令行處不在
1.6 一個現實用例
1.7 延伸閱讀

第2章入門指南
2.1 概述
2.2 設置數據科學工具箱
2.2.1 步驟1：下載和安裝Virtual Box
2.2.2 步驟2：下載和安裝Vagrant
2.2.3 步驟3：下載並啟動數據科學工具箱
2.2.4 步驟4：登錄（Linux和Mac OSX）
2.2.5 步驟4：登錄（微軟Windows）
2.2.6 步驟5：關閉或重啟
2.3 必要的概念和工具
2.3.1 環境
2.3.2 運行命令行工具
2.3.3 五類命令行工具
2.3.4 命令行工具的組合
2.3.5 輸入和輸出重定向
2.3.6 處理文件
2.3.7 尋求幫助
2.4 延伸閱讀

第3章數據獲取
3.1 概述
3.2 將本地文件復制到數據科學工具箱
3.2.1 本地數據科學工具箱
3.2.2 遠程數據科學工具箱
3.3 解壓縮文件
3.4 微軟Excel電子表格的轉換
3.5 查詢關系數據庫
3.6 從因特網下載
3.7 調用Web API
3.8 延伸閱讀

第4章創建可重用的命令行工具
4.1 概述
4.2 將單行轉變為shell腳本
4.2.1 步驟1：復制和粘貼
4.2.2 步驟2：添加執行權限
4.2.3 步驟3：定義shebang
4.2.4 步驟4：刪除固定的輸入
4.2.5 步驟5：參數化
4.2.6 步驟6：擴展PATH4
4.3 用Python和R創建命令行工具
4.3.1 移植shell腳本
4.3.2 處理來自標準輸入的流數據
4.4 延伸閱讀

第5章數據清洗
5.1 概述
5.2 純文本的常見清洗操作
5.2.1 行過濾
5.2.2 值提取
5.2.3 值替換和刪除
5.3 處理CSV
5.3.1 主體、頭部和列
5.3.2 對CSV執行SQL查詢
5.4 處理HTML/XML和JSON
5.5 CSV的常見清洗操作
5.5.1 列的提取和重排序
5.5.2 行過濾
5.5.3 列合並
5.5.4 多個CSV文件的合並
5.6 延伸閱讀

第6章管理數據工作流
6.1 概述
6.2 Drake簡介
6.3 Drake的安裝
6.4 獲取古騰堡計劃中下載最多的電子書
6.5 所有工作流都從單個步驟開始
6.6 具體情況具體對待
6.7 重新構建具體目標
6.8 討論
6.9 延伸閱讀

第7章數據探索
7.1 概述
7.2 檢查數據及其屬性
7.2.1 確定有數據頭
7.2.2 檢查所有數據
7.2.3 特徵名稱和數據類型
7.2.4 唯一標識、連續變量和因子
7.3 計算描述性統計信息
7.3.1 使用csvstat
7.3.2 在命令行中通過Rio使用R
7.4 生成可視化圖形
7.4.1 介紹Gunplot和feedgnuplot
7.4.2 介紹
7.4.3 直方圖
7.4.4 條形圖
7.4.5 密度圖
7.4.6 箱線圖
7.4.7 散點圖
7.4.8 折線圖
7.4.9 總結
7.5 延伸閱讀

第8章並行管道
8.1 概述
8.2 串行處理
8.2.1 對數字進行遍歷
8.2.2 對行進行遍歷
8.2.3 對文件進行遍歷
8.3 並行處理
8.3.1 GNUParallel介紹
8.3.2 指定輸入
8.3.3 控制並發任務的個數
8.3.4 記錄日誌和輸出
8.3.5 創建並行工具
8.4 分佈式處理
8.4.1 獲得運行中的AWSEC2實例列表
8.4.2 在遠程機器上運行命令
8.4.3 在遠程機器間分發本地數據
8.4.4 在遠程機器上處理文件
8.5 討論
8.6 延伸閱讀

第9章數據建模
9.1 概述
9.2 更多的酒，來吧！
9.3 用Tapkee降維
9.3.1 介紹Tapkee
9.3.2 安裝Tapkee
9.3.3 線性和非線性映射
9.4 用Weka聚類
9.4.1 介紹Weka
9.4.2 在命令行里改進Weka
9.4.3 在CSV和ARFF格式之間轉換
9.4.4 比較三種聚類算法
9.5 通過SciKit-LearnLaboratory進行回歸
9.5.1 準備數據
9.5.2 運行實驗
9.5.3 解析結果
9.6 用BigML分類
9.6.1 生成均衡的訓練和測試數據集
9.6.2 調用API
9.6.3 檢查結果
9.6.4 小結
9.7 延伸閱讀