R語言之書:編程與統計

R語言之書:編程與統計
定價:828
NT $ 720
 

內容簡介

本書由淺入深、全面系統地介紹了R語言的編程和統計知識,為讀者了解現代數據科學的計算方法奠定了比較堅實的基礎。

本書包括語言、編程、統計學和概率、統計檢驗和建模、繪圖共5個部分,基本涵蓋了國外大學一、二年級的統計學課程。在講授知識的同時,本書注重學以致用,每章穿插了許多練習,方便讀者動手操作;每章結尾提供了本章講述的代碼匯總,方便讀者快速查閱。通過對本書循序漸進的學習,讀者可以逐步構建自己的知識體系,同時培養程序員的思維方式。本書適合R語言初學者從頭開始學習,有編程經驗的讀者也可以挑選自己感興趣的內容閱讀。

本書既可以用作R語言編程的社會培訓教材、自學教材,也可以用作高校師生,特別是統計學專業師生的輔導教材。


 

作者介紹

蒂爾曼·M. 戴維斯,是紐西蘭奧塔哥大學的講師,教授統計數據課程。他使用R語言編程已經有10年之久,並在他的所有課程上教授R語言編程。蒂爾曼·M. 戴維斯因對空間點模式建模的研究,被授予紐西蘭統計協會的Worsley獎。紐西蘭huang家學會授予他Marsden Fast-Start獎,表彰他解決了相關的問題。他組織了一個為期3天的R語言講習班,這鼓勵他寫出這本面向R語言初學者的使用指南。
 

目錄

第一部分 語言

第1章 新手入門3
1.1從CRAN獲取並安裝R3
1.2打開R之初體驗3
1.2.1控制台和編輯窗格4
1.2.2注釋5
1.2.3工作路徑6
1.2.4安裝和載入R包6
1.2.5説明檔和函數文檔7
1.2.6協力廠商編輯器9
1.3保存工作和退出R9
1.3.1工作空間9
1.3.2腳本10
1.4約定10
1.4.1編碼11
1.4.2引用數學函數和等式11
1.4.3練習12

第2章 數值、運算、賦值和向量13
2.1R在基礎數學上的應用13
2.1.1運算13
2.1.2對數和指數14
2.1.3科學計數法15
2.2分配對象16
2.3向量17
2.3.1創建向量17
2.3.2序列、重複、排序和長度18
2.3.3子集和元素的提取21
2.3.4面向向量的操作25

第3章 矩陣和陣列30
3.1定義一個矩陣30
3.1.1填充方式31
3.1.2合併行和列31
3.1.3矩陣的維度32
3.2構造子集32
3.2.1按行、列和對角線提取元素33
3.2.2省略和改寫34
3.3矩陣運算和線性代數36
3.3.1矩陣的轉置37
3.3.2單位矩陣37
3.3.3矩陣的數乘38
3.3.4矩陣的加減法38
3.3.5矩陣的乘法39
3.3.6逆矩陣40
3.4多維陣列41
3.4.1定義42
3.4.2子集、提取和替換43

第4章 非數值型資料47
4.1邏輯值47
4.1.1TRUE還是FALSE47
4.1.2邏輯值的輸出:關係運算子48
4.1.3多重比較:邏輯運算子51
4.1.4邏輯值也是數值53
4.1.5利用邏輯值提取子集54
4.2字元58
4.2.1創建一個字串58
4.2.2連接59
4.2.3轉義序列61
4.2.4子集與匹配62
4.3因數63
4.3.1識別類別63
4.3.2水準的定義與排序65
4.3.3組合與分割66

第5章 清單和數據框70
5.1清單對象70
5.1.1創建清單和訪問組件70
5.1.2命名72
5.1.3嵌套73
5.2數據框75
5.2.1創建資料框75
5.2.2添加資料列併合並資料框77
5.2.3利用邏輯值提取記錄的子集79

第6章 特殊值、類型和轉換82
6.1特殊值82
6.1.1無窮數82
6.1.2NaN84
6.1.3NA86
6.1.4NULL88
6.2類型、類別和轉換91
6.2.1屬性91
6.2.2物件類別93
6.2.3檢查物件函數is.95
6.2.4轉換函數as.96

第7章 基本繪圖102
7.1使用plot調整座標向量102
7.2圖形化參數103
7.2.1自動繪圖類型104
7.2.2標題和坐標軸標籤104
7.2.3顏色105
7.2.4點和線的外觀106
7.2.5繪圖區域限制107
7.3在已有圖中添加點、線和文本107
7.4ggplot2包113
7.4.1使用qplot進行快速繪圖113
7.4.2用geoms設置外觀常量114
7.4.3geoms的美學映射116

第8章 讀寫文件119
8.1R內置資料集119
8.1.1內置資料集119
8.1.2貢獻資料集120
8.2讀入外部資料檔案121
8.2.1表格格式121
8.2.2試算表工作簿124
8.2.3基於網頁的文件125
8.2.4其他檔案格式126
8.3寫出資料檔案和圖形126
8.3.1資料集126
8.3.2圖像和圖形檔127
8.4特殊物件的讀/寫操作130

第二部分 程式設計

第9章 調用函數135
9.1作用域135
9.1.1環境135
9.1.2搜索路徑137
9.1.3名稱的保留和保護139
9.2參數匹配140
9.2.1準確性140
9.2.2局部匹配141
9.2.3位置142
9.2.4混合142
9.2.5省略號的用法143

第10章 條件和迴圈145
10.1if語句145
10.1.1獨立語句145
10.1.2else語句148
10.1.3基於元素水準使用ifelse149
10.1.4嵌套和堆疊語句150
10.1.5轉換函數153
10.2迴圈代碼156
10.2.1for迴圈156
10.2.2while迴圈162
10.2.3使用apply的隱式迴圈165
10.3其他控制流程機制169
10.3.1break或next聲明169
10.3.2repeat語句171

第11章 編寫函數175
11.1函數命令175
11.1.1創建函數175
11.1.2使用返回178
11.2參數180
11.2.1惰性計算180
11.2.2設置預設值183
11.2.3檢查缺失參數184
11.2.4省略號的處理185
11.3特殊函數189
11.3.1説明函數190
11.3.2一次性函數191
11.3.3遞迴函數192

第12章 異常值、計時和可見性196
12.1異常值處理196
12.1.1正式聲明:錯誤和警告196
12.1.2使用try命令來捕獲錯誤198
12.2進度和計時202
12.2.1文本進度條:執行到哪裡了202
12.2.2測量完成時間:執行需要多長時間203
12.3隱藏204
12.3.1函數與物件的區別205
12.3.2區分資料框變數207

第三部分統計學與概率

第13章 初級統計學213
13.1描述原始資料213
13.1.1數值型變數213
13.1.2分類變數214
13.1.3單變數和多變數資料215
13.1.4參數和統計量216
13.2統計概要216
13.2.1集中趨勢:均值、中位數、眾數217
13.2.2計數、百分比和比例220
13.2.3四分位數、百分位數和五分位數概括法222
13.2.4離散程度:方差、標準差和四分位差223
13.2.5協方差和相關係數226
13.2.6異常值230

第14章 資料視覺化基礎233
14.1橫條圖和圓形圖233
14.1.1繪製橫條圖233
14.1.2圓形圖簡介236
14.2長條圖237
14.3箱線圖239
14.3.1獨立箱線圖239
14.3.2並列箱線圖240
14.4散點圖241
14.4.1單一散點圖242
14.4.2散點圖矩陣243

第15章 概率248
15.1什麼是概率248
15.1.1事件和概率248
15.1.2條件概率249
15.1.3交集249
15.1.4並集250
15.1.5補集250
15.2隨機變數和概率分佈251
15.2.1觀察值251
15.2.2離散隨機變數252
15.2.3連續隨機變數254
15.2.4形狀、偏態和峰態260

第16章 常見的概率分佈263
16.1常見的概率品質函數263
16.1.1伯努利分佈263
16.1.2二項分佈264
16.1.3泊松分佈268
16.1.4其他品質函數271
16.2常見的概率密度函數271
16.2.1均勻分佈271
16.2.2正態分佈275
16.2.3學生t分佈282
16.2.4指數分佈284
16.2.5其他密度函數286

第四部分 統計檢驗與建模

第17章 抽樣分佈和置信度291
17.1抽樣分佈291
17.1.1樣本均值的分佈292
17.1.2樣品比例的分佈295
17.1.3其他統計的抽樣分佈298
17.2置信區間298
17.2.1平均值的置信區間299
17.2.2比例的置信區間301
17.2.3其他置信區間301
17.2.4對CI解釋的評論302

第18章 假設檢驗304
18.1假設檢驗的組件304
18.1.1假設305
18.1.2檢驗統計量305
18.1.3p值305
18.1.4顯著性水準305
18.1.5假設檢驗的拒絕域306
18.2檢驗均值306
18.2.1單個均值306
18.2.2兩個均值309
18.3檢驗比例316
18.3.1單個比例316
18.3.2兩個比例318
18.4檢驗分類變數322
18.4.1單個分類變數322
18.4.2兩個分類變數325
18.5錯誤與功效329
18.5.1假設檢驗錯誤329
18.5.2第Ⅰ類錯誤330
18.5.3第Ⅱ類錯誤332
18.5.4統計功效335

第19章 方差分析340
19.1單因素方差分析340
19.1.1假設和診斷檢驗340
19.1.2單因素方差分析表343
19.1.3用aov函數創建方差分析表344
19.2雙因素方差分析345
19.2.1一系列假設346
19.2.2主效應和交互作用347
19.3Kruskal-Wallis檢驗349

第20章 簡單線性回歸352
20.1線性關係的一個示例352
20.2一般概念353
20.2.1模型的定義354
20.2.2估計截距和斜率的參數354
20.2.3用lm擬合線性模型355
20.2.4對殘差的說明356
20.3統計推斷357
20.3.1匯總擬合模型357
20.3.2回歸係數的顯著性檢驗358
20.3.3可決係數359
20.3.4其他匯總輸出359
20.4預測360
20.4.1置信區間還是預測區間360
20.4.2解釋區間361
20.4.3繪製區間362
20.4.4插值與外推364
20.5分類解釋變數365
20.5.1二元變數:k = 2365
20.5.2多元變數:k > 2368
20.5.3改變參考水準372
20.5.4將分類變數視為數位372
20.5.5單因素方差分析的等價375

第21章 多元線性回歸377
21.1相關術語377
21.2理論378
21.2.1將簡單模型擴展為多元模型378
21.2.2矩陣形式的估計378
21.2.3一個基礎例子379
21.3在R中的實現和解釋380
21.3.1其他解釋變數381
21.3.2解釋邊際效應383
21.3.3視覺化多元線性模型383
21.3.4查找置信區間385
21.3.5綜合的F檢驗385
21.3.6對多元線性模型進行預測387
21.4轉換數值變數389
21.4.1多項式390
21.4.2對數395
21.4.3其他變換397
21.5交互項398
21.5.1概念和動機399
21.5.2分類變數和連續變數399
21.5.3兩個分類403
21.5.4兩個連續404
21.5.5高階交互項406

第22章 線性模型選擇和診斷409
22.1擬合優度和複雜度409
22.1.1簡約原則409
22.1.2一般原則409
22.2模型選擇演算法410
22.2.1嵌套比較:部分F檢驗410
22.2.2向前選擇413
22.2.3向後選擇417
22.2.4逐步AIC選擇420
22.2.5其他選擇演算法425
22.3殘差診斷425
22.3.1檢查和解釋殘差426
22.3.2評估正態性429
22.3.3離群值、杠杆和影響430
22.3.4計算杠杆433
22.3.5庫克距離434
22.3.6以圖形方式組合殘差、杠杆和庫克距離437
22.4共線性441
22.4.1潛在警告標誌441
22.4.2相關預測442

第五部分高級繪圖

第23章 自訂高級繪圖447
23.1掌握圖形設備447
23.1.1手動打開新設備448
23.1.2在設備之間切換448
23.1.3關閉一個設備449
23.1.4一個設備中多個圖形449
23.2繪製區域和邊距452
23.2.1默認間距452
23.2.2自訂間距453
23.2.3剪切454
23.3點擊式座標互動456
23.3.1獲取座標456
23.3.2視覺化所選座標456
23.3.3專用注釋457
23.4自訂傳統R圖形460
23.4.1樣式和禁止的圖形參數460
23.4.2自訂邊框461
23.4.3自訂坐標軸462
23.5專用文本和標籤符號464
23.5.1字體464
23.5.2希臘符號465
23.5.3數學運算式466
23.6完全注釋的散點圖468

第24章 進一步瞭解圖形474
24.1是使用ggplot還是qplot474
24.2平滑和陰影475
24.2.1添加LOESS趨勢475
24.2.2構建平滑密度估計477
24.3多個圖形和變數的分面479
24.3.1獨立圖形479
24.3.2一個分類變數的分面繪圖481
24.4ggvis包裡的互動式工具484

第25章 在更高維上定義顏色和圖形490
25.1顏色的表示和使用490
25.1.1紅—綠—藍十六進位顏色
代碼490
25.1.2內置調色板493
25.1.3自訂調色盤494
25.1.4使用調色板索引連續區495
25.1.5顏色圖例498
25.1.6不透明度499
25.1.7RGB的替代和更多功能501
25.23D散點圖503
25.2.1基本語法504
25.2.2增強視覺504
25.3用於繪圖的曲面507
25.3.1構造估計網格507
25.3.2構造z矩陣508
25.3.3概念化的z矩陣509
25.4輪廓圖510
25.4.1畫輪廓線510
25.4.2彩色填充輪廓515
25.5圖元圖像518
25.5.1一個網格點 = 一個圖元518
25.5.2曲面截斷和空圖元521
25.6透視圖527
25.6.1基本圖和角度調整527
25.6.2為平面著色530
25.6.3迴圈旋轉532

第26章 互動式3D圖形537
26.1點雲537
26.1.1基本3D雲537
26.1.2增強視覺和圖例538
26.1.3添加其他3D組件539
26.2雙變數曲面543
26.2.1基本透視曲面543
26.2.2附加組件544
26.2.3根據z座標值著色546
26.2.4設置長寬比547
26.3三變數曲面550
26.3.1三維估計座標551
26.3.2等值面552
26.3.3實例:非參數三元密度556
26.4參數方程560
26.4.1簡單向量圖560
26.4.2數學抽象圖形563

附錄A安裝R和貢獻包571
A.1下載和安裝R571
A.2使用包572
A.2.1基礎包573
A.2.2擴展包573
A.2.3貢獻包573
A.3更新R和已安裝的包578
A.4使用其他鏡像和存儲庫579
A.4.1切換CRAN鏡像579
A.4.2其他包庫579
A.5引用和寫作包580
A.5.1引用R和幫助包580
A.5.2編寫我們自己的包581

附錄B使用RStudio582
B.1基本佈局和用法582
B.1.1編輯器和外觀選項583
B.1.2自訂窗格584
B.2輔助工具585
B.2.1項目585
B.2.2包安裝程式和更新程式586
B.2.3支持調試587
B.2.4標記、文檔和圖形工具587

譯後記590
網路書店 類別 折扣 價格
  1. 新書
    87
    $720