出版時(shí)間:2013-1 出版社:人民郵電出版社 作者:卡巴科弗 頁數(shù):388 字?jǐn)?shù):602000 譯者:高濤,肖楠,陳鋼
Tag標(biāo)簽:無
內(nèi)容概要
R是一個(gè)開源項(xiàng)目,具有強(qiáng)大的統(tǒng)計(jì)計(jì)算及制圖能力,是從大數(shù)據(jù)中獲取有用信息的絕佳工具,在各種主流操作系統(tǒng)上都可以安裝使用,其基本安裝就提供了數(shù)以百計(jì)的數(shù)據(jù)管理、統(tǒng)計(jì)和圖形函數(shù)。另外,社區(qū)開發(fā)的數(shù)以千計(jì)的擴(kuò)展(包)為R增加了更多強(qiáng)大功能?!禦語言實(shí)戰(zhàn)》注重實(shí)用性,是一本全面而細(xì)致的R指南,高度概括了該軟件和它的強(qiáng)大功能,展示了實(shí)用的統(tǒng)計(jì)示例,且對(duì)于難以用傳統(tǒng)方法處理的凌亂、不完整和非正態(tài)的數(shù)據(jù)給出了優(yōu)雅的處理方法。作者不僅僅探討統(tǒng)計(jì)分析,還闡述了大量探索和展示數(shù)據(jù)的圖形功能?!禦語言實(shí)戰(zhàn)》適合數(shù)據(jù)分析人員及R用戶學(xué)習(xí)參考。
作者簡(jiǎn)介
Robert I. Kabacoff
R語言社區(qū)著名學(xué)習(xí)網(wǎng)站Quick-Rhttp://www.statmethods.net/)的幕后維護(hù)者,現(xiàn)為全球化開發(fā)與咨詢公司Management研究集團(tuán)研發(fā)副總裁。此前,Kabacoff博士是佛羅里達(dá)諾瓦東南大學(xué)的教授,講授定量方法和統(tǒng)計(jì)編程的研究生課程。Kabacoff還是臨床心理學(xué)博士、統(tǒng)計(jì)顧問,擅長(zhǎng)數(shù)據(jù)分析,在健康、金融服務(wù)、制造業(yè)、行為科學(xué)、政府和學(xué)術(shù)界有20余年的研究和統(tǒng)計(jì)咨詢經(jīng)驗(yàn)。
書籍目錄
目 錄
第一部分 入門
第1章 R語言介紹
1.1 為何要使用R?
1.2 R的獲取和安裝
1.3 R的使用
1.3.1 新手上路
1.3.2 獲取幫助
1.3.3 工作空間
1.3.4 輸入和輸出
1.4 包
1.4.1 什么是包
1.4.2 包的安裝
1.4.3 包的載入
1.4.4 包的使用方法
1.5 批處理
1.6 將輸出用為輸入——結(jié)果的重用
1.7 處理大數(shù)據(jù)集
1.8 示例實(shí)踐
1.9 小結(jié)
第2章 創(chuàng)建數(shù)據(jù)集
2.1 數(shù)據(jù)集的概念
2.2 數(shù)據(jù)結(jié)構(gòu)
2.2.1 向量
2.2.2 矩陣
2.2.3 數(shù)組
2.2.4 數(shù)據(jù)框
2.2.5 因子
2.2.6 列表
2.3 數(shù)據(jù)的輸入
2.3.1 使用鍵盤輸入數(shù)據(jù)
2.3.2 從帶分隔符的文本文件導(dǎo)入數(shù)據(jù)
2.3.3 導(dǎo)入Excel數(shù)據(jù)
2.3.4 導(dǎo)入XML數(shù)據(jù)
2.3.5 從網(wǎng)頁抓取數(shù)據(jù)
2.3.6 導(dǎo)入SPSS數(shù)據(jù)
2.3.7 導(dǎo)入SAS數(shù)據(jù)
2.3.8 導(dǎo)入Stata數(shù)據(jù)
2.3.9 導(dǎo)入netCDF數(shù)據(jù)
2.3.10 導(dǎo)入HDF5數(shù)據(jù)
2.3.11 訪問數(shù)據(jù)庫管理系統(tǒng)
2.3.12 通過Stat/Transfer導(dǎo)入數(shù)據(jù)
2.4 數(shù)據(jù)集的標(biāo)注
2.4.1 變量標(biāo)簽
2.4.2 值標(biāo)簽
2.5 處理數(shù)據(jù)對(duì)象的實(shí)用函數(shù)
2.6 小結(jié)
第3章 圖形初階
3.1 使用圖形
3.2 一個(gè)簡(jiǎn)單的例子
3.3 圖形參數(shù)
3.3.1 符號(hào)和線條
3.3.2 顏色
3.3.3 文本屬性
3.3.4 圖形尺寸與邊界尺寸
3.4 添加文本、自定義坐標(biāo)軸和圖例
3.4.1 標(biāo)題
3.4.2 坐標(biāo)軸
3.4.3 參考線
3.4.4 圖例
3.4.5 文本標(biāo)注
3.5 圖形的組合
3.6 小結(jié)
第4章 基本數(shù)據(jù)管理
4.1 一個(gè)示例
4.2 創(chuàng)建新變量
4.3 變量的重編碼
4.4 變量的重命名
4.5 缺失值
4.5.1 重編碼某些值為缺失值
4.5.2 在分析中排除缺失值
4.6 日期值
4.6.1 將日期轉(zhuǎn)換為字符型變量
4.6.2 更進(jìn)一步
4.7 類型轉(zhuǎn)換
4.8 數(shù)據(jù)排序
4.9 數(shù)據(jù)集的合并
4.9.1 添加列
4.9.2 添加行
4.10 數(shù)據(jù)集取子集
4.10.1 選入(保留)變量
4.10.2 剔除(丟棄)變量
4.10.3 選入觀測(cè)
4.10.4 subset()函數(shù)
4.10.5 隨機(jī)抽樣
4.11 使用SQL語句操作數(shù)據(jù)框
4.12 小結(jié)
第5章 高級(jí)數(shù)據(jù)管理
5.1 一個(gè)數(shù)據(jù)處理難題
5.2 數(shù)值和字符處理函數(shù)
5.2.1 數(shù)學(xué)函數(shù)
5.2.2 統(tǒng)計(jì)函數(shù)
5.2.3 概率函數(shù)
5.2.4 字符處理函數(shù)
5.2.5 其他實(shí)用函數(shù)
5.2.6 將函數(shù)應(yīng)用于矩陣和數(shù)據(jù)框
5.3 數(shù)據(jù)處理難題的一套解決方案
5.4 控制流
5.4.1 重復(fù)和循環(huán)
5.4.2 條件執(zhí)行
5.5 用戶自編函數(shù)
5.6 整合與重構(gòu)
5.6.1 轉(zhuǎn)置
5.6.2 整合數(shù)據(jù)
5.6.3 reshape包
5.7 小結(jié)
第二部分 基本方法
第6章 基本圖形
6.1 條形圖
6.1.1 簡(jiǎn)單的條形圖
6.1.2 堆砌條形圖和分組條形圖
6.1.3 均值條形圖
6.1.4 條形圖的微調(diào)
6.1.5 棘狀圖
6.2 餅圖
6.3 直方圖
6.4 核密度圖
6.5 箱線圖
6.5.1 使用并列箱線圖進(jìn)行跨組比較
6.5.2 小提琴圖
6.6 點(diǎn)圖
6.7 小結(jié)
第7章 基本統(tǒng)計(jì)分析
7.1 描述性統(tǒng)計(jì)分析
7.1.1 方法云集
7.1.2 分組計(jì)算描述性統(tǒng)計(jì)量
7.1.3 結(jié)果的可視化
7.2 頻數(shù)表和列聯(lián)表
7.2.1 生成頻數(shù)表
7.2.2 獨(dú)立性檢驗(yàn)
7.2.3 相關(guān)性的度量
7.2.4 結(jié)果的可視化
7.2.5 將表轉(zhuǎn)換為扁平格式
7.3 相關(guān)
7.3.1 相關(guān)的類型
7.3.2 相關(guān)性的顯著性檢驗(yàn)
7.3.3 相關(guān)關(guān)系的可視化
7.4 t檢驗(yàn)
7.4.1 獨(dú)立樣本的t檢驗(yàn)
7.4.2 非獨(dú)立樣本的t檢驗(yàn)
7.4.3 多于兩組的情況
7.5 組間差異的非參數(shù)檢驗(yàn)
7.5.1 兩組的比較
7.5.2 多于兩組的比較
7.6 組間差異的可視化
7.7 小結(jié)
第三部分 中級(jí)方法
第8章 回歸
8.1 回歸的多面性
8.1.1 OLS回歸的適用情境
8.1.2 基礎(chǔ)回顧
8.2 OLS回歸
8.2.1 用lm()擬合回歸模型
8.2.2 簡(jiǎn)單線性回歸
8.2.3 多項(xiàng)式回歸
8.2.4 多元線性回歸
8.2.5 有交互項(xiàng)的多元線性回歸
8.3 回歸診斷
8.3.1 標(biāo)準(zhǔn)方法
8.3.2 改進(jìn)的方法
8.3.3 線性模型假設(shè)的綜合驗(yàn)證
8.3.4 多重共線性
8.4 異常觀測(cè)值
8.4.1 離群點(diǎn)
8.4.2 高杠桿值點(diǎn)
8.4.3 強(qiáng)影響點(diǎn)
8.5 改進(jìn)措施
8.5.1 刪除觀測(cè)點(diǎn)
8.5.2 變量變換
8.5.3 增刪變量
8.5.4 嘗試其他方法
8.6 選擇“最佳”的回歸模型
8.6.1 模型比較
8.6.2 變量選擇
8.7 深層次分析
8.7.1 交叉驗(yàn)證
8.7.2 相對(duì)重要性
8.8 小結(jié)
第9章 方差分析
9.1 術(shù)語速成
9.2 ANOVA模型擬合
9.2.1 aov()函數(shù)
9.2.2 表達(dá)式中各項(xiàng)的順序
9.3 單因素方差分析
9.3.1 多重比較
9.3.2 評(píng)估檢驗(yàn)的假設(shè)條件
9.4 單因素協(xié)方差分析
9.4.1 評(píng)估檢驗(yàn)的假設(shè)條件
9.4.2 結(jié)果可視化
9.5 雙因素方差分析
9.6 重復(fù)測(cè)量方差分析
9.7 多元方差分析
9.7.1 評(píng)估假設(shè)檢驗(yàn)
9.7.2 穩(wěn)健多元方差分析
9.8 用回歸來做ANOVA
9.9 小結(jié)
第10章 功效分析
10.1 假設(shè)檢驗(yàn)速覽
10.2 用pwr包做功效分析
10.2.1 t檢驗(yàn)
10.2.2 方差分析
10.2.3 相關(guān)性
10.2.4 線性模型
10.2.5 比例檢驗(yàn)
10.2.6 卡方檢驗(yàn)
10.2.7 在新情況中選擇合適的效應(yīng)值
10.3 繪制功效分析圖形
10.4 其他軟件包
10.5 小結(jié)
第11章 中級(jí)繪圖
11.1 散點(diǎn)圖
11.1.1 散點(diǎn)圖矩陣
11.1.2 高密度散點(diǎn)圖
11.1.3 三維散點(diǎn)圖
11.1.4 氣泡圖
11.2 折線圖
11.3 相關(guān)圖
11.4 馬賽克圖
11.5 小結(jié)
第12章 重抽樣與自助法
12.1 置換檢驗(yàn)
12.2 用coin包做置換檢驗(yàn)
12.2.1 獨(dú)立兩樣本和K樣本檢驗(yàn)
12.2.2 列聯(lián)表中的獨(dú)立性
12.2.3 數(shù)值變量間的獨(dú)立性
12.2.4 兩樣本和K樣本相關(guān)性檢驗(yàn)
12.2.5 深入探究
12.3 lmPerm包的置換檢驗(yàn)
12.3.1 簡(jiǎn)單回歸和多項(xiàng)式回歸
12.3.2 多元回歸
12.3.3 單因素方差分析和協(xié)方差分析
12.3.4 雙因素方差分析
12.4 置換檢驗(yàn)點(diǎn)評(píng)
12.5 自助法
12.6 boot包中的自助法
12.6.1 對(duì)單個(gè)統(tǒng)計(jì)量使用自助法
12.6.2 多個(gè)統(tǒng)計(jì)量的自助法
12.7 小結(jié)
第四部分 高級(jí)方法
第13章 廣義線性模型
13.1 廣義線性模型和glm()函數(shù)
13.1.1 glm()函數(shù)
13.1.2 連用的函數(shù)
13.1.3 模型擬合和回歸診斷
13.2 Logistic回歸
13.2.1 解釋模型參數(shù)
13.2.2 評(píng)價(jià)預(yù)測(cè)變量對(duì)結(jié)果概率的影響
13.2.3 過度離勢(shì)
13.2.4 擴(kuò)展
13.3 泊松回歸
13.3.1 解釋模型參數(shù)
13.3.2 過度離勢(shì)
13.3.3 擴(kuò)展
13.4 小結(jié)
第14章 主成分和因子分析
14.1 R中的主成分和因子分析
14.2 主成分分析
14.2.1 判斷主成分的個(gè)數(shù)
14.2.2 提取主成分
14.2.3 主成分旋轉(zhuǎn)
14.2.4 獲取主成分得分
14.3 探索性因子分析
14.3.1 判斷需提取的公共因子數(shù)
14.3.2 提取公共因子
14.3.3 因子旋轉(zhuǎn)
14.3.4 因子得分
14.3.5 其他與EFA相關(guān)的包
14.4 其他潛變量模型
14.5 小結(jié)
第15章 處理缺失數(shù)據(jù)的高級(jí)方法
15.1 處理缺失值的步驟
15.2 識(shí)別缺失值
15.3 探索缺失值模式
15.3.1 列表顯示缺失值
15.3.2 圖形探究缺失數(shù)據(jù)
15.3.3 用相關(guān)性探索缺失值
15.4 理解缺失數(shù)據(jù)的來由和影響
15.5 理性處理不完整數(shù)據(jù)
15.6 完整實(shí)例分析(行刪除)
15.7 多重插補(bǔ)
15.8 處理缺失值的其他方法
15.8.1 成對(duì)刪除
15.8.2 簡(jiǎn)單(非隨機(jī))插補(bǔ)
15.9 小結(jié)
第16章 高級(jí)圖形進(jìn)階
16.1 R中的四種圖形系統(tǒng)
16.2 lattice包
16.2.1 條件變量
16.2.2 面板函數(shù)
16.2.3 分組變量
16.2.4 圖形參數(shù)
16.2.5 頁面擺放
16.3 ggplot2包
16.4 交互式圖形
16.4.1 與圖形交互:鑒別點(diǎn)
16.4.2 playwith
16.4.3 latticist
16.4.4 iplots包的交互圖形
16.4.5 rggobi
16.5 小結(jié)
后記:探索R的世界
附錄A 圖形用戶界面
附錄B 自定義啟動(dòng)環(huán)境
附錄C 從R中導(dǎo)出數(shù)據(jù)
附錄D 制作出版級(jí)品質(zhì)的輸出
附錄E R中的矩陣運(yùn)算
附錄F 本書中用到的擴(kuò)展包
附錄G 處理大數(shù)據(jù)
附錄H 更新R
參考文獻(xiàn)
章節(jié)摘錄
版權(quán)頁: 插圖: 這種方法的交互性很強(qiáng)。他擬合了一系列模型,檢驗(yàn)它們是否符合相應(yīng)的統(tǒng)計(jì)假設(shè),探索了所有異常的發(fā)現(xiàn),最終從許多可能的模型中選擇了“最佳”的模型。如果成功,那么結(jié)果將會(huì)幫助他完成以下任務(wù)。 在眾多變量中判斷哪些對(duì)預(yù)測(cè)橋梁退化是有用的,得到它們的相對(duì)重要性,從而關(guān)注重要的變量。 根據(jù)回歸所得的等式預(yù)測(cè)新的橋梁的退化情況(預(yù)測(cè)變量的值已知,但是橋梁退化程度未知),找出那些可能會(huì)有麻煩的橋梁。 利用對(duì)異常橋梁的分析,獲得一些意外的信息。比如他發(fā)現(xiàn)某些橋梁的退化速度比預(yù)測(cè)的更快或更慢,那么研究這些“離群點(diǎn)”可能會(huì)有重大的發(fā)現(xiàn),能夠幫助理解橋梁退化的機(jī)制。 可能橋梁的例子并不能引起你的興趣。而我是從事臨床心理學(xué)和統(tǒng)計(jì)的,對(duì)土木工程也是一無所知,但是這其中蘊(yùn)含的一般性思想適用于物理、生物和社會(huì)科學(xué)的許多問題。以下問題都可以通過OLS方法進(jìn)行處理。
媒體關(guān)注與評(píng)論
“本書從務(wù)實(shí)的角度出發(fā),清晰闡釋了R的基本知識(shí)及統(tǒng)計(jì)數(shù)據(jù)分析,為我提供了很大幫助?!薄 x者評(píng)論
圖書封面
圖書標(biāo)簽Tags
無
評(píng)論、評(píng)分、閱讀與下載