出版時間:2011-7 出版社:西安交通大學出版社 作者:菲爾·斯佩克特 頁數(shù):167
Tag標簽:無
內(nèi)容概要
自創(chuàng)立以來,R已經(jīng)成為統(tǒng)計計算和數(shù)據(jù)分析的一個優(yōu)秀軟件。該軟件的唾手可得以及范圍廣泛的程序包再加上隨時提供支持的R社區(qū),使R成為幾乎任何一種和統(tǒng)計相關(guān)的計算任務的一個極好選擇。然而,很多用戶,特別是那些有其它程序語言經(jīng)驗的用戶,并沒有完全利用R的能力。由于R
的特性,在其它程序語言中有用的方法在R中可能效率并不高。菲爾·斯佩克特的《R語言數(shù)據(jù)操作》展示了一系列將數(shù)據(jù)讀入R并進行高效處理的方法。
除了內(nèi)置的函數(shù),還包括了可以從CRAN(綜合R檔案網(wǎng)絡)下載的大量現(xiàn)成的程序包。展示的所有方法都利用了R的核心特性:對于通常的數(shù)據(jù)管理任務所提供的向量化運算,高效的下標使用,R函數(shù)的正確使用。
最有經(jīng)驗的R用戶發(fā)現(xiàn),特別是在處理大型數(shù)據(jù)集時。將R和其它程序結(jié)合使用可能會有幫助,尤其是數(shù)據(jù)庫程序。因此,對于在R中使用數(shù)據(jù)庫,以及從電子表格和其它程序創(chuàng)建的數(shù)據(jù)集中提取數(shù)據(jù)的方法,這些都有詳細的論述。R中雖然有時會忽略字符操作,在這里卻作了詳細的論述。使得那些傳統(tǒng)地使用腳本語言解決的問題完全可以用R解決。對于那些有其它程序語言經(jīng)驗的用戶提供了有效使用程序結(jié)構(gòu)——例如循環(huán)——的指南。
由于許多統(tǒng)計建模和圖形函數(shù)需要數(shù)據(jù)框形式的數(shù)據(jù),全書自始至終都提供了將普通函數(shù)的輸出結(jié)果轉(zhuǎn)化為數(shù)據(jù)框的技術(shù)。
通過使用各種不同的例子(其數(shù)據(jù)來源于R或者是輕松可得的模擬數(shù)據(jù)集),《R語言數(shù)據(jù)操作》可推薦給任何想從運行簡單的例子提高到可以對實際的真實數(shù)據(jù)提供操作解決方案的R使用者。
作者簡介
菲爾·斯佩克特
1983年在美國德州農(nóng)工大學獲得統(tǒng)計學博士學位,1987年至今在美國加州大學伯克利分校從事教研工作?,F(xiàn)任該校統(tǒng)計系的應用程序管理員,為統(tǒng)計系副教授,主講統(tǒng)計計算課程。迄今已發(fā)表多篇關(guān)于統(tǒng)計計算和統(tǒng)計軟件的論文,并著有三本書,其中data
Manipulation with R已翻譯成日文出版。
書籍目錄
譯者序
前言
第1章 R中的數(shù)據(jù)
1.1 模式和類
1.2 R的數(shù)據(jù)存儲
1.3 模式與類的檢測
1.4 R對象的結(jié)構(gòu)
1.5 對象的轉(zhuǎn)換
1.6 缺失值
1.7 缺失值的處理
第2章 讀取和寫入數(shù)據(jù)
2.1 讀取向量和矩陣
2.2 數(shù)據(jù)框:read.table
2.3 逗號和制表符分隔的輸入文件
2.4 固定寬度輸入文件
2.5 從R對象中提取數(shù)據(jù)
2.6 連接
2.7 讀取大型數(shù)據(jù)文件
2.8 生成數(shù)據(jù)
2.8.1 序列
2.8.2 隨機數(shù)
2.9 排列
2.9.1 隨機排列
2.9.2 枚舉所有排列
2.10 序列的處理
2.11 電子表格
2.11.1 基于Windows的RODBC包
2.11.2 gdata程序包(所有平臺)
2.12 保存和加載R數(shù)據(jù)對象
2.13 處理二進制文件
2.14 將R對象寫入ASCII格式的文件
2.14.1 write函數(shù)
2.14.2 write.table函數(shù)
2.15 從其它程序中讀取數(shù)據(jù)
第3章 R與數(shù)據(jù)庫
3.1 SQL簡介
3.1.1 導航命令
3.1.2 SQL基礎(chǔ)
3.1.3 綜合匯總
3.1.4 兩個數(shù)據(jù)庫的合并
3.1.5 子查詢
3.1.6 修改數(shù)據(jù)庫記錄
3.2 ODBC
3.3 使用RODBC包
3.4 DBI包
3.5 訪問MySQL數(shù)據(jù)庫
3.6 執(zhí)行查詢
3.7 規(guī)范化的表
3.8 將數(shù)據(jù)讀入MySQL
3.9 更復雜的匯總
第4章 日期
4.1 as.Date
4.2 chron包
4.3 POSIX類
4.4 日期的處理
4.5 時間間隔
4.6 時間序列
第5章 因子
5.1 因子的使用
5.2 數(shù)值型因子
5.3 因子的操作
5.4 根據(jù)連續(xù)變量創(chuàng)建因子
5.5 基于日期和時間的因子
5.6 交互作用
第6章 下標
6.1 下標的基礎(chǔ)知識
6.2 數(shù)值型下標
6.3 字符型下標
6.4 邏輯型下標
6.5 矩陣和數(shù)組的下標
6.6 矩陣的特殊函數(shù)
6.7 列表
6.8 數(shù)據(jù)框下標
第7章 字符操作
7.1 字符數(shù)據(jù)的基礎(chǔ)知識
7.2 顯示和連接字符串
7.3 處理分散的字符值
7.4 R中的正則表達式
7.5 正則表達式的基礎(chǔ)知識
7.6 拆分字符值
7.7 在R中使用正則表達式
7.8 替換和標記
第8章 數(shù)據(jù)匯總
8.1 table函數(shù)
8.2 匯總路線圖
8.3 將函數(shù)映射到向量或列表
8.4 將函數(shù)映射到矩陣或數(shù)組
8.5 基于組的函數(shù)映射
8.6 reshape包
8.7 R中的循環(huán)
第9章 重塑數(shù)據(jù)
9.1 修改數(shù)據(jù)框中的變量
9.2 變量的重新編碼
9.3 recode函數(shù)
9.4 重塑數(shù)據(jù)框
9.5 reshape包
9.6 合并數(shù)據(jù)框
9.7 在merge的環(huán)境下
索引
圖書封面
圖書標簽Tags
無
評論、評分、閱讀與下載