出版時間:2012-1 出版社:電子工業(yè) 作者:謝龍漢//尚濤 頁數(shù):505
Tag標簽:無
內(nèi)容概要
本書基于spss
19.0編寫,結合大量的實例對spss各模塊的統(tǒng)計分析功能及圖形功能等進行了詳細講解。每章均給出大量分析案例,具體內(nèi)容為spss簡介、spss數(shù)據(jù)挖掘系統(tǒng)介紹、spss數(shù)據(jù)文件管理、spss數(shù)據(jù)預處理、spss基本統(tǒng)計分析、多重反應分析、均值比較與檢驗、統(tǒng)計圖制作、參數(shù)檢驗、回歸分析、方差分析、相關分析、聚數(shù)分析、判別分析、因子分析、對應分析與結合分析、信度分析、生存分析、對數(shù)線性模型、時間序列分析、缺失值分析,以及spss在財務智能、數(shù)據(jù)預測、股市分析、社會經(jīng)濟分析、金融數(shù)據(jù)分析等方面的數(shù)據(jù)挖掘應用。
本書最大特點是拋棄了其他同類書籍中只介紹理論用法、缺乏案例分析的弊病,全書給出許多數(shù)據(jù)挖掘分析案例,為讀者展示spss在數(shù)據(jù)分析、信用風險管理、直銷分析、社會經(jīng)濟分析等實際項目中的應用技術。
本書適合自然科學和社會科學各領域、各專業(yè)的數(shù)據(jù)分析人員,也可供相關專業(yè)本科生、研究生、科技人員和事業(yè)單位工作人員,以及從事數(shù)據(jù)挖掘、金融分析、商業(yè)咨詢、財務分析的人員使用。
書籍目錄
第1章 spss軟件概述
1.1 spss簡介
1.2 spss操作入門
1.2.1 軟件安裝、啟動及退出
1.2.2 操作環(huán)境
1.2.3 系統(tǒng)參數(shù)的設置
1.3 spss的幫助系統(tǒng)
第2章 spss數(shù)據(jù)挖掘系統(tǒng)
2.1 數(shù)據(jù)挖掘概述
2.1.1 數(shù)據(jù)挖掘的含義
2.1.2 數(shù)據(jù)挖掘與olap
2.1.3 數(shù)據(jù)挖掘和統(tǒng)計學
2.1.4 數(shù)據(jù)挖掘的目的
2.1.5 數(shù)據(jù)挖掘應用
2.1.6 數(shù)據(jù)挖掘流程
2.2 成功的數(shù)據(jù)挖掘
2.2.1 crisp-dm方法論
2.2.2 選擇數(shù)據(jù)挖掘工具
2.2.3 spss數(shù)據(jù)挖掘
2.3 spss數(shù)據(jù)挖掘的過程
2.3.1 商業(yè)理解
2.3.2 數(shù)據(jù)理解
2.3.3 數(shù)據(jù)準備
2.3.4 數(shù)據(jù)模型
2.3.5 評估
2.3.6 部署
第3章 數(shù)據(jù)文件、變量與函數(shù)
3.1 spss的變量類型
3.1.1 數(shù)據(jù)的輸入
3.1.2 變量的編輯
3.2 數(shù)據(jù)文件的打開和保存
3.2.1 打開spss數(shù)據(jù)文件
3.2.2 打開其他格式的數(shù)據(jù)文件
3.2.3 數(shù)據(jù)文件保存
3.3 spss函數(shù)
3.3.1 算術函數(shù)
3.3.2 統(tǒng)計函數(shù)
3.3.3 邏輯函數(shù)
3.3.4 日期和時間函數(shù)
3.3.5 隨機變量函數(shù)
3.3.6 反分布函數(shù)
3.3.7 累計分布函數(shù)
3.3.8 缺失值函數(shù)
3.3.9 字符串函數(shù)
第4章 數(shù)據(jù)預處理
4.1 數(shù)據(jù)文件的整理
4.1.1 排序個案(sort case)過程
4.1.2 轉置(transpose)過程
4.1.3 合并文件(merge file)過程
4.1.4 分類匯總(aggregate)過程
4.1.5 拆分文件(split file)過程
4.1.6 選擇個案(select cases)過程
4.1.7 加權個案(weight cases)過程
4.2 數(shù)據(jù)變量的變換和計算
4.2.1 計算變量(compute variables)過程
4.2.2 計數(shù)(count)過程
4.2.3 重新編碼(recode)過程
4.2.4 個案排秩(rank cases)過程
4.2.5 自動重新編碼(automatic recode)過程
第5章 基本統(tǒng)計分析
5.1 基本概念
5.1.1 基本的統(tǒng)計概念
5.1.2 描述性統(tǒng)計分析
5.2 頻數(shù)分析
5.2.1 frequencies過程的操作界面
5.2.2 實例分析
5.3 描述性統(tǒng)計分析過程
5.3.1 descriptive過程的參數(shù)設置
5.3.2 實例分析
5.4 數(shù)據(jù)探索性分析過程
5.4.1 explore過程的參數(shù)設置
5.4.2 實例分析
5.5 列聯(lián)表分析過程
5.5.1 crosstabs過程的參數(shù)設置
5.5.2 實例分析
第6章 參數(shù)檢驗
6.1 參數(shù)估計和假設檢驗概述
6.1.1 參數(shù)估計
6.1.2 假設檢驗
6.2 均值(means)過程
6.2.1 spss的means過程參數(shù)設置
6.2.2 means過程實例
6.3 單樣本t檢驗
6.3.1 one-sample t test過程的參數(shù)設置
6.3.2 實例分析
6.4 獨立兩樣本t檢驗
6.4.1 independent-sample t test過程的參數(shù)設置
6.4.2 實例分析
6.5 配對兩樣本t檢驗
6.5.1 paired-sample t test過程的參數(shù)設置
6.5.2 實例分析
第7章 基本圖形的繪制
7.1 統(tǒng)計圖概述
7.2 條形圖
7.3 線圖
7.4 面積圖
7.5 餅圖
7.5.1 spss設置
7.5.2 實例分析
7.6 高低圖
7.7 質(zhì)量控制圖
7.8 箱圖
7.8.1 spss參數(shù)設置
7.8.2 實例分析
7.9 散點圖
7.9.1 spss參數(shù)設置
7.9.2 實例分析
7.10 直方圖
7.10.1 p-p圖和q-q圖
7.11 時間序列圖
7.11.1 spss參數(shù)設置
7.11.2 實例分析
第8章 非參數(shù)檢驗
8.1 非參數(shù)檢驗概述
8.2 檢驗
8.2.1 檢驗的參數(shù)設置
8.2.2 檢驗實例分析
8.3 二項分布檢驗
8.3.1 二項分布檢驗的參數(shù)設置
8.3.2 實例分析
8.4 游程檢驗
8.4.1 游程檢驗的參數(shù)設置
8.4.2 實例分析
8.5 單樣本k-s檢驗
8.5.1 單樣本k-s檢驗的參數(shù)設置
8.5.2 實例分析
8.6 兩獨立樣本分布位置檢驗
8.6.1 兩獨立樣本分布位置檢驗的參數(shù)設置
8.6.2 實例分析
8.7 多個獨立樣本分布位置檢驗
8.7.1 spss參數(shù)設置
8.7.2 實例分析
8.8 兩相關樣本分布位置檢驗
8.8.1 spss參數(shù)設置
8.8.2 實例分析
8.9 多個配對樣本分布位置檢驗
8.9.1 spss參數(shù)設置
8.9.2 實例分析
第9章 方差分析
9.1 方差分析的基本原理
9.1.1 自由度與平方和分解
9.1.2 f檢驗
9.1.3 多重比較
9.2 單因素方差分析
9.2.1 單因素方差分析步驟
9.2.2 判斷與結論
9.2.3 one-way anova過程的參數(shù)設置
9.2.4 實例分析
9.3 多因素方差分析
9.3.1 只考慮主效應的多因素方差分析
9.3.2 存在交互效應的多因素方差分析
9.3.3 univariate過程參數(shù)設置
9.3.4 實例分析
9.4 協(xié)方差分析
9.4.1 協(xié)方差分析概述
9.4.2 實例分析
第10章 回歸分析
10.1 線性回歸
10.1.1 線性回歸模型
10.1.2 最小二乘估計
10.1.3 回歸方程的顯著性檢驗
10.1.4 預測問題
10.1.5 spss線性回歸分析設置
10.1.6 回歸分析模型的實例分析
10.2 非線性回歸
10.2.1 非線性回歸分析的基本原理
10.2.2 非線性回歸參數(shù)設置
10.2.3 案例——銷售數(shù)量和廣告投入的非線性回歸分析
10.3 logistic回歸
10.3.1 logistic回歸模型概述
10.3.2 binary logistic回歸模型參數(shù)設置
10.3.3 案例——銀行貸款的信用風險分析
第11章 相關分析
11.1 相關分析概述
11.1.1 相關關系
11.1.2 相關圖形和相關系數(shù)
11.1.3 spss的相關分析功能簡介
11.2 bivariate過程
11.2.1 兩變量相關分析簡介
11.2.2 bivariate過程的參數(shù)設置
11.2.3 案例——汽車銷售中各變量之間的相關分析
11.3 partial過程
11.3.1 partial過程的參數(shù)設置
11.3.2 案例——醫(yī)療門診病人的流動情況分析
11.4 distances(距離)過程
11.4.1 距離分析參數(shù)設置
11.4.2 案例——全國各個省市自治區(qū)直轄市的農(nóng)民家庭收支的分布研究
第12章 聚類分析
12.1 聚類分析的原理
12.1.1 一般原理
12.1.2 聚類分析步驟
12.1.3 系統(tǒng)聚類方法
12.2 快速樣本聚類過程
12.2.1 快速聚類簡介
12.2.2 spss快速聚類的設置
12.2.3 案例——2006年中國主要城市空氣質(zhì)量的比較分析
12.3 分層聚類過程
12.3.1 分層聚類簡介
12.3.2 spss分層聚類設置
12.3.3 案例——中國經(jīng)濟地理區(qū)域的聚類分析
12.4 兩階段聚類分析
12.4.1 兩階段聚類簡介
12.4.2 spss兩階段聚類的設置
12.4.3 案例——兩階段聚類分析應用于農(nóng)村居民人均收入與生活消費支出研究
第13章 判別分析
13.1 判別分析的基本原理
13.1.1 判別分析簡介
13.1.2 判別分析的數(shù)學模型與判別方法
13.2 一般判別分析
13.2.1 一般判別分析的參數(shù)設置
13.2.2 案例——上市公司類型的比較分析
13.3 逐步判別分析
13.3.1 逐步判別的參數(shù)設置
13.3.2 案例——全國各個省市地區(qū)的農(nóng)民家庭收支的分布規(guī)律研究
第14章 因子分析
14.1 因子分析簡介
14.1.1 因子分析的基本原理
14.1.2 因子分析的基本步驟和過程
14.2 spss軟件進行因子分析
14.2.1 spss因子分析的參數(shù)設置
14.2.2 案例——汽車銷售的數(shù)據(jù)中各變量的因子分析
第15章 對應分析
15.1 對應分析的基本原理
15.2 簡單對應分析
15.2.1 correspondence analysis過程
15.2.2 案例——簡單對應分析實例
15.3 optimal scaling過程
15.3.1 optimal scaling過程的spss參數(shù)設置
15.3.2 案例——最優(yōu)尺度分析實例
第16章 可靠性和多維尺度分析
16.1 可靠性分析
16.1.1 可靠性分析的基本原理
16.1.2 可靠性分析的參數(shù)設置
16.1.3 案例——電視節(jié)目調(diào)查數(shù)據(jù)可靠性分析
16.2 多維尺度分析
16.2.1 多維尺度分析簡介
16.2.2 alscal過程的參數(shù)設置
16.2.3 案例——多維尺度實例分析
第17章 生存分析
17.1 生存分析簡介
17.1.1 生存分析的基本概念
17.1.2 生存資料的特點
17.1.3 生存分析方法
17.1.4 spss中的生存分析過程
17.2 life tables過程
17.2.1 life tables過程的參數(shù)設置
17.2.2 案例——電信公司客戶流失分析
17.3 kaplan-meier分析
17.3.1 kaplan-meier分析的步驟
17.3.2 案例——新藥開發(fā)的數(shù)據(jù)分析
17.4 cox模型回歸分析
17.4.1 cox回歸模型
17.4.2 cox模型參數(shù)設置
17.4.3 案例——電信公司的客戶流失的cox回歸模型分析
第18章 對數(shù)線性模型
18.1 對數(shù)線性模型概述
18.2 general過程
18.2.1 general過程的參數(shù)設置
18.2.2 實例分析
18.3 logit過程
18.3.1 logit過程的參數(shù)設置
18.3.2 實例分析
18.4 模型(model)selection過程
18.4.1 模型(model)selection的參數(shù)設置
18.4.2 實例分析
第19章 時間序列分析
19.1 時間序列概述
19.1.1 時間序列的組成部分
19.1.2 時間序列的數(shù)學模型
19.1.3 時間序列的分析步驟
19.1.4 spss時間序列分析功能
19.2 時間序列數(shù)據(jù)的預處理
19.2.1 缺失值替換
19.2.2 定義時間變量
19.2.3 時間序列的平穩(wěn)化
19.3 指數(shù)平滑模型過程
19.3.1 指數(shù)平滑的基本原理
19.3.2 指數(shù)平滑模型的參數(shù)設置
19.3.3 案例——銷售數(shù)據(jù)預測分析
19.4 arima模型
19.4.1 arima模型的基本原理
19.4.2 arima模型的參數(shù)設置
19.4.3 案例——上海證券交易所綜合指數(shù)收益率模擬預測分析
19.5 季節(jié)分解模型過程
19.5.1 季節(jié)分解模型的參數(shù)設置
19.5.2 案例——具有季節(jié)因素的服裝銷售數(shù)據(jù)的預測分析
第20章 缺失值分析
20.1 缺失值理論概述
20.1.1 數(shù)據(jù)缺失方式
20.1.2 缺失值處理方法
20.2 spss缺失值分析操作
20.2.1 缺失值分析的參數(shù)設置
20.2.2 案例——數(shù)據(jù)集中缺失值的實例分析
第21章 決策樹模型
21.1 決策樹模型概述
21.1.1 chaid算法
21.1.2 exhaustive chaid算法
21.1.3 cart算法
21.1.4 quest算法
21.2 決策樹的參數(shù)設置
21.2.1 變量設置
21.2.2 類別(categories)設置
21.2.3 輸出(output)設置
21.2.4 驗證(validation)設置
21.2.5 保存(save)設置
21.2.6 條件(criteria)設置
21.2.7 chaid算法設置
21.2.8 cart算法設置
21.2.9 quest算法設置
21.2.10 修剪(pruning)設置
21.2.11 替代變量(surrogates)設置
21.2.12 選項(options)設置
21.2.13 誤分類成本設置
21.2.14 利潤(profits)設置
21.2.15 先驗概率(prior probabilities)設置
21.2.16 實例分析
21.2.17 模型建立
21.2.18 模型評估
第22章 神經(jīng)網(wǎng)絡
22.1 神經(jīng)網(wǎng)絡概述
22.1.1 歷史及現(xiàn)狀
22.1.2 神經(jīng)網(wǎng)絡特點
22.1.3 神經(jīng)元模型
22.1.4 神經(jīng)網(wǎng)絡模型
22.1.5 神經(jīng)網(wǎng)絡的學習規(guī)則
22.1.6 spss神經(jīng)網(wǎng)絡模型
22.2 spss神經(jīng)網(wǎng)絡模型的設置
22.2.1 多層感知器(mlp)的設置
22.2.2 徑向基函數(shù)(rbf)的設置
22.3 實例分析
22.3.1 參數(shù)設置
22.3.2 結果分析
第23章 信用風險分析
23.1 信用風險概述
23.1.1 信用風險基本概念
23.1.2 信用風險度量方法
23.2 案例分析
23.1.3 spss中信用風險分析模塊
23.2.1 二元logistic過程
23.2.2 決策樹(tree)過程
23.2.3 discriminant過程
第24章 spss在社會經(jīng)濟綜合評價中的應用
24.1 沿海省市經(jīng)濟綜合指標的主成分分析
24.2 中國城鎮(zhèn)居民消費結構的聚類分析
24.3 我國內(nèi)地可支配收入和消費性支出之間的回歸分析
章節(jié)摘錄
版權頁:插圖:數(shù)據(jù)挖掘過程中,數(shù)據(jù)挖掘的工具同樣也是很重要的,下面舉幾個例子。①尋找一個已被證實的可用于解決項目所陳述商務問題的數(shù)據(jù)挖掘工具:即選擇一種所知道的,可以用于解決公司問題,并在計劃應用方面有成功記錄的工具。②選擇用于在商務理解和數(shù)據(jù)挖掘技術方面起到溝通作用的工具:確保工具所用的步驟與數(shù)據(jù)挖掘的商務需要相匹配。·工具是否可清晰地表達數(shù)據(jù)挖掘概念;·工具是否與項目管理軟件或其他可能用的工具相結合?如果不能,是否不得不新建應用軟件以彌補此不足。③確保工具可對現(xiàn)有的數(shù)據(jù)資源和格式進行操作:如果能選擇一種能提取和合并多來源、多格式數(shù)據(jù),將會節(jié)省時間和金錢,并最大可能地得到可靠結果的工具。這一點很重要,尤其是在數(shù)據(jù)挖掘過程的后期發(fā)現(xiàn)不得不從新的來源加入新的數(shù)據(jù)時。④尋找交互式開發(fā)和可視化能力:選擇一種可提供交互式可視技術的工具會使開發(fā)和理解數(shù)據(jù)變得容易。這些技術會使你通過在圖內(nèi)變化及根據(jù)不同的數(shù)據(jù)尺度產(chǎn)生新的圖表更快地獲得直覺。⑤選擇一種可高效、易解的進行數(shù)據(jù)準備的工具:選擇一種可高效進行數(shù)據(jù)準備(從初始步驟到模型建立),且以易于理解的方式表達數(shù)據(jù)準備步驟的工具會節(jié)省時間和資源。這會使不同經(jīng)驗水平酌項目成員獲得有效的結果。⑥確保工具可自動地提取數(shù)據(jù):選擇一種可為不同數(shù)據(jù)步驟自動提取數(shù)據(jù)的工具,可以避免耗時的人工書寫查詢。⑦該工具是否可在合理的時間內(nèi)建立有效的模型:尋找一種工具,它可使分析家快速找到最有效的模型。這種工具應該支持有效的建立和檢測多個模型。⑧選擇一種含寬范圍技術的工具:為了確保最好的結果,確保工具能為可視化、分類、聚類、相關和回歸提供一個寬范圍的技術或運算法則。例如,可能發(fā)現(xiàn),對某一數(shù)據(jù)而言,一種技術比另一種更好。你需要能靈活地試用多種技術以獲得準確、有效的結果。這種工具應該能聯(lián)合應用在不同情況下可獲最佳結果的多種技術。⑨該工具是否可利用現(xiàn)有的數(shù)據(jù)和設備:選擇一種數(shù)據(jù)挖掘工具,它能利用現(xiàn)存的數(shù)據(jù)——或數(shù)據(jù)庫中或文件中,也能與現(xiàn)有的分析和可視化工具相兼容。你不會愿意因為不能利用現(xiàn)有的數(shù)據(jù)庫而浪費時間和資源再新建一個。⑩選擇一種可發(fā)送一致的、高質(zhì)的結果的工具:要得到準確的結果,需利用在各種情形下都能很好工作的、適應性強的數(shù)據(jù)挖掘環(huán)境和各種數(shù)據(jù)的工具,而不是單一地為某一類型的數(shù)據(jù)或環(huán)境而設計的工具。工具應該能管理任何可能有助于闡釋商務問題的數(shù)據(jù)。
編輯推薦
《SPSS統(tǒng)計分析與數(shù)據(jù)挖掘》:SPSS-全球使用最為廣泛的統(tǒng)計分析軟件,SPSS-金融、科研、數(shù)據(jù)挖掘領域必備之軟件,基礎知識-實訓實例-工程實例,實例操作視頻教學,輕松學習。
圖書封面
圖書標簽Tags
無
評論、評分、閱讀與下載
SPSS統(tǒng)計分析與數(shù)據(jù)挖掘 PDF格式下載