課程描述INTRODUCTION
Python數(shù)據(jù)分析
· 系統(tǒng)工程師· 高層管理者· 中層領(lǐng)導(dǎo)



日程安排SCHEDULE
課程大綱Syllabus
Python數(shù)據(jù)分析
【課程目標(biāo)】
本課程為基礎(chǔ)課程,主要講解如何利用Python進(jìn)行數(shù)據(jù)分析,以及數(shù)據(jù)可視化。假定學(xué)員已經(jīng)基本掌握Python語(yǔ)言的使用。
通過(guò)本課程的學(xué)習(xí),達(dá)到如下目的:
1、掌握數(shù)據(jù)分析的基本步驟和過(guò)程(數(shù)據(jù)分析六步曲)
2、掌握搭建數(shù)據(jù)分析框架的基本思想(數(shù)據(jù)分析框架)
3、熟悉Pandas常用數(shù)據(jù)結(jié)構(gòu),掌握用Python訪問(wèn)、操作數(shù)據(jù)集
4、掌握Pandas常用的統(tǒng)計(jì)功能(函數(shù)和方法)
5、理解統(tǒng)計(jì)分析原理,掌握統(tǒng)計(jì)分析常用的分析方法
6、熟練掌握matplotlib模塊,熟練畫(huà)圖函數(shù)
7、學(xué)會(huì)解讀圖形,形成業(yè)務(wù)結(jié)論和業(yè)務(wù)策略。
【授課對(duì)象】
業(yè)務(wù)支持部、IT系統(tǒng)部、系統(tǒng)開(kāi)發(fā)部、網(wǎng)絡(luò)運(yùn)維部等相關(guān)技術(shù)人員。
【課程大綱】
一、數(shù)據(jù)分析基礎(chǔ)
目的:掌握數(shù)據(jù)分析基本步驟和過(guò)程,學(xué)會(huì)如何構(gòu)造數(shù)據(jù)分析框架
1、數(shù)據(jù)分析 VS 數(shù)據(jù)挖掘
2、數(shù)據(jù)分析的六步曲
-步驟1:明確目的--理清思路
-步驟2:數(shù)據(jù)收集—理清思路
-步驟3:數(shù)據(jù)預(yù)處理—尋找答案
-步驟4:數(shù)據(jù)分析--尋找答案
-步驟5:數(shù)據(jù)展示--觀點(diǎn)表達(dá)
-步驟6:報(bào)表撰寫(xiě)--觀點(diǎn)表達(dá)
3、搭建精準(zhǔn)營(yíng)銷(xiāo)分析框架
演練:如何用大數(shù)據(jù)來(lái)支撐手機(jī)精準(zhǔn)營(yíng)銷(xiāo)項(xiàng)目
二、數(shù)據(jù)操作基礎(chǔ)
1、簡(jiǎn)化的Python操作過(guò)程
2、常用擴(kuò)展包
-Numpy數(shù)組處理支持
-Pandas數(shù)據(jù)分析和探索工具
-Matplotlib可視化工具庫(kù)
3、數(shù)據(jù)集讀寫(xiě)
-讀取文件(CSV文件、Excel文件)
-數(shù)據(jù)集保存(CSV、Excel)
4、數(shù)據(jù)集結(jié)構(gòu)
-數(shù)據(jù)集基本屬性
-Index:位置索引、標(biāo)簽索引
-Series:一維結(jié)構(gòu)
-DataFrame:二維結(jié)構(gòu)
5、數(shù)據(jù)集基本操作
-數(shù)據(jù)訪問(wèn):行訪問(wèn)/列訪問(wèn)/值訪問(wèn)
-字段類(lèi)型
-類(lèi)型檢查
-類(lèi)型轉(zhuǎn)換
-定義有序類(lèi)別變量
-排序
-按值排序
-按索引排序
-數(shù)據(jù)篩選
-數(shù)據(jù)修改
-數(shù)據(jù)刪除
三、統(tǒng)計(jì)分析方法篇
1、統(tǒng)計(jì)分析基礎(chǔ)
-統(tǒng)計(jì)分析的關(guān)鍵要素
-統(tǒng)計(jì)分析三個(gè)步驟
2、六種統(tǒng)計(jì)操作
-描述統(tǒng)計(jì)describe
-分類(lèi)計(jì)數(shù)value_counts
-分段計(jì)數(shù)/分箱計(jì)數(shù)value_counts(bins)
-分類(lèi)匯總(groupby, count/sum/mean/…)
-透視表(多維統(tǒng)計(jì)分析)pivot_table
-按日期匯總resample/to_period
案例實(shí)戰(zhàn):掌握常用的Python統(tǒng)計(jì)函數(shù)/方法
3、五種統(tǒng)計(jì)分析方法
-對(duì)比分析法(不同用戶(hù)的消費(fèi)水平差異)
-結(jié)構(gòu)分析法(用戶(hù)的學(xué)歷結(jié)構(gòu)、收入結(jié)構(gòu)分析、動(dòng)態(tài)結(jié)構(gòu)分析)
-分布分析法(用戶(hù)的年齡分布、用戶(hù)消費(fèi)層次)
-交叉分析法(產(chǎn)品偏好分析)
-趨勢(shì)分析法(銷(xiāo)售淡旺季節(jié)、用戶(hù)活躍時(shí)間)
案例實(shí)戰(zhàn):掌握常用的統(tǒng)計(jì)分析方法
四、數(shù)據(jù)可視化
目的:掌握作圖擴(kuò)展庫(kù),實(shí)現(xiàn)數(shù)據(jù)可視化
1、中文顯示的問(wèn)題解決
2、了解圖形元素及其函數(shù)
-標(biāo)題、坐標(biāo)軸、刻度
-數(shù)據(jù)標(biāo)簽、文本、注釋
-圖例、網(wǎng)格線(xiàn)、邊框
3、簡(jiǎn)單圖形的畫(huà)法
-柱狀圖(簡(jiǎn)單/復(fù)式/堆積/堆積百分比柱狀圖)
-直方圖(分布分析,查看分布特征)
-箱圖(判斷離群值)
-餅圖(結(jié)構(gòu)分析)
-折線(xiàn)圖(趨勢(shì)分析)
4、復(fù)雜圖形的畫(huà)法
-多子圖
-多坐標(biāo)系作圖
-多區(qū)域作圖
5、圖形保存
五、數(shù)據(jù)預(yù)處理
1、數(shù)據(jù)預(yù)處理四大任務(wù)
-數(shù)據(jù)清洗
-數(shù)據(jù)集成
-樣本處理
-變量處理
2、數(shù)據(jù)集成
-數(shù)據(jù)追回
-變量合并
-拼接
演練:樣本追加與變量合并
3、數(shù)據(jù)清洗
-四大異常數(shù)據(jù)
-重復(fù)值檢查與處理
-無(wú)效值檢查與處理
-離群值檢查與處理
-缺失值檢查與處理
演練:異常值查找、刪除、填充
4、樣本處理
5、變量處理
六、實(shí)戰(zhàn)篇(上述知識(shí)點(diǎn)都融入下面分析實(shí)戰(zhàn)中)
1、零售商用戶(hù)消費(fèi)行為分析
-用戶(hù)行為分析框架:5W2H
-用戶(hù)的典型特征
-用戶(hù)的消費(fèi)能力
-用戶(hù)的消費(fèi)水平
2、運(yùn)營(yíng)商用戶(hù)購(gòu)買(mǎi)行為分析
-用戶(hù)維度
-用戶(hù)地域分布
-用戶(hù)學(xué)歷結(jié)構(gòu)
-用戶(hù)消費(fèi)能力/消費(fèi)層次
-用戶(hù)流量分布/層次
-用戶(hù)流失分析
-產(chǎn)品維度
-套餐銷(xiāo)量分析
-套餐貢獻(xiàn)分析
-服務(wù)滿(mǎn)意度分析
-套餐偏好分析
-時(shí)間維度
-產(chǎn)品淡旺季分析
-用戶(hù)活躍度分析
-重購(gòu)周期分析
-金額維度
-收入結(jié)構(gòu)(用戶(hù)、產(chǎn)品、區(qū)域)
-價(jià)格偏好分析
-成本/利潤(rùn)分析
3、金融風(fēng)險(xiǎn)數(shù)據(jù)分析
-用戶(hù)維度
-違約用戶(hù)的典型特征
-違約用戶(hù)的消費(fèi)水平
-違約的影響因素分析
-違約與學(xué)歷/崗位的關(guān)系
-違約與行業(yè)/職業(yè)的關(guān)系
注:會(huì)根據(jù)學(xué)員所在行業(yè)選擇合適的實(shí)戰(zhàn)案例。
結(jié)束:課程總結(jié)與問(wèn)題答疑。
Python數(shù)據(jù)分析
轉(zhuǎn)載:http://www.moqiwei.com/gkk_detail/265678.html
已開(kāi)課時(shí)間Have start time
- 傅一航
IT相關(guān)內(nèi)訓(xùn)
- Java微服務(wù)開(kāi)發(fā) 郭振杰
- SQL語(yǔ)句基礎(chǔ)使用 郭振杰
- Java企業(yè)級(jí)后臺(tái)開(kāi)發(fā) 郭振杰
- Mysql基礎(chǔ)使用 郭振杰
- 業(yè)務(wù)與IT融合創(chuàng)新的方法與 李福東
- 自智網(wǎng)絡(luò) 楓影
- Python基礎(chǔ)與基礎(chǔ)應(yīng)用 郭振杰
- 金融科技賦能業(yè)務(wù) 李福東
- 前沿信息技術(shù)解析與應(yīng)用創(chuàng)新 張世民
- IPA應(yīng)用實(shí)戰(zhàn) 郭振杰
- 6G技術(shù)與發(fā)展趨勢(shì) 楓影
- 數(shù)據(jù)庫(kù)基礎(chǔ)及實(shí)操(MySQ 郭振杰