課程簡(jiǎn)介
python進(jìn)階課程為想希望從事數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)工程師相關(guān)崗位的人員或者希望通過(guò)CDA三級(jí)認(rèn)證考試人員開(kāi)設(shè)。課程設(shè)計(jì)循序漸進(jìn),從基礎(chǔ)工具與理論知識(shí)入門(mén),進(jìn)階機(jī)器學(xué)習(xí)模型、文本挖掘模型,以實(shí)戰(zhàn)項(xiàng)目案例貫穿課程講解。其中包括:Python編程基礎(chǔ)、數(shù)據(jù)清洗、數(shù)據(jù)處理與特征工程、Python機(jī)器學(xué)習(xí)、自然語(yǔ)言處理等課程模塊。課程理論知識(shí)涵蓋CDA LEVEL III等級(jí)考試的所有考點(diǎn),有利于對(duì)應(yīng)等級(jí)考試的學(xué)員備考。
學(xué)習(xí)目標(biāo)
熟練掌握數(shù)據(jù)科學(xué)領(lǐng)域最受歡迎的編程語(yǔ)言-Python
掌握使用Python和pandas庫(kù)進(jìn)行數(shù)據(jù)清洗和預(yù)處理
使用matplotlib、seaborn進(jìn)行初級(jí)可視化
使用Pyecharts進(jìn)行高級(jí)數(shù)據(jù)可視化
構(gòu)建機(jī)器學(xué)習(xí)算法進(jìn)行分類、預(yù)測(cè)和聚類模型
善用機(jī)器學(xué)習(xí)解決用戶畫(huà)像、精準(zhǔn)營(yíng)銷、風(fēng)險(xiǎn)管理等商業(yè)問(wèn)題
面向?qū)ο?
機(jī)器學(xué)習(xí)零基礎(chǔ)學(xué)員
高校在校生
待業(yè)、期待轉(zhuǎn)行從事數(shù)據(jù)挖掘相關(guān)崗位的在職人員
CDA數(shù)據(jù)分析師levelⅢ考生。
希望借助數(shù)據(jù)挖掘算法來(lái)提升解決企業(yè)運(yùn)營(yíng)、產(chǎn)品運(yùn)營(yíng)中涉及的預(yù)測(cè)問(wèn)題者
對(duì)數(shù)據(jù)挖掘技術(shù)感興趣的各界人士
產(chǎn)品、運(yùn)營(yíng)、營(yíng)銷、管理、咨詢相關(guān)崗位從業(yè)者,希望增加數(shù)據(jù)挖掘技能與思維的學(xué)員
培訓(xùn)內(nèi)容
1章預(yù)習(xí)課(錄播)——數(shù)據(jù)庫(kù)SQL
1-1數(shù)據(jù)庫(kù)基本概念
1-2DDL數(shù)據(jù)定義語(yǔ)言
1-3DML數(shù)據(jù)操作語(yǔ)言
1-4單表查詢
1-5多表查詢
1-6Python連接SQL
2章預(yù)習(xí)課(錄播)——Python編程基礎(chǔ)
2-1Python標(biāo)準(zhǔn)數(shù)據(jù)類型
2-2控制流語(yǔ)句
2-3自定義函數(shù)
2-4異常和錯(cuò)誤
2-5類與面向?qū)ο缶幊?/span>
2-6Numpy數(shù)組操作
3章預(yù)習(xí)課(錄播)——數(shù)學(xué)與統(tǒng)計(jì)學(xué)基礎(chǔ)
3-1線性代數(shù)
3-2微積分
3-3描述性統(tǒng)計(jì)
3-4參數(shù)估計(jì)
3-5假設(shè)檢驗(yàn)
3-6相關(guān)分析
3-7卡方分析
3-8一元線性回歸理論推導(dǎo)
3-9多元線性回歸理論推導(dǎo)
4章機(jī)器學(xué)習(xí)進(jìn)階(Level 3)第1周-數(shù)據(jù)接入與大數(shù)據(jù)平臺(tái)
4-1分布式存儲(chǔ)與計(jì)算
4-2Spark與Flink工作原理
4-3使用PySpark實(shí)現(xiàn)分布式計(jì)算
4-4數(shù)據(jù)接入策略與調(diào)度工具
5章機(jī)器學(xué)習(xí)進(jìn)階(Level 3)第1周-數(shù)據(jù)挖掘?qū)д?/span>
5-1數(shù)據(jù)挖掘?qū)д?/span>
5-2KNN
5-3貝葉斯
5-4SVM
6章機(jī)器學(xué)習(xí)進(jìn)階(Level 3)第2周-決策樹(shù)
6-1決策樹(shù)(ID3,C4.5,CART)
6-2決策樹(shù)的模型調(diào)優(yōu)
6-3病馬死亡歸類與識(shí)別案例
6-4用戶分類-保險(xiǎn)行業(yè)用戶分類分析
7章機(jī)器學(xué)習(xí)進(jìn)階(Level 3)第2周-帶正則項(xiàng)的回歸分析與SVM
7-1帶正則項(xiàng)的回歸分析
7-2大數(shù)據(jù)環(huán)境下的回歸分析實(shí)現(xiàn)(Spark實(shí)現(xiàn))
8章機(jī)器學(xué)習(xí)進(jìn)階(Level 3)第3周-集成與提升方法
8-1集成學(xué)習(xí)的理論基礎(chǔ)
8-2AdaBoost
8-3隨機(jī)森林及其Spark實(shí)現(xiàn)
8-4GBDT,XGBoost,LightGBM及Python實(shí)現(xiàn)
9章機(jī)器學(xué)習(xí)進(jìn)階(Level 3)第3周-關(guān)聯(lián)規(guī)則與協(xié)同過(guò)濾
9-1關(guān)聯(lián)規(guī)則(關(guān)聯(lián)規(guī)則的概念,評(píng)估指標(biāo),Apriori算法)
9-2協(xié)同過(guò)濾
9-3大數(shù)據(jù)環(huán)境下的協(xié)同過(guò)濾實(shí)現(xiàn)
9-4產(chǎn)品組合策略-電信公司產(chǎn)品捆綁銷售策略分析案例
10章機(jī)器學(xué)習(xí)進(jìn)階(Level 3)第4周-高級(jí)數(shù)據(jù)處理與特征工程,神經(jīng)網(wǎng)絡(luò)
10-1數(shù)據(jù)處理的前沿方法:特征工程概要
10-2數(shù)據(jù)不平衡問(wèn)題
10-3特征工程(特征的建構(gòu)、選擇、轉(zhuǎn)換、學(xué)習(xí))
10-4感知器及多層感知器
11章機(jī)器學(xué)習(xí)進(jìn)階(Level 3)第4周-深度學(xué)習(xí)基礎(chǔ)
11-1深度神經(jīng)網(wǎng)絡(luò)基礎(chǔ)
11-2BP神經(jīng)網(wǎng)絡(luò)架構(gòu)
11-3反向傳播算法
11-4梯度與學(xué)習(xí)率專題
11-5圖像分析-手寫(xiě)數(shù)字自動(dòng)識(shí)別
12章機(jī)器學(xué)習(xí)進(jìn)階(Level 3)第5周-爬蟲(chóng),文本分析
12-1數(shù)據(jù)的爬取(http原理、requests應(yīng)用)
12-2文本數(shù)據(jù)清洗(正則表達(dá)式、HTML結(jié)構(gòu)及xpath應(yīng)用)
13章機(jī)器學(xué)習(xí)進(jìn)階(Level 3)第5周-NLP之文本挖掘
13-1分詞與詞性標(biāo)注
13-2文本信息提取
13-3詞嵌入(CBOW與Skip-gram)
13-4構(gòu)建文本信息庫(kù)
13-5文本聚類算法
14章機(jī)器學(xué)習(xí)進(jìn)階(Level 3)第6周-聚類分析進(jìn)階與異常識(shí)別
14-1聚類分析進(jìn)階(密度聚類,高斯混合聚類,譜聚類)
14-2異常識(shí)別(孤立森林,局部異常因子)
14-3交易反欺詐-異常交易識(shí)別案例
15章機(jī)器學(xué)習(xí)進(jìn)階(Level 3)第6周-大型項(xiàng)目案例
15-1實(shí)戰(zhàn)項(xiàng)目-金融行業(yè)反欺詐
16章機(jī)器學(xué)習(xí)進(jìn)階(Level 3)第7周-深度學(xué)習(xí)與NLP前沿技術(shù)
16-1卷積神經(jīng)網(wǎng)絡(luò)CNN
16-2循環(huán)神經(jīng)網(wǎng)絡(luò)RNN與LSTM
16-3殘差網(wǎng)絡(luò)ResNet
16-4注意力機(jī)制Attention
16-5預(yù)訓(xùn)練框架Transformer與遷移學(xué)習(xí)
16-6Bert專題
16-7Pytorch框架與代碼實(shí)踐(NLP案例)
16-8大型項(xiàng)目案例-實(shí)戰(zhàn)項(xiàng)目-信用評(píng)分卡
17章CDA認(rèn)證考試輔導(dǎo)(僅限報(bào)名考試的學(xué)生)
17-1數(shù)據(jù)挖掘概論
17-2高級(jí)數(shù)據(jù)處理與特征工程
17-3自然語(yǔ)言處理與文本分析
17-4機(jī)器學(xué)習(xí)算法
17-5機(jī)器學(xué)習(xí)進(jìn)階(自動(dòng)機(jī)器學(xué)習(xí),樣本不平衡問(wèn)題,半監(jiān)督學(xué)習(xí),模型優(yōu)化)
18章拓展選修課
18-1互聯(lián)網(wǎng)數(shù)字化運(yùn)營(yíng)
18-2何為數(shù)據(jù)產(chǎn)品經(jīng)理
18-3Python爬蟲(chóng)
18-4人工智能(深度學(xué)習(xí))實(shí)戰(zhàn)之圖像識(shí)別
18-5Tableau多維可視化分析
18-6SPSS統(tǒng)計(jì)分析