課程簡介
數智賦能
人工智能時代,如何用機器來提高生產力?在這里,你可以學到前沿且實用的技術,挖掘數據的魅力。
模板應用
教你用可落地、易操作的數據科學思維和技術模板構建出優秀模型。
技術精進
聚焦策略分析技術及企業常用的分類、NLP、深度學習、特征工程等數據算法,只教實用干貨,以專精技術能力提升業務效果與效率。
工具應用
課程中安排了Sklearn/LightGBM、Tensorflow/PyTorch、Transformer等工具的應用實現,并根據輸出的結果分析業務需求,為進行合理、有效的策略優化提供數據支撐。
培訓內容
1-1數據庫基本概念
1-2DDL數據定義語言
1-3DML數據操作語言
1-4單表查詢
1-5多表查詢
1-6Python連接SQL
2章預習課(錄播)——Python編程基礎
2-1Python標準數據類型
2-2控制流語句
2-3自定義函數
2-4異常和錯誤
2-5類與面向對象編程
2-6Numpy數組操作
3章預習課(錄播)——數學與統計學基礎
3-1線性代數
3-2微積分
3-3描述性統計
3-4參數估計
3-5假設檢驗
3-6相關分析
3-7卡方分析
3-8一元線性回歸理論推導
3-9多元線性回歸理論推導
4章商業策略分析第1周
4-1數據庫MySQL實戰應用
4-2Python連接SQL數據庫
4-3零售電商多表分析案例
4-4分析基礎-數據分析的概念、過程、能力
4-5統計分析可視化
4-6企業經營分析-指標體系
5章商業策略分析第2周
5-1用Python做數據分析,必會的庫Pandas
5-2用Pandas做數據清洗與數據探索
5-3Python數據可視化庫(Matplotlib,Seaborn)
5-4教育行業分析-學校學科教育可視化案例
5-5統計分析(相關分析,方差分析)
5-6線性回歸(建立模型和模型檢驗)
5-7識別分析-用戶支出影響因素分析案例
6章商業策略分析第3周
6-1邏輯回歸(模型的建立與估計,模型評估)
6-2分類與回歸的結合
6-3信息壓縮-主成分分析與因子分析(數據降維)
6-4用戶流失分析-員工流失預警案例
6-5因子分析-城市發展水平綜合分析
6-6客群分析-標簽體系與與用戶畫像
6-7AB test-應用最廣泛的對比分析方法
6-8應用用戶畫像-美國某企業用戶畫像實戰案例
7章商業策略分析第4周
7-1時間序列分析(ARIMA算法)
7-2帶滯后項的線性回歸
7-3銷售額預測-線上平臺銷售額預測實戰案例
7-4數據采集處理方法(數據采集,數據錄入,數據預處理)
7-5數據管理(數據分類,數據建模,數據倉庫和ETL)
7-6產品目標人群分析-市場數據的應用案例
8章商業策略分析第5周
8-1層次聚類
8-2Kmeans聚類
8-3聚類分析評價方法-決策樹應用
8-4用戶分群-零售行業運營案例
8-5數字化工作方法
8-6運籌優化方法(線性規劃與二次優化,基于業務流程的優化)
8-7數字化運營綜合案例-某機構營銷響應概率預測與風險預測案例
9章商業策略分析第6周
9-1數據接入(接入策略,調度工具,實時數據接入方法)(附加內容)
9-2大數據平臺技術架構與應用(分布式存儲與計算,支持數據分析,大數據架構)(附加內容)
9-3數據挖掘導論
9-4KNN
9-5貝葉斯
9-6SVM
10章機器學習進階第7周
10-1決策樹(ID3,C4.5,CART)
10-2決策樹的模型調優
10-3病馬死亡歸類與識別案例
10-4用戶分類-保險行業用戶分類分析
10-5帶正則項的回歸分析
10-6大數據環境下的回歸分析實現(Spark實現)
11章機器學習進階第8周
11-1AdaBoost,隨機森林,GBDT,XGBoost,LightGBM
11-2關聯規則(關聯規則的概念,評估指標,Apriori算法)
11-3協同過濾
11-4大數據環境下的協同過濾實現
11-5產品組合策略-電信公司產品捆綁銷售策略分析案例
12章機器學習進階第9周
12-1數據處理的前沿方法:特征工程概要
12-2特征工程(特征的建構、選擇、轉換、學習)
12-3感知器及多層感知器
12-4深度神經網絡(BP神經網絡概述,架構)
12-5卷積神經網絡
12-6循環神經網絡
12-7殘差網絡
12-8圖像分析-手寫數字自動識別
13章機器學習進階第10周
13-1數據的爬取(http原理、requests應用)
13-2文本數據清洗(正則表達式、HTML結構及xpath應用)
13-3文本特征加工(分詞與詞性標注,文本特征處理,關鍵詞抽取、文本分類與聚類方法)
13-4詞嵌入(CBOW與Skip-gram)
13-5注意力機制Attention
13-6預訓練框架Transformer
13-7Bert
13-8自然語言處理-用戶情緒自動識別
14章機器學習進階第11周
14-1聚類分析進階(密度聚類,高斯混合聚類,譜聚類)
14-2異常識別(孤立森林,局部異常因子)
14-3交易反欺詐-異常交易識別案例
14-4實戰項目-金融行業反欺詐
15章機器學習進階第12周
15-1實戰項目-行業文本分析
15-2實戰項目-信用評分卡
16章畢業周
16-1畢業答辯
17章選修課
17-1數字化運營【18課時】
17-2數據產品經理?【1課時】
17-3Python爬蟲【15課時】
17-4深度學習之圖像識別【6課時】
17-5Tableau多維可視化分析【3課時】
面向對象
希望提升數據挖掘技術的在職提升者
從事算法科學、深度學習等工作的科研人員、分析師與工程師等
產品、運營、營銷、管理、咨詢相關崗位從業者,希望增加數據分析技能與思維
參加CDA等級認證考試LEVELII和LEVELⅢ考生
學習目標
熟練掌握Python數據挖掘算法與實踐,包括統計分析、統計模型、機器學習算法、深度學習算法、文本挖掘算法
靈活使用數據挖掘算法解決各行業的業務問題,通過策略優化和精準預測來解決運營、產品、營銷方面的問題