CDA大數(shù)據(jù)分析集訓(xùn)營(yíng):隨著電子信息、物聯(lián)網(wǎng)、互聯(lián)網(wǎng)等產(chǎn)業(yè)的高速發(fā)展,智能手機(jī)、平板電腦、可穿戴設(shè)備與物聯(lián)網(wǎng)設(shè)備已經(jīng)滲入到現(xiàn)代生產(chǎn)生活的方方面面,每時(shí)每刻都產(chǎn)生著大量的數(shù)據(jù),當(dāng)今社會(huì)已經(jīng)進(jìn)入數(shù)據(jù)爆炸的時(shí)代。各領(lǐng)域中的相關(guān)數(shù)據(jù)不僅量大,而且種類(lèi)繁多、變化速度快、價(jià)值密度低。這些日益凸顯的大數(shù)據(jù)特征在全球掀起一場(chǎng)全新的思維、技術(shù)與商業(yè)變革,無(wú)論是產(chǎn)業(yè)界還是學(xué)術(shù)界都在持續(xù)加大在大數(shù)據(jù)技術(shù)和相關(guān)領(lǐng)域的投入。如今大數(shù)據(jù)技術(shù)已經(jīng)與我們的生活緊密的連接在一起了,例如電商領(lǐng)域的推薦系統(tǒng)、疫情防控,都離不開(kāi)大數(shù)據(jù)技術(shù)的加持。CDA大數(shù)據(jù)分析班課程是立足于市場(chǎng)需求,精心打磨的課程。本課程適宜0基礎(chǔ)有轉(zhuǎn)行需求的同學(xué)學(xué)習(xí),課程內(nèi)容由淺到深,讓大家逐步掌握大數(shù)據(jù)核心技術(shù)。
1.熟練掌握Linux常用命令,能勝任基礎(chǔ)大數(shù)據(jù)運(yùn)維工作
2.熟練掌握SQL語(yǔ)法,熟悉MySQL數(shù)據(jù)庫(kù)性能優(yōu)化
3.掌握J(rèn)ava核心編程,具備大數(shù)據(jù)應(yīng)用開(kāi)發(fā)能力
4.掌握Hadoop/spark生態(tài)核心技術(shù),可根據(jù)需求完成離線或?qū)崟r(shí)大數(shù)據(jù)應(yīng)用開(kāi)發(fā)任務(wù)
5.掌握Python核心編程,完成數(shù)據(jù)預(yù)處理、可視化的代碼編寫(xiě)
6.掌握數(shù)據(jù)挖掘核心技術(shù),勝任數(shù)據(jù)挖掘工程師崗位
1.各行業(yè)數(shù)據(jù)分析、數(shù)據(jù)挖掘從業(yè)者
2.在校數(shù)學(xué),計(jì)算機(jī),統(tǒng)計(jì)等專(zhuān)業(yè)教師和學(xué)生
3.經(jīng)濟(jì),醫(yī)學(xué)生物研究院科研人員
4.數(shù)據(jù)分析,數(shù)據(jù)挖掘興趣愛(ài)好者及轉(zhuǎn)行人士
1章大數(shù)據(jù)基礎(chǔ)-Java核心編程
1-1Java基本介紹、常用語(yǔ)法規(guī)范、開(kāi)發(fā)環(huán)境部署、常量與變量、數(shù)據(jù)類(lèi)型與運(yùn)算符、流程控制語(yǔ)句、方法、數(shù)組
1-2面向?qū)ο缶幊趟枷搿㈩?lèi)與對(duì)象概念及定義、常見(jiàn)類(lèi)及其用法
1-3數(shù)據(jù)結(jié)構(gòu)、List、Set、Map數(shù)據(jù)類(lèi)型介紹、反射機(jī)制、JDBC、Maven
1-4實(shí)戰(zhàn)項(xiàng)目1:進(jìn)銷(xiāo)存管理系統(tǒng)的搭建
1-5實(shí)戰(zhàn)項(xiàng)目2:CRM信息管理軟件的設(shè)計(jì)
1-6實(shí)戰(zhàn)項(xiàng)目3:銀行業(yè)務(wù)管理系統(tǒng)的搭建
2章大數(shù)據(jù)基礎(chǔ)-關(guān)系型數(shù)據(jù)庫(kù)
2-1數(shù)據(jù)庫(kù)基本概念
2-2DDL數(shù)據(jù)定義語(yǔ)言
2-3DML數(shù)據(jù)操作語(yǔ)言
2-4單表查詢(xún)
2-5多表查詢(xún)
2-6函數(shù)
2-7自定義函數(shù)
2-8存儲(chǔ)過(guò)程
2-9性能優(yōu)化
2-10實(shí)戰(zhàn)項(xiàng)目1:淘寶店鋪用戶行為分析
2-11實(shí)戰(zhàn)項(xiàng)目2:跨境電商數(shù)據(jù)分析案例
3章大數(shù)據(jù)基礎(chǔ)-Linux操作系統(tǒng)
3-1計(jì)算機(jī)基礎(chǔ)知識(shí)講解、Linux的安裝與設(shè)置
3-2常用生產(chǎn)工具介紹(xshell、ftp工具)
3-3常用系統(tǒng)命令介紹(文件操作命令、系統(tǒng)管理命令、網(wǎng)絡(luò)管理命令、權(quán)限管理命令)
3-4shell編程、awk、sed的使用
3-5Linux系統(tǒng)軟件管理命令、任務(wù)管理crontab
3-6實(shí)戰(zhàn)項(xiàng)目:基于shell腳本的網(wǎng)帖分析實(shí)戰(zhàn)分析
4章大數(shù)據(jù)核心技術(shù)-Hadoop
4-1Hadoop的簡(jiǎn)介與構(gòu)成
4-2HDFS原理、特點(diǎn)
4-3MapReduce概念及設(shè)計(jì)原理
4-4YARN基本概念
4-5實(shí)戰(zhàn)項(xiàng)目:基于MapReduce的TopN問(wèn)題處理項(xiàng)目
5章大數(shù)據(jù)核心技術(shù)-Hive
5-1Hive架構(gòu)原理
5-2HQL操作
5-3數(shù)據(jù)類(lèi)型、分區(qū)、分桶、臨時(shí)表
5-4元數(shù)據(jù)存儲(chǔ)、服務(wù)
5-5自定義函數(shù):UDF/UDAF
5-6數(shù)據(jù)壓縮存儲(chǔ)、自動(dòng)化腳本
5-7性能優(yōu)化方案"
5-8實(shí)戰(zhàn)項(xiàng)目1:電商數(shù)倉(cāng)搭建項(xiàng)目
5-9實(shí)戰(zhàn)項(xiàng)目2:OTA離線數(shù)據(jù)分析
6章大數(shù)據(jù)核心技術(shù)-Spark
6-1scala編程基礎(chǔ)
6-2Spark core
6-3Spark SQL
6-4Spark streaming
6-5Spark Graphx
6-6Spark ML
6-7實(shí)戰(zhàn)項(xiàng)目1:互聯(lián)網(wǎng)廣告統(tǒng)計(jì)分析案例
6-8實(shí)戰(zhàn)項(xiàng)目2:道路監(jiān)控?cái)?shù)據(jù)分析案例
6-9實(shí)戰(zhàn)項(xiàng)目3:訂單數(shù)據(jù)分析案例
6-10實(shí)戰(zhàn)項(xiàng)目4:航班數(shù)據(jù)分析案例
6-11實(shí)戰(zhàn)項(xiàng)目5:亞馬遜產(chǎn)品聯(lián)購(gòu)網(wǎng)絡(luò)分析
7章大數(shù)據(jù)核心技術(shù)-Flink
7-1Flink入門(mén)
7-2Flink進(jìn)階
7-3實(shí)戰(zhàn)項(xiàng)目1:處理LOT事件流
7-4實(shí)戰(zhàn)項(xiàng)目2:信用卡欺詐實(shí)時(shí)檢測(cè)
7-5實(shí)戰(zhàn)項(xiàng)目3:熱門(mén)商品實(shí)時(shí)計(jì)算
8章大數(shù)據(jù)實(shí)戰(zhàn)綜合大型項(xiàng)目
8-1大型項(xiàng)目1:高速大數(shù)據(jù)分析案例
8-2大型項(xiàng)目2:社交媒體UGC數(shù)據(jù)分析項(xiàng)目(NLP:用戶畫(huà)像:模型部署)
8-3大型項(xiàng)目3:電信用戶離網(wǎng)案例分析項(xiàng)目