【課程特色】
本次課程對螞蟻金服競賽業(yè)務(wù)背景做了簡單介紹,講述了數(shù)據(jù)分析在拿到數(shù)據(jù)之后應(yīng)該如何開始數(shù)據(jù)探索,如何跑出模型baseline,如何通過可視化及模型輸出進(jìn)行特征選擇,如何理解自定義的評價函數(shù),如何用合理的方式記錄上分情況而不發(fā)生混亂,如何充分利用傳統(tǒng)模型和競賽殺器,如何根據(jù)模型原理進(jìn)行調(diào)參,如何尋找準(zhǔn)而不同的模型并做出最 優(yōu)的機器學(xué)習(xí)模型融合,以及最終如何將每一步串聯(lián)到一起拿到最 優(yōu)模型結(jié)果
【招生對象】
有一定基礎(chǔ)的學(xué)員
【上課時間】
周一到周日9-18點
【學(xué)習(xí)目標(biāo)】
大化提升實戰(zhàn)能力
取得數(shù)據(jù)科學(xué)競賽TOP名次
拿到比賽豐厚獎金
斬獲名企offer
【學(xué)習(xí)周期】
320課時
【師資力量】
吳昊天
擅長數(shù)據(jù)架構(gòu)、數(shù)據(jù)分析
教學(xué)經(jīng)驗8年
電子科技大學(xué)大數(shù)據(jù)中心
CDA數(shù)據(jù)分析研究院技術(shù)負(fù)責(zé)人兼高級講師
趙仁乾
擅長數(shù)據(jù)架構(gòu)、數(shù)據(jù)分析
教學(xué)經(jīng)驗7年
北京郵電大學(xué)管理科學(xué)與工程碩士
北京電信規(guī)劃設(shè)計院
辛立偉
擅長數(shù)據(jù)架構(gòu)、數(shù)據(jù)分析
教學(xué)經(jīng)驗20年
CDA數(shù)據(jù)分析研究院講師
SUN中國社區(qū)會員
【課程內(nèi)容】
01章新手上路
01-01說在前面
01-02初識數(shù)據(jù)科學(xué)競賽
01-03支付寶欺詐風(fēng)險識別項目導(dǎo)學(xué)
01-04機器學(xué)習(xí)環(huán)境:jupyter使用
01-05機器學(xué)習(xí)常用庫(pandas,scikit-learn)
01-06從業(yè)務(wù)場景認(rèn)識比賽數(shù)據(jù)
01-07數(shù)據(jù)初探索
01-08快速搭建baseline版本
01-09如何制作線下科學(xué)驗證體系
01-10比賽常用回歸任務(wù)評價指標(biāo)
01-11比賽常用分類任務(wù)評價指標(biāo)
01-12支付寶反欺詐自定義評價函數(shù)
01-13數(shù)據(jù)內(nèi)存優(yōu)化技巧
01-14數(shù)據(jù)交叉驗證
01-15使用內(nèi)置cross_validate接口交叉驗證
01-16使用logsitic分類模型
01-17使用KNN分類模型
01-18使用Adaboost分類模型
01-19使用Bagging分類模型
01-20使用RandomRorest分類模型
01-21使用GBDT分類模型
01-21scikit-learn各分類模型對比分析
02章玩轉(zhuǎn)機器學(xué)習(xí)競賽兩大殺器
02-01LightGBM采用scikit-learn方式調(diào)用
02-02LightGBM經(jīng)典方式調(diào)用
02-03LightGBM交叉驗證
02-04LightGBM參數(shù)解析
02-05LightGBM輸出特征重要性
02-06LightGBM高級用法
02-07XGBoost使用
02-08XGBoost參數(shù)解析
02-09LightGBM和Xgboost自定義目標(biāo)函數(shù)
02-10XGBoost與LightGBM對比分析
02-11LightGBM原理深度解析
03章數(shù)據(jù)處理與特征工程中的騷操作
03-01數(shù)據(jù)探索與處理
03-02數(shù)據(jù)缺失值分析
03-03缺失值高級處理
03-04特征分析
03-05通過Adversarial訓(xùn)練方式試探訓(xùn)練集和測試集分布
03-06特征的IV和WOE編碼
03-07基于模型的特征選擇
03-08基于scikit-learn中RFECV的特征選擇
03-09使用熱力圖分析特征相關(guān)性
03-10使用核密度圖分析特征相關(guān)性
03-11類別不平衡分析
03-11類別不平衡分析
03-12基于模型的類別不平衡處理
03-13基于數(shù)據(jù)采樣的類別不平衡處理
03-14灰樣本拒絕推斷方案
03-15多種方式特征選擇
03-16特征分布不均勻的處理策略
03-17困難樣本分析
04章模型花式融合調(diào)參
04-01網(wǎng)格搜索優(yōu)化模型參數(shù)
04-02貝葉斯方法優(yōu)化模型參數(shù)
04-03機器學(xué)習(xí)比賽中隨機種子的作用
04-04模型的偏差與方差分析
04-05準(zhǔn)而不同模型選擇策略
04-07stacking的模型融合策略
04-08模型之間的相關(guān)性分析
04-09螞蟻金服項目方案整合
【教學(xué)現(xiàn)場】
【學(xué)員風(fēng)采】
【機構(gòu)環(huán)境】
【發(fā)展歷程】
2006年 開展數(shù)據(jù)統(tǒng)計、計量實戰(zhàn),學(xué)術(shù)研究等相關(guān)培訓(xùn)視頻和現(xiàn)場班
2007年 開展數(shù)據(jù)統(tǒng)計、數(shù)據(jù)分析相關(guān)培訓(xùn)班
2011年 隨著大數(shù)據(jù)熱潮的來臨,依托累計上萬類共享資料,多年沉淀師資團隊,論壇召集多位專家,研發(fā)CDA數(shù)據(jù)分析師體系
2013年CDA數(shù)據(jù)分析師品牌成立,提供系統(tǒng)化的大數(shù)據(jù)、數(shù)據(jù)分析人才培養(yǎng)和認(rèn)證
2014年 CDA INSTITUTE 成立 ,并推出第 一屆全國CDA數(shù)據(jù)分析師認(rèn)證考試
2015年第 一屆中國數(shù)據(jù)分析師行業(yè)峰會(CDAS)在9月11日成功舉辦,參會人數(shù)逾3000人
2016年 CDA匯聚海內(nèi)外大數(shù)據(jù)、數(shù)據(jù)分析專家上千人,推出就業(yè)班、數(shù)據(jù)科學(xué)家訓(xùn)練營、企業(yè)內(nèi)訓(xùn)、CDA俱樂部等多個項目
2017年整合論壇與CDA數(shù)據(jù)分析師業(yè)內(nèi)資源,形成數(shù)據(jù)分析領(lǐng)域生態(tài)圈,并進(jìn)一步升級CDA企業(yè)內(nèi)訓(xùn)體系,正式推出大數(shù)據(jù)實驗室
2018年北上廣深等多個城市均有校區(qū);擁有200多位專業(yè)師資;培養(yǎng)學(xué)員超過3萬人,每年6月/12月全國28個城市舉辦CDA認(rèn)證考試
2019年已舉辦九屆數(shù)據(jù)分析師認(rèn)證考試,得到業(yè)界廣泛認(rèn)可,學(xué)員遍布各大知名企業(yè)。人工智能產(chǎn)品“好學(xué)AI”問世,引領(lǐng)DT時代新一波技術(shù)培訓(xùn)浪潮
【機構(gòu)榮譽】
IBM大學(xué)戰(zhàn)略合作伙伴
電子工業(yè)出版社 優(yōu)秀合作者
教育管理信息化專業(yè)委員會理事單位
2018年度職業(yè)教育人才培訓(xùn)品牌機構(gòu)
2018年度大數(shù)據(jù)影響力先鋒企業(yè)
2018入選教育部產(chǎn)學(xué)合作協(xié)同育人項目
網(wǎng)易云課堂2017年度最 佳服務(wù)獎
2017年度中國互聯(lián)網(wǎng)+ 最 佳培訓(xùn)機構(gòu)獎
中國大數(shù)據(jù)產(chǎn)業(yè)生態(tài)聯(lián)盟理事單位
【機構(gòu)簡介】
目前,CDA已與國內(nèi)100多所高校進(jìn)行了戰(zhàn)略合作,建立了CDA數(shù)據(jù)分析師考試中心及人才培養(yǎng)基地;已出版30多本CDA數(shù)據(jù)分析師系列叢書,市場發(fā)行量數(shù)萬冊;已進(jìn)行500多期線上線下數(shù)據(jù)分析及大數(shù)據(jù)培訓(xùn)課程,培養(yǎng)學(xué)員10萬+人次;已在全國70+城市舉辦15屆CDA數(shù)據(jù)分析師認(rèn)證考試,報考考生數(shù)萬人;已開展了四屆中國數(shù)據(jù)分析師行業(yè)峰會(CDA SUMMIT),每屆參會人數(shù)3000多人;中國數(shù)據(jù)分析師俱樂部(CDA CLUB)每周舉辦各類型線上線下沙龍會議、公開課等活動共1000多期。