【課程簡介】
企業(yè)想要在競爭激烈的市場中勝出,決策的速度和反應(yīng)的效率尤為重要。根據(jù)調(diào)查顯示,75%的企業(yè)在面臨擬定策略時,常常無法獲得實時且有根據(jù)的決策信息。什么樣的數(shù)據(jù)、要透過什么樣的方法,才能快速且實時的轉(zhuǎn)變成決策時有用的信息,是現(xiàn)代企業(yè)所面臨最迫切性的問題。
Python數(shù)據(jù)分析集訓(xùn)課程針對針對周末時間充裕、零基礎(chǔ)的專科、本科在校生,以及在職&欲轉(zhuǎn)行從事數(shù)據(jù)分析的工作人員提供3個月非脫產(chǎn)周末集訓(xùn),畢業(yè)可推薦相關(guān)工作。
課程內(nèi)容以CDA數(shù)據(jù)分析師標(biāo)準(zhǔn)大綱要求,包含Python基礎(chǔ) – Pandas數(shù)據(jù)清洗 - Python爬蟲 - Python數(shù)據(jù)可視化(Matplotlib、Seaborn、Pyecharts) - Python機器學(xué)習(xí)算法等內(nèi)容,并結(jié)合互聯(lián)網(wǎng)保險、電信、銀行、醫(yī)療、交通等行業(yè)實際案例來幫助學(xué)員建立整套的數(shù)據(jù)分析和機器學(xué)習(xí)思路,案例涉及營銷優(yōu)化、風(fēng)險控制、用戶研究、商業(yè)部署等領(lǐng)域,使學(xué)員所學(xué)更符合企業(yè)要求。
【師資力量】
倪向洋
CDA數(shù)據(jù)分析研究院資深講師
CDA數(shù)據(jù)科學(xué)研究院大數(shù)據(jù)、python課程講師,CDA命題委員會成員。曾經(jīng)就職 于IBM,有豐富的運維工作和大數(shù)據(jù)平臺搭建經(jīng)驗。目前擔(dān)任CDA大數(shù)據(jù)課程以 及數(shù)據(jù)分析課程講師,主要負責(zé)大數(shù)據(jù)平臺搭建,利用機器學(xué)習(xí)對數(shù)據(jù)做清洗與 分析的工作。擅長將機器學(xué)習(xí),自動化運維與分析技術(shù)。
李御璽
臺灣銘傳大學(xué)教授/中華數(shù)據(jù)挖掘協(xié)會理事
臺灣大學(xué)博士,在其相關(guān)研究領(lǐng)域已發(fā)表超過260篇以上的研究論文,同時也是國科會與教育部多個相關(guān)研究計劃的主持人。 其還兼任廈門大學(xué)數(shù)據(jù)挖掘中心顧問,中國人民大學(xué)數(shù)據(jù)挖掘中心顧問,IBM SPSS-China顧問。服務(wù)過的客戶包括:中國工商局、中信銀行、臺新銀行等。
彭奕偉
CDA數(shù)據(jù)科學(xué)研究院Python課程講師
擁有5年的金融行業(yè)數(shù)據(jù)挖掘經(jīng)驗。先后參與民生銀行卡移動支付項目研發(fā),銀行人工智能客服服務(wù)系統(tǒng)項目。
【學(xué)習(xí)目標(biāo)】
熟練掌握數(shù)據(jù)科學(xué)領(lǐng)域最 受歡迎的編程語言-Python
掌握使用Python和pandas庫進行數(shù)據(jù)清洗和預(yù)處理
使用Python爬蟲獲取網(wǎng)絡(luò)數(shù)據(jù)
學(xué)會使用matplotlib、seaborn進行初級可視化
學(xué)會使用Pyecharts進行高級數(shù)據(jù)可視化
學(xué)會構(gòu)建機器學(xué)習(xí)算法進行分類、預(yù)測和聚類模型
使用Python進行數(shù)據(jù)分析整體思路、針對業(yè)務(wù)做出模型最 優(yōu)化選擇
善用機器學(xué)習(xí)解決用戶畫像、精準(zhǔn)營銷、風(fēng)險管理等商業(yè)問題
使用機器學(xué)習(xí)實操電商、電信、醫(yī)藥行業(yè)真實項目案例
【課程內(nèi)容】
1章Python基礎(chǔ)
1-1準(zhǔn)備工作-Python開發(fā)環(huán)境配置
1-2Python標(biāo)準(zhǔn)數(shù)據(jù)類型
1-3控制流語句
1-4異常和錯誤(穿插在其他內(nèi)容中講)
1-5文件操作
2章Python進行數(shù)據(jù)整理和數(shù)據(jù)清洗
2-1Python標(biāo)準(zhǔn)庫簡介
2-2Numpy數(shù)組基礎(chǔ)
2-3Pandas對象基礎(chǔ)
3章python數(shù)據(jù)可視化(線上)
3-1繪圖思想的基本原理
3-2Python數(shù)據(jù)可視化包-Matplotlib介紹
3-3使用Python數(shù)據(jù)處理包Pandas做可視化
3-4Python數(shù)據(jù)可視化包-Seaborn介紹與圖形繪制
3-5Python數(shù)據(jù)可視化包-Pyecharts介紹與圖形繪制
4章Python爬蟲(線上)
4-1網(wǎng)絡(luò)爬蟲基礎(chǔ)知識
4-2網(wǎng)絡(luò)請求及響應(yīng)-requests庫
4-3HTML文檔解析-BeautifulSoup庫
4-4常見反爬蟲機制及應(yīng)對
4-5網(wǎng)絡(luò)爬蟲 VS 網(wǎng)絡(luò)數(shù)據(jù)抓取
4-6實戰(zhàn)一:批量下載頭像
4-7實戰(zhàn)二:抓取豆瓣書籍簡介
4-8實戰(zhàn)三:模擬瀏覽器selenium抓取電商商品信息及評論
5章Python數(shù)據(jù)清洗高級操作及案例實戰(zhàn)
5-1數(shù)據(jù)的獲取與存儲
5-2數(shù)據(jù)探索
5-3數(shù)據(jù)清洗思維
5-4數(shù)據(jù)清洗實戰(zhàn)案例一:泰坦尼克幸存者數(shù)據(jù)清洗(根據(jù)實際上課情況調(diào)整數(shù)據(jù)集)
5-5數(shù)據(jù)清洗實戰(zhàn)案例二:USDA食品數(shù)據(jù)清洗(根據(jù)實際上課情況調(diào)整數(shù)據(jù)集)
6章Python編程考試(線上)
6-1Python基礎(chǔ)部分
6-2Python數(shù)據(jù)清洗的實現(xiàn)
7章機器學(xué)習(xí)算法
7-1準(zhǔn)備工作:開發(fā)環(huán)境配置(以文檔的形式給出)
7-2機器學(xué)習(xí)入門介紹:
7-3scikit-learn入門:Scikit-Learn庫簡介
7-4KNN-最近鄰分類算法:原理、實現(xiàn)
7-5決策樹算法:原理、實現(xiàn)、相關(guān)技術(shù)應(yīng)用及實例
7-6隨機森林算法:原理、實現(xiàn)及相關(guān)技術(shù)應(yīng)用:以乳腺癌預(yù)測為例
7-7K-Means聚類算法:原理、實現(xiàn)及簇選擇與矢量化應(yīng)用
7-8關(guān)聯(lián)規(guī)則算法:原理、實現(xiàn)
7-9線性回歸
7-10邏輯回歸
7-11SVM支持向量機
7-12分類模型的評估指標(biāo)(續(xù))
7-13樸素貝葉斯算法
8章電商案例
8-1分析目標(biāo):
8-2基于國外大型電商用戶購買信息數(shù)據(jù)的客戶購買預(yù)測模型構(gòu)建流程:
9章金融案例
9-1分析目標(biāo):
9-2基于大型金融公司的客戶貸款信息,構(gòu)建用戶信用評分卡模型的建模步驟:
【招生對象】
想從事數(shù)據(jù)領(lǐng)域工作,缺乏實踐技能的在校學(xué)生
希望轉(zhuǎn)行數(shù)據(jù)領(lǐng)域人員
個人發(fā)展遭遇瓶頸的數(shù)據(jù)分析師
有數(shù)據(jù)化運營需求的產(chǎn)品運營、市場人員及管理者
對Python數(shù)據(jù)分析和挖掘感興趣的業(yè)界人士
【授課方式】
遠程+面授
【上課時間】
周末8-17點
【學(xué)員風(fēng)采】
【發(fā)展歷程】
2006年 開展數(shù)據(jù)統(tǒng)計、計量實戰(zhàn),學(xué)術(shù)研究等相關(guān)培訓(xùn)視頻和現(xiàn)場班
2007年 開展數(shù)據(jù)統(tǒng)計、數(shù)據(jù)分析相關(guān)培訓(xùn)班
2011年 隨著大數(shù)據(jù)熱潮的來臨,依托累計上萬類共享資料,多年沉淀師資團隊,論壇召集多位專家,研發(fā)CDA數(shù)據(jù)分析師體系
2013年CDA數(shù)據(jù)分析師品牌成立,提供系統(tǒng)化的大數(shù)據(jù)、數(shù)據(jù)分析人才培養(yǎng)和認證
2014年 CDA INSTITUTE 成立 ,并推出第 一屆全國CDA數(shù)據(jù)分析師認證考試
2015年第 一屆中國數(shù)據(jù)分析師行業(yè)峰會(CDAS)在9月11日成功舉辦,參會人數(shù)逾3000人
2016年 CDA匯聚海內(nèi)外大數(shù)據(jù)、數(shù)據(jù)分析專家上千人,推出就業(yè)班、數(shù)據(jù)科學(xué)家訓(xùn)練營、企業(yè)內(nèi)訓(xùn)、CDA俱樂部等多個項目
2017年整合論壇與CDA數(shù)據(jù)分析師業(yè)內(nèi)資源,形成數(shù)據(jù)分析領(lǐng)域生態(tài)圈,并進一步升級CDA企業(yè)內(nèi)訓(xùn)體系,正式推出大數(shù)據(jù)實驗室
2018年北上廣深等多個城市均有校區(qū);擁有200多位專業(yè)師資;培養(yǎng)學(xué)員超過3萬人,每年6月/12月全國28個城市舉辦CDA認證考試
2019年已舉辦九屆數(shù)據(jù)分析師認證考試,得到業(yè)界廣泛認可,學(xué)員遍布各大知名企業(yè)。人工智能產(chǎn)品“好學(xué)AI”問世,引領(lǐng)DT時代新一波技術(shù)培訓(xùn)浪潮
【機構(gòu)簡介】
如荷學(xué)為北京國富如荷網(wǎng)絡(luò)科技有限公司旗下專注于數(shù)字化人才培養(yǎng)及服務(wù)的教育品牌,致力于大數(shù)據(jù)在產(chǎn)、學(xué)、研的融合應(yīng)用。服務(wù)百萬數(shù)字化人才,是全球500強企業(yè)的忠實合作伙伴。
如荷學(xué)以"培養(yǎng)企業(yè)需要的專業(yè)數(shù)字化人才,搭建弓|領(lǐng)數(shù)字化時代的企業(yè)人才梯隊”為使命,為TD時代數(shù)字化人才的數(shù)據(jù)能力提升及企業(yè)數(shù)字化轉(zhuǎn)型提供標(biāo)準(zhǔn)化、效率、可落地的數(shù)據(jù)應(yīng)用側(cè)解決方案。
【機構(gòu)環(huán)境】
【學(xué)員評價】
孔同學(xué)
統(tǒng)計學(xué)和數(shù)據(jù)挖掘理論是數(shù)據(jù)分析的基礎(chǔ),常規(guī)的統(tǒng)計理論和數(shù)據(jù)挖掘算法必須要學(xué)會,想入行應(yīng)重點研究,并要學(xué)會制作風(fēng)險評分卡。其他算法了解即可。
董同學(xué)
三個月的學(xué)習(xí)時間。緊湊的課程安排讓我感覺每一天都特別充實,白天認真聽講,晚自習(xí)鞏固復(fù)習(xí),每一天都在進步和成長。 我對未來充滿了希望。
王同學(xué)
CDA的學(xué)習(xí)經(jīng)歷,給我的人生增添了一段難忘的回憶,也給我在現(xiàn)在的工作中帶來了很大的幫助,在今后的工作中要更加努力,不斷完善自己。
蘇同學(xué)
學(xué)習(xí)是一種態(tài)度,在CDA三個月集中學(xué)習(xí)的過程中,認識了很多同學(xué),也增長了一些校園以外的知識,學(xué)習(xí)的過程很累很艱辛,卻覺得很值得! 痛并快樂著??!
李同學(xué)
CDA對于我而言,是一個新生活的起點,經(jīng)過3個月的奮戰(zhàn),我學(xué)習(xí)到了許多知識,更結(jié)識了許多志同道合的朋友,這是我3個月的學(xué)習(xí)生活寶貴的財富。
趙同學(xué)
首先感謝的是課堂里茫茫多的教授級導(dǎo)師的個人魅力的熏陶,其次就是,三個月持續(xù)不斷的學(xué)習(xí),讓我養(yǎng)成一個持續(xù)學(xué)習(xí)的心態(tài)和熱愛學(xué)習(xí)的態(tài)度。