這幾年來,數(shù)據(jù)的生成和存儲有了巨大的增長。 生成和存儲的數(shù)據(jù)可以結(jié)構(gòu)化和非結(jié)構(gòu)化,而為了充分發(fā)揮數(shù)據(jù)的潛力,各行各業(yè)都召集一組專業(yè)數(shù)據(jù)分析師去使用一系列的技術(shù)將數(shù)據(jù)轉(zhuǎn)變?yōu)橛袃r值的信息。
大數(shù)據(jù)分析師在進行數(shù)據(jù)發(fā)掘和展現(xiàn)后,會合理的將數(shù)據(jù)運用到評估并解決企業(yè)現(xiàn)狀、競爭環(huán)境、風險評判和決策支持上,從而將一份份清晰、精準,并且有數(shù)據(jù)支撐的報告供予企業(yè)決策。大數(shù)據(jù)帶給公司或行業(yè)的價值不容小覷,越來越多的組織正在積極的開始使用并依靠著大數(shù)據(jù)的強大功能,從而增加了數(shù)據(jù)科學家的需求和價值。
和數(shù)據(jù)打交道的專業(yè)包括我們前期說到的商業(yè)分析和統(tǒng)計,而它們和數(shù)據(jù)科學最主要的區(qū)別在于側(cè)重點不同。那么數(shù)據(jù)科學是什么樣的一樣專業(yè)?它和商業(yè)分析/統(tǒng)計類專業(yè)有什么區(qū)別?就業(yè)前景怎么樣?申請難度高嗎?美國哪些學校有數(shù)據(jù)科學專業(yè)?這一期即將為你揭曉。
數(shù)據(jù)科學專業(yè)
數(shù)據(jù)科學專業(yè)就如圖下所展現(xiàn)的,是由三個主要課程組成的一個交叉學科專業(yè),而這三個課程分別是數(shù)學統(tǒng)計,計算機科學和行業(yè)/商業(yè)領(lǐng)域知識。數(shù)據(jù)科學涉及到的領(lǐng)域也很多,包括了統(tǒng)計學、數(shù)學、計算機、人工智能、機器學習、數(shù)據(jù)庫、模式識別、可視化技術(shù)等多學科的知識,主旨在于培養(yǎng)學生收集、統(tǒng)計、整理、分析和挖掘數(shù)據(jù)的專業(yè)能力,也都立志于培養(yǎng)可以獨立分析問題和解決問題的全能型人才。
和數(shù)據(jù)科學一樣,商業(yè)分析和統(tǒng)計專業(yè)都可以幫助學生達到成為數(shù)據(jù)科學家的目標,那它們之間具體的側(cè)重點區(qū)別是什么呢?我們可以先從兩大方面去了解它們的不同之處:定義和課程設(shè)置.
1. 定義
- Data Science 數(shù)據(jù)科學主要是通過挖掘數(shù)據(jù),處理數(shù)據(jù),分析數(shù)據(jù),從而獲得數(shù)據(jù)里潛在的有價值信息和技術(shù)的一門交叉學科。
- Business Analytics 商業(yè)分析是以商業(yè)知識為基礎(chǔ),數(shù)據(jù)分析為手段,從數(shù)據(jù)分析出發(fā),從而達到以決策優(yōu)化來創(chuàng)造價值和實現(xiàn) Big Data 在商業(yè)應(yīng)用的一個新興學科。
- Statistics 統(tǒng)計是通過搜索、整理、分析、描述數(shù)據(jù)等手段,以達到推斷所測對象的本質(zhì),甚至預(yù)測對象未來的一門綜合性科學。
可見,數(shù)據(jù)科學所圍繞的主要核心就是數(shù)據(jù),怎么挖掘,怎么處理,怎么分析都是數(shù)據(jù)科學家需要負責的工作內(nèi)容。商業(yè)分析雖然也涉及數(shù)據(jù)分析,但它主要的核心工作還是利用數(shù)據(jù)去支持商業(yè)上做出的一些決策,分析以前,現(xiàn)在和未來的一些趨勢,從而再去確認更佳的一些商業(yè)模式和途徑。而統(tǒng)計學則更多的是以數(shù)據(jù)分析為基礎(chǔ)去推斷和預(yù)測市場上的一些現(xiàn)象,比起其他兩個專業(yè)更注重數(shù)學知識和能力。
2. 課程設(shè)置
數(shù)據(jù)科學- 一般開設(shè)在工程學院底下,以計算機科學為基礎(chǔ),橫跨了工程學,計算機工程和計算機科學領(lǐng)域,也還包括機器學習,云計算和優(yōu)化等領(lǐng)域的知識。總的來說,數(shù)據(jù)科學的課程是由 50%計算機科學 + 30% 統(tǒng)計 + 20% 應(yīng)用組成的。
商業(yè)分析- 一般開設(shè)在商學院底下,以統(tǒng)計為基礎(chǔ),通過統(tǒng)計學底下的應(yīng)用統(tǒng)計分支發(fā)展出來,也包括了一定的數(shù)據(jù)挖掘和回歸分析的課程。商業(yè)分析的課程在計算機科學的側(cè)重點不會像數(shù)據(jù)科學那么多,是由 40% 統(tǒng)計 + 30% 計算機科學 + 30% 商業(yè)知識組成的。
統(tǒng)計學- 一般開設(shè)在文理學院底下,以數(shù)學為基礎(chǔ),計算機科學的占比與商業(yè)分析差不多,但沒有商業(yè)分析所涉及到的商業(yè)知識,所以主要還是由 70% 統(tǒng)計/數(shù)學 + 20% 計算機科學 + 10% 商業(yè)知識/機器學習。
就業(yè)前景
由于對數(shù)據(jù)的需求和應(yīng)用越來越多,數(shù)據(jù)科學的就業(yè)機會可以說是遍布各行各業(yè),就業(yè)前景非常的廣。這里給大家看一組數(shù)據(jù),是哈佛大學的Master’s in Data Science的學生畢業(yè)之后的就業(yè)去向。
我們可以看到哈佛大學數(shù)據(jù)科學的畢業(yè)生去到了不同的行業(yè),包括了科技行業(yè),投資/金融行業(yè),創(chuàng)業(yè)公司,教育行業(yè),政府機構(gòu),廣告市場行業(yè),咨詢行業(yè),娛樂行業(yè),也有一些繼續(xù)生深造攻讀博士學位。
而這些公司就業(yè)的就業(yè)職位除了有我們經(jīng)常聽說data scientist, data engineer, software engineer和data analyst, 也有product manager, quantitative strategist的崗位,只要是和數(shù)據(jù)相關(guān)的崗位,數(shù)據(jù)科學的畢業(yè)生基本都可以勝任。
從數(shù)據(jù)里我們也可以看到數(shù)據(jù)科學畢業(yè)的學生起薪是在80,000-140,000美金之間,是非??捎^的一個數(shù)目,也是吸引很多學生想要修讀數(shù)據(jù)科學專業(yè)的主要原因。
申請要求
數(shù)據(jù)科學的碩士申請可以說是在熱門專業(yè)里的競爭力較大的,主要因素除了是因為數(shù)據(jù)科學對于技術(shù)要求高之外,也是因為不是每個美國大學都會開設(shè)數(shù)據(jù)科學專業(yè),但申請的人非常多,所以才導(dǎo)致了該項目非常難申請的現(xiàn)象。
以下我們將會運用紐約大學的Master’s in Data Science的申請要求詳細解說,該項目一系列的申請要求基本適用于所有數(shù)據(jù)科學碩士項目。申請要求同樣的非為兩大部分:硬背景 (專業(yè)要求,GPA要求,先修課程要求,標化成績)和軟背景 (實習,科研,競賽,海外交流,校園活動,志愿者活動等)。
1. 專業(yè)要求
圖片里的藍色框為該項目對于申請者的專業(yè)要求,該項目接受來自不同本科背景的學生,包括了統(tǒng)計學,計算機科學,數(shù)學,工程,經(jīng)濟學,商科,生物學,物理學和心理學。一般來說,計算機科學相關(guān)和理工科背景的學生申請數(shù)據(jù)科學會占一定的優(yōu)勢,因為他們在本科已經(jīng)累積了很多相關(guān)的知識與技能;如果你是商科背景但有著非常強的量化背景比如說金工,申請數(shù)據(jù)科學項目也是可以的。
2. GPA成績要求
圖片里的紅色框為該項目2017年的GPA錄取數(shù)據(jù),錄取學生平均的GPA為3.69分,而他們的成績單上的分數(shù)也只有A和B。該項目也明確說明了如果你本科院校背景是less selective,他們會更加注重于你先修課程的成績,以確保你有足夠在該領(lǐng)域?qū)W習的能力。一般申請前30的數(shù)據(jù)科學項目GPA成績建議為3.7以上,前60的則需要至少3.3以上。
3. 先修課程要求
圖片里的綠色和黃色框為申請該項目的具體先修課程要求,非常明確的說了申請該項目需要有很強的數(shù)學能力,編程經(jīng)驗以及計算機科學基礎(chǔ)。具體的課程要求如下:
· 微積分I:極限,導(dǎo)數(shù),級數(shù),積分等。
· 線性代數(shù)
· 計算機科學入門(或等效的“ CS-101”編程課程):對于語言沒有特定的要求,但是通常至少需要具有Python和R的學術(shù)和/或?qū)I(yè)經(jīng)驗
· 微積分II,概率論,統(tǒng)計學,或者高級物理學,工程學或具有大量數(shù)學內(nèi)容的計量經(jīng)濟學課程的其中之一
該項目也具體說明了他們會優(yōu)先考慮具有機器學習,計算統(tǒng)計,數(shù)據(jù)挖掘,大規(guī)??茖W計算,運籌學(在學術(shù)或?qū)I(yè)背景下)的申請人,以及優(yōu)先考慮有超過上訴最低要求數(shù)學和/或計算機科學訓練的申請人。
4. 標化考試成績
標化考試分為語言考試和GRE考試。該項目對于GRE成績沒有最低要求,但往年的錄取數(shù)據(jù)顯示了錄取學生都平均有著167.58分的quantitative,157.36分的verbal和3.65分的analytical writing。
想要申請前30的數(shù)據(jù)科學項目建議托福110+,雅思7.5+ 和GRE 325+/3.5+;
5. 軟背景 (實習,科研,競賽,海外交流,校園活動,志愿者活動等)
在所有的軟背景中,實習是申請數(shù)據(jù)科學項目最為重要的一點。就如以下圖片所表示,雖然很多錄取學生為應(yīng)屆生,但他們也非常歡迎學生展現(xiàn)專業(yè)領(lǐng)域相關(guān)的工作經(jīng)驗。工作經(jīng)驗/實習經(jīng)歷都是你實際運用所學知識的機會,從工作經(jīng)歷上可以看出你在該專業(yè)領(lǐng)域?qū)W習和能力,幫助你提高在申請上優(yōu)勢。
一般來說在申請之前建議擁有2-3段的相關(guān)實習經(jīng)歷。在選擇實習機會的時候,一定要明白崗位優(yōu)先的原則,先選擇和申請專業(yè)符合的崗位,再來才考慮公司的知名度。如果你只選擇知名公司,但是工作的內(nèi)容和數(shù)據(jù)科學完全不符合,這樣對你的申請來說是一點好處都沒有,所以實習工作的崗位非常重要,不要因為想要讓自己的簡歷看起來高大上或者因為有強公司推薦信而盲目選擇沒有幫助的實習機會。
院校排名
美國大學開設(shè)數(shù)據(jù)科學的院校不多,而和數(shù)據(jù)分析有關(guān)的專業(yè)不止數(shù)據(jù)科學一個,也包括了像商業(yè)分析,統(tǒng)計和分析學這些專業(yè)。商業(yè)分析和統(tǒng)計在前期已經(jīng)為大家解說過,今天數(shù)據(jù)科學院校的排名則會結(jié)合一些學校的分析學項目。
院校介紹
1. 哥倫比亞大學 Master of Science in Data Science
哥倫比亞大學的數(shù)據(jù)科學碩士項目是由文理學院的統(tǒng)計學院系與工程學院的計算機科學院系和工業(yè)工程與運籌學院系聯(lián)合主辦的,旨在培養(yǎng)學生將數(shù)據(jù)科學技術(shù)應(yīng)用于其感興趣的領(lǐng)域的能力。 學生在項目中有機會進行一項原創(chuàng)性研究(包括在一個capstone project),并與我們的行業(yè)合作伙伴和教職員工互動。 學生還可以選擇針對企業(yè)家精神的選修課程或者哥倫比亞大學八大中心其中之一所覆蓋的學科領(lǐng)域。
項目時常:3學期/1.5年
項目要求學分:30分 (21分核心課程,9分選修課程)
項目亮點:有capstone project,美國的top工程院校
申請要求:
· 專業(yè)背景- 沒有具體要求,接受數(shù)據(jù)科學相關(guān)的準備
· GPA- 沒有具體要求,但往年的錄取數(shù)據(jù)為平均3.7/4.0
· 先修課程要求- 線性代數(shù),統(tǒng)計/概率論,基礎(chǔ)編程課程 (Java, Python, C++)
· 語言考試成績- 沒有具體要求,但往年的錄取數(shù)據(jù)為平均106.5分
· GRE考試成績- 沒有具體要求,但往年的錄取數(shù)據(jù)為平均166 (Q), 157 (V), 3.8 (AW)
· 工作經(jīng)驗- 不是硬性要求,但錄取的大多數(shù)學生都有相關(guān)的工作經(jīng)驗
2. 賓夕法尼亞大學 Master of Engineering in Data Science
賓夕法尼亞大學的數(shù)據(jù)科學工程學碩士(MSE)為學生提供了以數(shù)據(jù)為中心的廣泛職業(yè)準備,包括了技術(shù)和工程,咨詢,科學,政策制定還是理解文學,藝術(shù)和傳播領(lǐng)域。該項目將機器學習,大數(shù)據(jù)分析和統(tǒng)計等核心主題中的前沿課程與各種選修課融合在一起,學生也有機會將這些所學習到的技術(shù)應(yīng)用于他們之后可以選擇的深度領(lǐng)域上(depth area- specialization),而每一個depth area都有各自基礎(chǔ)的預(yù)備課程和一項thesis或者practicum。
項目時常:1.5-2年
項目課程設(shè)置:兩門基礎(chǔ)課程,三門核心課程,五門技術(shù)和深度領(lǐng)域選修課程
項目亮點:有thesis或者practicum,有可以自由選擇的depth area美國知名大學
申請要求:
· 專業(yè)背景- 沒有具體要求
· GPA- 沒有具體要求
· 先修課程要求- 要求具有強大數(shù)學和統(tǒng)計能力以及一定編程經(jīng)驗的背景
· 語言考試成績- 托福至少100分,雅思至少7.5分
· GRE考試成績- 沒有具體要求,但往年錄取數(shù)據(jù)為平均158 (V), 167 (Q), 4.0 (AW)
· 工作經(jīng)驗- 不是硬性要求,但希望通過申請者的課程中的項目或工作/實習獲得數(shù)據(jù)科學方面的實踐經(jīng)驗,特別強調(diào)申請者的興趣與數(shù)據(jù)科學項目之間的契合度。
3. 康奈爾大學 ORIE Master of Engineering- Data Science Concentration
康奈爾大學ORIE工程碩士課程的數(shù)據(jù)分析專注于做出基于事實和由數(shù)據(jù)驅(qū)動的決策所需的理論和工具。作為康奈爾大學研究生項目的一部分,Data Analytics Concentration項目能幫助學生擴展知識,職業(yè)聯(lián)系和機會。該項目也旨在培養(yǎng)學生的實踐能力,通過M.Eng project累積實際應(yīng)用和設(shè)計經(jīng)驗,也能根據(jù)自己特定的目標和興趣設(shè)計自己的課程和學習計劃。
項目時常:1年
項目要求學分:30學分
項目亮點:選課自由度大,常春藤盟校
申請要求:
· 專業(yè)背景- 往年的學生都來自運籌學,信息工程,工程類,數(shù)學,物理,化學和數(shù)學經(jīng)濟背景
· GPA- 沒有具體要求
· 先修課程要求- 至少四個學期的大學微積分課程 (多變量函數(shù)),微積分為基礎(chǔ)的概率論與統(tǒng)計,第二級的計算機課程 (C, C++, Java)
· 語言考試成績- 托福至少100分 (寫20分,聽15分,讀20分,說22分),雅思至少7.0分
· GRE考試成績- 沒有具體要求
· 工作經(jīng)驗- 沒有具體要求
4. 卡耐基梅隆大學 Master of Computational Data Science
該計算數(shù)據(jù)科學碩士課程為旨在提供學生開發(fā)下一代大規(guī)模信息系統(tǒng)部署所涉及的技術(shù)和分析這些系統(tǒng)生成的數(shù)據(jù)所需的技能和知識。該項目成立于2004年,培養(yǎng)專業(yè)碩士生在超大型信息系統(tǒng)的設(shè)計,工程和部署的各個方面的技術(shù)和能力。在該項目中,學生將深入研究數(shù)據(jù)庫,分布式算法和存儲,機器學習,語言技術(shù),軟件工程,人機交互和設(shè)計等主題。 通過核心課程和選修課,學生會對大型信息系統(tǒng)有更統(tǒng)一的認知,而其中包括的實習和capstone project可以確保學生擁有在職業(yè)生涯上成功所需的知識和經(jīng)驗。
項目時常:Professional Preparation (16個月);Research Preparation (20個月)
項目要求學分:需要完成最少144 units的課程才能畢業(yè)
項目專業(yè)細分方向:系統(tǒng),分析,Human-Centered數(shù)據(jù)科學
項目亮點:有實習和capstone project,美國排名前列的計算機科學高校
申請要求:
· 專業(yè)背景- 偏向計算機科學相關(guān)的本科背景,如果是其他背景則需要非常強的數(shù)學和計算機科學背景才會被考慮
· GPA- 3.0以上
· 先修課程要求- 要求具有強大數(shù)學和計算機科學背景
· 語言考試成績- 托福至少100分 (聽讀寫小分25分,說小分23分);美本學生也需要提交語言成績 (可以提交當年申請本科的托福成績單)
· GRE考試成績- 沒有具體要求
· 工作經(jīng)驗- 不是硬性要求,但也高度重視相關(guān)的工作經(jīng)驗
5. 南加州大學 Master of Science in Applied Data Science
該項目的目標為培訓來自各種背景的學生成為熟練的數(shù)據(jù)科學家。完成此學位的學生將掌握作為數(shù)據(jù)科學家工作所需的技能,包括對數(shù)據(jù)科學技術(shù)的基本了解,使用Python編寫數(shù)據(jù)科學程序的能力,使用數(shù)據(jù)庫和大數(shù)據(jù)基礎(chǔ)架構(gòu)的知識,經(jīng)驗和技能,應(yīng)用機器學習和數(shù)據(jù)挖掘技術(shù)的能力,以及如何將這些技能應(yīng)用于實際問題的知識。
項目要求學分:32學分
項目亮點:有春季入學,對轉(zhuǎn)專業(yè)友好
申請要求:
· 專業(yè)背景- 不限
· GPA- 沒有具體要求
· 先修課程要求- 要求具有一定的數(shù)理學背景
· 語言考試成績- 托福至少90分 (小分不低于20分);雅思至少6.5分(小分不低于6.0分)
· GRE考試成績- 沒有具體要求
· 工作經(jīng)驗- 沒有具體要求