數(shù)據(jù)科學(xué)家在獲取和理解數(shù)據(jù)的過(guò)程中解決實(shí)際問(wèn)題,而不是建立實(shí)驗(yàn)或創(chuàng)建技術(shù)算法來(lái)解決問(wèn)題。數(shù)據(jù)科學(xué)家需要能夠處理復(fù)雜的數(shù)據(jù)集。他們還需要發(fā)現(xiàn)數(shù)據(jù)中的模式、趨勢(shì)和關(guān)聯(lián),然后將這些發(fā)現(xiàn)轉(zhuǎn)化為可操作的見(jiàn)解,供業(yè)務(wù)用戶參考。這篇文章為大家?guī)?lái)墨爾本大學(xué)
數(shù)據(jù)科學(xué)數(shù)據(jù)處理工具推薦。

Python
Python是一種功能強(qiáng)大的編程語(yǔ)言,由Guido Rossum于1990年創(chuàng)建,它注重代碼的可讀性,從而使編碼人員能夠創(chuàng)建易于理解的軟件。它于1991年作為開(kāi)源軟件推出。從那時(shí)起,它就一直很受歡迎,因?yàn)樗鼡碛写罅康膸?kù),使用戶能夠在幾乎所有可能的領(lǐng)域工作,從網(wǎng)絡(luò)爬行應(yīng)用程序到游戲開(kāi)發(fā)。這種強(qiáng)大的功能也使其成為數(shù)據(jù)科學(xué)領(lǐng)域最流行的語(yǔ)言之一。
R
一種用于統(tǒng)計(jì)計(jì)算和圖形的開(kāi)源編程語(yǔ)言,被多個(gè)行業(yè)使用,包括金融、保險(xiǎn)、媒體、生物技術(shù)、制藥公司等。Ross Ihaka和Robert Gentleman最初于1993年在奧克蘭大學(xué)統(tǒng)計(jì)系為希望在類Unix系統(tǒng)上使用統(tǒng)計(jì)的研究人員設(shè)計(jì)了R語(yǔ)言。它之所以如此流行,是因?yàn)槠湄S富的庫(kù)向用戶開(kāi)放了R的全部潛力,而無(wú)需他們自己編寫(xiě)大量代碼。
Stata
這是一個(gè)軟件包,主要用于社會(huì)科學(xué)家和其他希望提高統(tǒng)計(jì)分析能力但可能不懂計(jì)算機(jī)編程的人。它已被CIA和美國(guó)運(yùn)通等機(jī)構(gòu)使用。它最受歡迎的特點(diǎn)之一是可以輕松連接到其他軟件工具;這使得用戶可以快速了解正在發(fā)生的事情,并在需要時(shí)進(jìn)行更改。
SQL
結(jié)構(gòu)化查詢語(yǔ)言(Structured Query Language)最初由IBM公司的Donald D. Chamberlin和Raymond F. Boyce于1979年創(chuàng)建,作為一種數(shù)據(jù)操作語(yǔ)言,用于使用System R構(gòu)建的商業(yè)應(yīng)用程序;從那時(shí)起,它已成為世界上使用最廣泛的數(shù)據(jù)庫(kù)編程語(yǔ)言之一,包括Microsoft Access、MySql、Oracle、Sybase等。難怪每天都有如此多的數(shù)據(jù)科學(xué)家使用SQL,因?yàn)樗麄円獜木W(wǎng)絡(luò)等非結(jié)構(gòu)化數(shù)據(jù)源中收集見(jiàn)解。
Tableau
Tableau是一款商業(yè)智能工具,通過(guò)簡(jiǎn)單易用的拖放功能,用戶可在數(shù)秒內(nèi)將大量數(shù)據(jù)轉(zhuǎn)化為可操作的交互式可視化圖表。世界各地的組織機(jī)構(gòu)都在使用它來(lái)幫助獲得各行各業(yè)的洞察力,包括美國(guó)國(guó)家航空航天局(NASA)、亞馬遜(Amazon)、基因泰克(Genentech)等。它之所以如此受歡迎,是因?yàn)樗哂胸S富的可視化功能,既可以開(kāi)箱即用,也可以從頭開(kāi)始構(gòu)建。這使其成為數(shù)據(jù)科學(xué)家不可或缺的工具,因?yàn)樗麄兛梢钥焖佟⑤p松地從大型數(shù)據(jù)集中發(fā)現(xiàn)新的見(jiàn)解。
Spotfire
Spotfire是TIBCO軟件公司開(kāi)發(fā)的一款自助式分析應(yīng)用程序,企業(yè)用戶無(wú)需編寫(xiě)任何代碼,即可通過(guò)強(qiáng)大的統(tǒng)計(jì)和可視化功能進(jìn)行數(shù)據(jù)分析。它已被世界各地的組織機(jī)構(gòu)所使用,包括財(cái)富500強(qiáng)企業(yè),它們都在這個(gè)強(qiáng)大的工具上建立了自己的儀表盤(pán)。它的最大優(yōu)點(diǎn)是易于使用,因?yàn)槟恍鑼?duì)象拖放到畫(huà)布上,從大量可視化效果中進(jìn)行選擇,應(yīng)用過(guò)濾器進(jìn)行交互式分析,并輕松地將所有內(nèi)容保存到一個(gè)地方,這樣您就可以隨時(shí)隨地了解您的見(jiàn)解。
QlikView
QlikView是一個(gè)商業(yè)智能軟件平臺(tái),可幫助企業(yè)將數(shù)據(jù)轉(zhuǎn)化為可操作的實(shí)時(shí)商業(yè)智能應(yīng)用,并可在任何地方進(jìn)行深入分析--所有這些都無(wú)需腳本。來(lái)自100多個(gè)國(guó)家的35000多名客戶使用了該軟件,其中包括IBM、微軟、瑞士再保險(xiǎn)公司等。其最大特點(diǎn)之一是具有交互功能,允許用戶構(gòu)建不同類型的應(yīng)用程序,以加快決策進(jìn)程。
Carto
這是一個(gè)通過(guò)開(kāi)放數(shù)據(jù)源將位置智能引入云的平臺(tái)。全球許多行業(yè)都在使用該平臺(tái),包括能源、城市規(guī)劃、媒體、教育等。使用該工具,他們可以輕松地將數(shù)據(jù)可視化到地圖上,而無(wú)需任何GIS知識(shí)。該工具之所以受到數(shù)據(jù)科學(xué)家的青睞,是因?yàn)槠涞貓D圖層種類繁多、不斷更新,而且無(wú)需在本地計(jì)算機(jī)上安裝任何軟件即可在所有項(xiàng)目中使用;這有助于節(jié)省寶貴的時(shí)間和資源。
CartoDB
這是一種與CARTO類似的產(chǎn)品,NASA和Autodesk等機(jī)構(gòu)都在使用,因?yàn)樗鼈兡軌蚶闷湟子谑褂玫耐戏殴δ埽趲酌腌妰?nèi)通過(guò)地圖從非結(jié)構(gòu)化數(shù)據(jù)中收集見(jiàn)解。它使用戶能夠創(chuàng)建地圖并對(duì)自己的數(shù)據(jù)集進(jìn)行地理參照,然后將其添加到平臺(tái)中,這樣用戶就可以對(duì)其位置數(shù)據(jù)進(jìn)行交互式分析,而無(wú)需掌握復(fù)雜的編程語(yǔ)言或理解復(fù)雜的查詢。這也再次說(shuō)明了為什么它如此受數(shù)據(jù)科學(xué)家的歡迎,因?yàn)樗麄兠刻於夹枰M(jìn)行這種分析,以滿足旅游、零售、電信等行業(yè)的客戶參與目的......
海馬課堂留學(xué)生作業(yè)輔導(dǎo),根據(jù)學(xué)生的輔導(dǎo)需求匹配背景相符的專業(yè)老師。1V1個(gè)性化備課,雙語(yǔ)教學(xué),實(shí)時(shí)輔導(dǎo),講解相關(guān)知識(shí)點(diǎn)和解題思路,提供大型作業(yè)任務(wù)的解決方案,輔導(dǎo)計(jì)算機(jī)編程語(yǔ)言操作,教授學(xué)生高效完成PPT和演講稿,針對(duì)性解決留學(xué)生各類作業(yè)中遇到的困擾,提高作業(yè)成績(jī)!
相關(guān)熱詞搜索: