您的位置: 首頁 >科技 >

數據科學家的工作范圍廣泛 因應用程序而異

2022-08-26 08:17:50 編輯:裘爍莉 來源:
導讀 什么是一個數據科學家的背景下做人工智能和機器學習的工作?每天處理這類項目的很多專業(yè)人士都會說這個問題很難回答。一個更好的問題是:數...

什么是一個數據科學家的背景下做人工智能和機器學習的工作?每天處理這類項目的很多專業(yè)人士都會說這個問題很難回答。一個更好的問題是:數據科學家不做什么?

數據科學家是AI或ML過程中不可或缺的一部分,因為所有這些項目都依賴于大數據或復雜輸入。數據科學家是知道如何處理數據以產生結果的基本野心家。

但是,有一些方法可以討論數據科學家的作用,他或她需要什么資格,以及他或她在這個過程中扮演的角色。

閱讀:您可以通過在線學習掌握的6個關鍵數據科學概念

各種定義,各種職責

描述數據科學家工作的許多專家從廣義上講它。

“在小公司或在新市場工作時,數據科學家的角色是將相對新穎(但顯而易見)的數據源轉換為解決最終用戶問題的東西,這在以前是不可能實現的,所使用的技術不存在,“Mercury Global Partners的客戶經理Antonio Hicks說。“理想的候選人是部分數學家,部分軟件工程師和部分企業(yè)家。”

其他人回應這個基本想法,提到科學家需要解決建模項目的數據。

“數據科學家需要的最重要的屬性是對他們周圍世界的深切好奇 - 他們是在回答問題還是建立模型,在他們面前理解問題的愿望是關鍵,” 數據科學家經理Erin Akinci說。在Asana。“從那里開始,大多數人都需要數學和編程方面的技能來尋找解決方案,但具體的數學和編程類型因數據科學領域的專業(yè)知識而異。”

“優(yōu)秀的科學工作更多地與科學家對問題的思考方式有關,而不是他們用來解決問題的工具,”Valkyrie Intelligence的創(chuàng)始人兼首席執(zhí)行官Charlie Burgoyne補充道。Valkyrie是一家應用科學咨詢公司,擁有令人印象深刻的項目,如Mark I,這是一個專門的網絡設備,可以促進神經網絡培訓和測試,改善以前基于云的機器學習平臺的可能性。

“市場需要精通Python開發(fā),神經網絡設計以及將數據存儲庫重塑為最新數據庫架構的能力的科學家,”Burgoyne說。“然而,這些能力是一個有才華的科學家的賭注。不那么明顯的是科學家對強悍的好奇心,積極的聰明才智和堅持科學方法的能力。“

數據科學家的技能

因此,就實際技能而言,數據科學家在建模方面需要一定的創(chuàng)造力和精明。他們也可以從“硬技能”中受益匪淺,例如Python,C ++或其他應用于ML項目的常用語言的經驗編碼。

“Python和C ++是必不可少的,能夠將編碼技能與數據分析和處理相結合,統計數據是使數據科學家成為強有力的候選人或員工的核心技能,”在線模擬面試平臺Pramp的Val Streif說道。適用于軟件工程師,開發(fā)人員和數據科 “雖然通過將數據科學家與開發(fā)人員配對可以解決一些編程技巧,但如果從公司的角度將兩種技能結合在一起,那就更容易了。”

其他專家將R,Hadoop,Spark,Sas和Java添加到列表以及Tableau,Hive和MATLAB等技術中。

所有這些都是令人印象深刻的簡歷,但是一些有招聘數據科學家經驗的人說其他“人”方面也很重要。

“傳統上,擁有多元化文科教育的人才能成為優(yōu)秀的數據科學家,”Burgoyne說道,他們區(qū)分了建筑方面的工程師和數據科學家,他們的工作可能更具概念性。他繼續(xù):

傳統STEM領域的專業(yè)知識與人文,藝術或商業(yè)領域的互補關注產生了那些成為優(yōu)秀的行業(yè)導向科學家的品質。必須指出的是,組織利用這些品質并以富有成效的方式塑造他們的熱情和方法的能力同樣重要。我觀察到,當數據科學計劃不成功時,該組織可能像科學家一樣有罪??茖W家不是工程師。它們不會被驅動執(zhí)行和構建。他們被驅使去發(fā)現和理解。掌握這種差異的組織可以很好地培養(yǎng)這兩個領域。

至于科學家通常應用的數據,這與公司的核心目標有關。一些公司正在追逐分散的互聯網 - 有些公司正在玩物聯網或SaaS。其他人正試圖開拓“用戶友好”或“道德”或“透明”AI。

無論如何,數據科學家可能正在彌合他們使用的數據的硬度量,無論是在哪種技術堆棧中,以及概念化AI / ML功能的隨心所欲的工作之間的鴻溝。

“我們聘請數據科學家來管理數據收集和清理,以及將這些數據轉化為有意義的信息,” G2 Crowd數據科學與分析經理Michael Hupp說。他詳細說明:

通常,這意味著管理驅動公司數據引擎的任何重要算法,并且能夠流利地使用關鍵分析工具和語言,但近年來還包括新興領域,如自然語言處理,機器學習,其他形式的支持AI的分析。最成功的數據科學家是那些將他們的硬技能與快速學習能力相結合的人,以及有效傳達他們發(fā)現的洞察力的能力,以便他們對自己的業(yè)務有意義。

通過這些類型的見解,年輕的專業(yè)人??士或學生更容易弄清楚數據科學家是否會成為他們的好角色,以及如何獲得技能。STEM學習在全國各地的學校變得越來越容易,但是對編碼和技術的熱情以及即時學習的能力無法替代。


免責聲明:本文由用戶上傳,如有侵權請聯系刪除!

2016-2022 All Rights Reserved.平安財經網.復制必究 聯系QQ280 715 8082   備案號:閩ICP備19027007號-6

本站除標明“本站原創(chuàng)”外所有信息均轉載自互聯網 版權歸原作者所有。