2016-2022 All Rights Reserved.平安財經(jīng)網(wǎng).復制必究 聯(lián)系QQ280 715 8082 備案號:閩ICP備19027007號-6
本站除標明“本站原創(chuàng)”外所有信息均轉(zhuǎn)載自互聯(lián)網(wǎng) 版權(quán)歸原作者所有。
DataRobot是自動化機器學習(ML)和人工智能(AI)領(lǐng)域的領(lǐng)軍企業(yè),它收購了Paxata, Paxata是早期的自助數(shù)據(jù)準備純粹的游戲供應商之一。DataRobot表示,收購Paxata將有助于“增強其端到端的人工智能能力”;事實上,它在這一主題的新聞稿中也使用了同樣的措辭。交易條款沒有披露。
Paxata,就其本身而言,可能更關(guān)注于直接的描述性分析的數(shù)據(jù)準備,而不是人工智能。但人工智能平臺也需要準備數(shù)據(jù),以幫助數(shù)據(jù)科學家精簡和凈化他們的數(shù)據(jù)集。數(shù)據(jù)準備在所謂的特征工程工作中也非常有用,它的目的是在數(shù)據(jù)準備工作發(fā)生之前,從列數(shù)據(jù)的特定子集中提取ML模型輸入(“特征”)到它們自己的數(shù)據(jù)列中。
我與菲爾?Gurbacki DataRobot高級產(chǎn)品開發(fā)和客戶體驗,他告訴我每個DataRobot用戶需要做數(shù)據(jù)準備為了成功毫升。這樣,Gurbacki表示,盡管獨立Paxata產(chǎn)品仍將是可用的,該公司是最熱衷于拍攝Paxata數(shù)據(jù)準備,把每一個DataRobot客戶一體化的方式。
Gurbacki還解釋說,用于AI和ML的數(shù)據(jù)準備工作負載與用于BI和分析的不同。首先,人工智能的準備工作通常集中在一組被轉(zhuǎn)換為模型特性的列上。此外,不僅需要準備數(shù)據(jù)來訓練ML模型,還需要準備這些模型在生成預測時得到的數(shù)據(jù)。數(shù)據(jù)需要以非常低的延遲發(fā)生,并且本質(zhì)上是一個頻繁的生產(chǎn)過程。這與BI數(shù)據(jù)準備不同,后者在較大的數(shù)據(jù)卷上針對一組廣泛的列執(zhí)行的頻率較低。
盡管工作負載不同,但DataRobot認為Paxata技術(shù)已經(jīng)準備好并能夠適應這兩種場景。
Paxata于2012年由一個團隊創(chuàng)建,其中包括來自企業(yè)商業(yè)智能(BI)領(lǐng)域的經(jīng)驗豐富的老手。創(chuàng)始人之一,首席產(chǎn)品官Nenshad Bardoliwalla是遺留CRM供應商Siebel的分析團隊的校友,以及BI先鋒Hyperion和SAP(Siebel和Hyperion都被Oracle收購了)。聯(lián)合創(chuàng)始人兼首席執(zhí)行官普拉卡什?南杜里來自Tibco和SAP。
我在紐約的aTDWIchapter會議上遇到了Bardoliwalla,當時Paxata還處于隱身模式。他解釋說,他和其他人都堅信,在企業(yè)級BI世界中,準備數(shù)據(jù)太困難,太依賴IT專家。這種情況反過來又剝奪了企業(yè)用戶以熱情和效率追求分析的權(quán)利。
如果這是一個標準化測試中的類比問題,我們可能會說[Paxata]:[data prep]和[DataRobot]:[AI和ML]。這兩家公司都試圖通過提供自助服務平臺來實現(xiàn)各自技術(shù)領(lǐng)域的民主化,從而增強業(yè)務用戶的能力,減輕他們對專業(yè)人士的依賴??紤]到這一點,這次收購意義重大。Gurbacki告訴我“DataRobot的使命是建立一個企業(yè)AI平臺,在原始數(shù)據(jù)和商業(yè)價值之間架起一座橋梁。”
另外,通過多樣化和現(xiàn)在的整合,作為純游戲供應商類別的data prep也在減少。Alteryx通過收購Semanta和Yhat,在數(shù)據(jù)目錄和人工智能領(lǐng)域顯著拓寬了其平臺。Datameer也推出了自己的Neebo數(shù)據(jù)虛擬化平臺。在Trifacta保持獨立的同時,該公司高度關(guān)注云數(shù)據(jù)倉庫和數(shù)據(jù)湖場景,谷歌利用了該公司的技術(shù)開發(fā)其云Dataprep產(chǎn)品。與此同時,微軟(Microsoft)、Informatica、Talend和Tableau等公司已將自行開發(fā)的自助數(shù)據(jù)準備系統(tǒng)添加到它們自己的堆棧和核心產(chǎn)品中。
亦讀:Alteryx擴展產(chǎn)品集,做數(shù)據(jù)科學采集
對于特定技術(shù)領(lǐng)域的創(chuàng)新(比如為大數(shù)據(jù)做自助數(shù)據(jù)準備)來說,這是一個自然的流程,會產(chǎn)生多個純粹的供應商,他們會將創(chuàng)新產(chǎn)品化。這是一個自然的結(jié)果,隨著一個創(chuàng)新領(lǐng)域的成熟,它的供應商會被現(xiàn)有的和新領(lǐng)域的參與者收購,比如人工智能。我們已經(jīng)看到這種情況發(fā)生在商業(yè)智能上——雖然一個數(shù)據(jù)點不構(gòu)成趨勢——也許現(xiàn)在我們會在數(shù)據(jù)準備上看到它。
2016-2022 All Rights Reserved.平安財經(jīng)網(wǎng).復制必究 聯(lián)系QQ280 715 8082 備案號:閩ICP備19027007號-6
本站除標明“本站原創(chuàng)”外所有信息均轉(zhuǎn)載自互聯(lián)網(wǎng) 版權(quán)歸原作者所有。