三個(gè)核心要素幫你應(yīng)對(duì)機(jī)器學(xué)習(xí)挑戰(zhàn)
2016年,“機(jī)器學(xué)習(xí)”還只是被Gartner 視為一個(gè)“流行詞”,到如今,它已發(fā)展成為幾乎所有 IT 人士都在思考、探索或執(zhí)行的一件事。毫無疑問,基于數(shù)據(jù)的分析和預(yù)測(cè)(機(jī)器從信息資源中學(xué)習(xí),然后通知業(yè)務(wù)部門及其他部門并影響其行動(dòng))已經(jīng)是當(dāng)今迅速增長(zhǎng)的最新、最熱門的技術(shù)領(lǐng)域之一。但對(duì)于那些正在進(jìn)入機(jī)器學(xué)習(xí)領(lǐng)域的參與者來說,理想和現(xiàn)實(shí)之間仍無法平衡;正如每個(gè)不斷發(fā)展的新興事業(yè)一樣,基礎(chǔ)設(shè)施之水既能載舟,亦能覆舟。
本文引用地址:http://butianyuan.cn/article/201801/375118.htmGartner已經(jīng)確定了三種主要的最佳實(shí)踐,基礎(chǔ)設(shè)施和運(yùn)營(yíng)領(lǐng)導(dǎo)者在幫助所在組織準(zhǔn)備應(yīng)對(duì)機(jī)器學(xué)習(xí) (ML) 和人工智能 (AI) 帶來的挑戰(zhàn)時(shí),可以考慮采用這三種最佳實(shí)踐:
1. 采用模塊化訪問,實(shí)現(xiàn)高效的數(shù)據(jù)管道——根據(jù) Gartner 的研究,“最終用戶表示,在典型項(xiàng)目中,數(shù)據(jù)準(zhǔn)備和管理占去了將近 75% 到 85% 的機(jī)器學(xué)習(xí)管道。”建議在整個(gè)組織內(nèi)執(zhí)行更有效的數(shù)據(jù)清理、轉(zhuǎn)換和整合。
2. 制定高效的機(jī)器學(xué)習(xí)模型交付策略——該評(píng)論指出:“I&O 領(lǐng)導(dǎo)者可以通過訪問模型、功能和預(yù)測(cè)存儲(chǔ)庫來顯著加快其機(jī)器學(xué)習(xí)管道的速度。”這有助于縮小實(shí)驗(yàn)級(jí)和生產(chǎn)級(jí)系統(tǒng)之間的資源差距。
3. 提供可擴(kuò)展的計(jì)算基礎(chǔ)設(shè)施——Gartner 指出:“機(jī)器學(xué)習(xí)管道中的第二大時(shí)間密集型部分通常是模型工程設(shè)計(jì)階段。”同樣,建議采取的措施是針對(duì)需要聚集的核心參與者,將數(shù)據(jù)科學(xué)家、業(yè)務(wù)專家和軟件工程師的最佳技能結(jié)合起來,實(shí)現(xiàn)協(xié)作并推動(dòng)“跨團(tuán)隊(duì)的機(jī)器學(xué)習(xí)理念”。
如果具體情形難度相當(dāng),通常需要權(quán)衡生產(chǎn)時(shí)間和準(zhǔn)確性以及提供組織范圍的機(jī)器學(xué)習(xí)策略,而且往往要橫跨包括公共、私有、數(shù)據(jù)庫、大數(shù)據(jù)生態(tài)系統(tǒng)、傳統(tǒng)數(shù)據(jù)存儲(chǔ)等在內(nèi)的多個(gè)孤立的數(shù)據(jù)源進(jìn)行。
評(píng)論