推動(dòng)機(jī)器學(xué)習(xí)創(chuàng)新和采用的六大主要趨勢(shì)
關(guān)于人工智能(AI)和 ML 為什么會(huì)不斷發(fā)展,有很多觀點(diǎn)。麥肯錫最近的一份報(bào)告將 ML 的工業(yè)化和應(yīng)用 AI 確定為今年的主要趨勢(shì)之一。在本周 AWS re:Invent 大會(huì)的一次會(huì)議上,亞馬遜(AWS)人工智能和機(jī)器學(xué)習(xí)副總裁兼總經(jīng)理 Bratin 概述了這家云巨頭看到的六大關(guān)鍵趨勢(shì),這些趨勢(shì)有助于推動(dòng) 2022 年及以后的創(chuàng)新和采用。
AWS 聲稱其 AI/ML 服務(wù)擁有超過(guò) 100,000 名客戶。這些服務(wù)分布在三個(gè)層級(jí):ML 基礎(chǔ)設(shè)施服務(wù),使組織能夠構(gòu)建自己的模型;SageMaker,提供構(gòu)建應(yīng)用程序的工具;以及針對(duì)特定用例的專用服務(wù),例如轉(zhuǎn)錄。
「機(jī)器學(xué)習(xí)已經(jīng)從一項(xiàng)小眾活動(dòng)轉(zhuǎn)變?yōu)楣鹃_展業(yè)務(wù)不可或缺的一部分,」Saha 在會(huì)議期間說(shuō)。
趨勢(shì)一:模型復(fù)雜性不斷提高
Saha 說(shuō),近年來(lái) ML 模型的復(fù)雜性呈指數(shù)級(jí)增長(zhǎng)。他對(duì)「指數(shù)」一詞的使用也不夸張。
衡量機(jī)器學(xué)習(xí)模型復(fù)雜程度的一種方法是計(jì)算其中的參數(shù)數(shù)量。Saha 解釋說(shuō),參數(shù)可以被認(rèn)為是嵌入在 ML 模型中的值變量。Saha 說(shuō),2019 年,當(dāng)時(shí)最先進(jìn)的 ML 模型大約有 3 億個(gè)參數(shù)。快進(jìn)到 2022 年,最好的模型現(xiàn)在已經(jīng)超過(guò) 5000 億。
「換句話說(shuō),在短短三年內(nèi),機(jī)器學(xué)習(xí)模型的復(fù)雜程度增加了 1600 倍,」Saha 說(shuō)。
這些龐大的模型現(xiàn)在通常被稱為基礎(chǔ)模型。使用基礎(chǔ)模型方法,可以使用海量數(shù)據(jù)集對(duì) ML 模型進(jìn)行一次訓(xùn)練,然后針對(duì)各種不同的任務(wù)進(jìn)行重復(fù)使用和調(diào)整。因此,企業(yè)可以通過(guò)更易于采用的方法從日益復(fù)雜的過(guò)程中受益。
「[基礎(chǔ)模型] 將機(jī)器學(xué)習(xí)的成本和工作量降低了一個(gè)數(shù)量級(jí),」Saha 說(shuō)。
趨勢(shì)二:數(shù)據(jù)增長(zhǎng)
越來(lái)越多的數(shù)據(jù)和不同類型的數(shù)據(jù)被用于訓(xùn)練 ML 模型。這是 Saha 確定的第二個(gè)關(guān)鍵趨勢(shì)。
組織現(xiàn)在正在構(gòu)建經(jīng)過(guò)結(jié)構(gòu)化數(shù)據(jù)源(如文本)以及非結(jié)構(gòu)化數(shù)據(jù)類型(包括音頻和視頻)訓(xùn)練的模型。能夠?qū)⒉煌臄?shù)據(jù)類型放入 ML 模型中,這導(dǎo)致 AWS 開發(fā)了多種服務(wù)來(lái)幫助訓(xùn)練模型。
Saha 強(qiáng)調(diào)的一種此類工具是 SageMaker Data Wrangler,它可以幫助用戶使用一種使其適用于 ML 訓(xùn)練的方法來(lái)處理非結(jié)構(gòu)化數(shù)據(jù)。本周在 re:Invent 大會(huì)上,AWS 還在 SageMaker 中添加了對(duì)地理空間數(shù)據(jù)的新支持。
趨勢(shì)三:機(jī)器學(xué)習(xí)產(chǎn)業(yè)化
AWS 也看到了 ML 產(chǎn)業(yè)化的趨勢(shì)。這意味著 ML 工具和基礎(chǔ)架構(gòu)更加標(biāo)準(zhǔn)化,使組織能夠更輕松地構(gòu)建應(yīng)用程序。
Saha 表示,ML 工業(yè)化很重要,因?yàn)樗梢詭椭M織實(shí)現(xiàn)開發(fā)自動(dòng)化并使其更加可靠。隨著組織構(gòu)建和部署更多模型,工業(yè)通用方法對(duì)于擴(kuò)展至關(guān)重要。
「即使在亞馬遜內(nèi)部,我們也在使用 SageMaker 進(jìn)行工業(yè)化和機(jī)器學(xué)習(xí)開發(fā),」Saha 說(shuō)。「例如,最復(fù)雜的 Alexa 語(yǔ)音模型現(xiàn)在正在 SageMaker 上進(jìn)行訓(xùn)練?!?/span>
趨勢(shì)四:針對(duì)特定用例的 ML 支持的應(yīng)用程序
由于針對(duì)特定用例的專用應(yīng)用程序,ML 也在增長(zhǎng)。
Saha 表示,AWS 客戶已要求供應(yīng)商自動(dòng)化常見的 ML 用例。例如,AWS(和其他供應(yīng)商)現(xiàn)在提供語(yǔ)音轉(zhuǎn)錄、翻譯、文本轉(zhuǎn)語(yǔ)音和異常檢測(cè)等服務(wù)。這些為組織提供了一種更簡(jiǎn)單的方法來(lái)使用 ML 支持的服務(wù)。
例如,實(shí)時(shí)音頻通話中的情緒分析是一個(gè)新的復(fù)雜用例,AWS 現(xiàn)在通過(guò)其 Amazon Transcribe 服務(wù)的實(shí)時(shí)通話分析功能支持該用例。Saha 表示,該功能使用語(yǔ)音識(shí)別模型來(lái)了解客戶情緒。
趨勢(shì)五:負(fù)責(zé)任的人工智能
負(fù)責(zé)任的人工智能也有增長(zhǎng)的趨勢(shì)和需求。
「隨著人工智能和機(jī)器學(xué)習(xí)的發(fā)展,人們意識(shí)到我們必須負(fù)責(zé)任地使用它,」Saha 說(shuō)。
從 AWS 的角度來(lái)看,負(fù)責(zé)任的人工智能需要具備幾個(gè)關(guān)鍵屬性。系統(tǒng)需要公平,無(wú)論種族、宗教、性別和其他用戶屬性如何,對(duì)所有用戶平等運(yùn)作。ML 系統(tǒng)還需要可解釋,以便組織了解模型的運(yùn)作方式。還需要治理機(jī)制,以確保負(fù)責(zé)任的人工智能得到實(shí)踐。
趨勢(shì)六:機(jī)器學(xué)習(xí)民主化
推動(dòng) ML 向前發(fā)展的最后一個(gè)關(guān)鍵趨勢(shì)是使技術(shù)民主化,使更多人可以獲得工具和技能。
「客戶告訴我們,他們……通常很難招聘到他們需要的所有數(shù)據(jù)科學(xué)人才,」Saha 說(shuō)。
在 Saha 看來(lái),民主化挑戰(zhàn)的答案在于繼續(xù)開發(fā)低代碼和用例驅(qū)動(dòng)的工具,以及教育。
「AWS 還在投資培訓(xùn)下一批機(jī)器學(xué)習(xí)開發(fā)人員,」Saha 說(shuō)?!窤WS 承諾,到 2025 年,我們將通過(guò)免費(fèi)的云計(jì)算技能培訓(xùn)幫助超過(guò) 2900 萬(wàn)人提高他們的技術(shù)技能?!?/span>
參考內(nèi)容:https://venturebeat.com/ai/aws-names-6-key-trends-driving-machine-learning-innovation-and-adoption/
*博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀點(diǎn),如有侵權(quán)請(qǐng)聯(lián)系工作人員刪除。