反思IBM沃森大裁員:AI落地應(yīng)用,需解決這三大痛點
不久前,據(jù) The Register 報道,有 IBM 內(nèi)部消息人士透露,Watson健康部門要解雇了大約 50% 至 70% 的員工。
本文引用地址:http://butianyuan.cn/article/201805/380813.htm這對IBM來說是一個非常糟糕的消息,這些年IBM大力宣傳“認(rèn)知計算”,而Watson 健康就是這其中的標(biāo)桿項目。如今Watson健康大裁員,基本就是宣告IBM這些年的努力基本失敗了。
IBM作為最早將AI技術(shù)推向市場的企業(yè),我們可以從Watson健康的失利,來看看目前AI落地的一些痛點。
1、缺乏有效的評估標(biāo)準(zhǔn)
關(guān)于Watson健康我們可以在網(wǎng)上看到各種評論,有些人評價其為“笑話”,也有人認(rèn)為其技術(shù)先進性不可否認(rèn),在各種說辭中大家莫衷一是。
這里面當(dāng)然很大一部分原因是因為IBM為了宣傳自己的產(chǎn)品,通過媒體、廣告等手段混淆了大家注意力。但業(yè)界缺乏統(tǒng)一的基礎(chǔ)測試,使得AI產(chǎn)品無法量化評價,是問題的本質(zhì)。
其他的行業(yè),無論廣告怎么宣傳,行業(yè)里自會有其自己的標(biāo)尺,通過基準(zhǔn)測試,大家總可以大概分個高下,但在AI行業(yè),除了圖像和語音以外,公認(rèn)的基準(zhǔn)測試根本不存在。
在李飛飛建立ImageNet圖像測試集之前,在圖像識別領(lǐng)域,也沒有統(tǒng)一的評測標(biāo)準(zhǔn)。這就很難定量的評價各種算法的優(yōu)劣。
我們可以看到,自從ImageNet數(shù)據(jù)集成為行業(yè)基準(zhǔn)測試的標(biāo)準(zhǔn)后,極大的推動了圖像識別領(lǐng)域的發(fā)展。圖像識別很快成為人工智能領(lǐng)域發(fā)展的最快的領(lǐng)域。
這里面自然有算法的適用性問題,但建立統(tǒng)一的評測標(biāo)準(zhǔn),讓行業(yè)可以定量分析算法的有效性,確實對整個行業(yè)是有極其重大的意義的。這也是李飛飛在人工智能界如此受人尊重的原因。
我們再回過來看,在醫(yī)療健康領(lǐng)域,雖然IBM耕耘多年,但幾乎沒有發(fā)布任何行業(yè)公認(rèn)的測試結(jié)果,或者自己制定一套嚴(yán)密的評測體系供外界參考。
反過來,IBM通過各種非學(xué)術(shù)渠道,大肆宣傳自己取得的成果,導(dǎo)致人們對其期望過高,但在應(yīng)用中又無法驗證其有效性,這種落差很容易給人不信任感。
2、沒有良好的商業(yè)模式
商業(yè)模式,對于技術(shù)變現(xiàn)來說至關(guān)重要,但IBM并沒有給其AI產(chǎn)品找到合作雙方都接受的商業(yè)模式。
IBM的商業(yè)模式非常古板,即通過技術(shù)服務(wù)合同鎖定客戶,然后派遣人員去合作伙伴那邊進行項目實施。
這種合作模式一般適用于傳統(tǒng)的IT項目,由于目標(biāo)明確、需求清晰,投入產(chǎn)出相對可預(yù)計,合作雙方都可以將自己的投入控制在可控的范圍內(nèi)。但是目前一些AI項目實施其投入規(guī)模巨大,但其收益卻無法衡量。
以著名的IBM和MD Anderson癌癥研究中心為例,據(jù)報道MD Anderson向IBM支付了3900萬美元的費用,但該報道同時指出:“使用過 Watson的醫(yī)生都不愿談及此事。”像此前第一條所說,AI帶來的好處,無法精確量化,以至于昂貴的AI其結(jié)果完全無法評估。
另外一個案例是IBM和新加坡政府的合作,根據(jù)鈦媒體的報道,當(dāng)時在試驗的時候,其治理交通的情況獲得了肯定,但后期如果投入真實運營,新加坡交通管理部門需要首先繳付巨額的支出,巨大的成本讓相關(guān)部門望而卻步了。
由于云計算的興起,現(xiàn)在的IT服務(wù)我們已經(jīng)逐漸向按需付費轉(zhuǎn)變,越來越多的企業(yè)不愿意為不確定的效果一次性的支付巨額的固定費用。AI服務(wù)需要找到類似的模式以便取得客戶的信任,以傳統(tǒng)合同綁架客戶的模式肯定不是未來。
3、缺少有效的行業(yè)模型和訓(xùn)練數(shù)據(jù)
我們知道,現(xiàn)在AI計算需有成熟的行業(yè)應(yīng)用模型,并通過大量的經(jīng)過標(biāo)注的數(shù)據(jù)對系統(tǒng)進行“訓(xùn)練”才可以真正的投入使用。
而很多時候這樣的模型和數(shù)據(jù)都是非常稀缺的。
在福布斯的對IBM沃森的報道中我們也可以看到這種困局:
“沃森需要幾個月時間進行繁重的訓(xùn)練,而專家們需要給該平臺飼喂海量條理清楚的數(shù)據(jù),以使其能夠得出有用的結(jié)論。對于沃森系統(tǒng)來說,‘條理清楚’的要求很難達到,因此未經(jīng)整理過的數(shù)據(jù)一般都用不上。結(jié)果,沃森用戶不得不雇傭咨詢專家團隊,對數(shù)據(jù)集進行改進整理,既費時又耗錢。”
為了給沃森健康提供數(shù)據(jù)支持,IBM在近年進行的大量的收購,這些公司很多為醫(yī)療數(shù)據(jù)分析和解決方案的公司。這包括2016年斥資26億美元收購的醫(yī)療數(shù)據(jù)公司Truven、2015年斥資10億美元收購的醫(yī)療影像公司Merge以及同樣在2015年收購的醫(yī)療保健管理公司Phytel。
但即使如此大的投入,IBM似乎還是沒有獲得太多高質(zhì)量的數(shù)據(jù),其訓(xùn)練的AI表現(xiàn)并部盡如人意。福布斯報道援引專家評論道:“最新的機器學(xué)習(xí)算法通常不能提供足夠的敏感性、特異性和精準(zhǔn)性,而這都是臨床決策所必需的?!?/p>
此前收購的醫(yī)療數(shù)據(jù)和服務(wù)公司人員正是這次裁員的主要部分,也側(cè)面證明了他們并沒有給IBM帶來太大的價值。
IBM的沃森是AI產(chǎn)業(yè)化最早的先驅(qū),其遇到的困境也是整個產(chǎn)業(yè)所面臨的困境。
新生的AI企業(yè),需要克服這些困境:建立行業(yè)認(rèn)可的評價標(biāo)準(zhǔn);推出更加靈活的實施方案,控制企業(yè)成本;建立真正的行業(yè)應(yīng)用模型并獲得海量數(shù)據(jù)進行訓(xùn)練,得到可用的方案。完成以上這些點,才能真正讓AI從概念走向應(yīng)用。
評論