新聞中心

EEPW首頁 > 智能計算 > 業(yè)界動態(tài) > 蘋果發(fā)力對話式AI 預算擴至每日數(shù)百萬美元

蘋果發(fā)力對話式AI 預算擴至每日數(shù)百萬美元

作者: 時間:2023-09-07 來源:網(wǎng)易科技 收藏

9月7日消息,據(jù)外媒援引知情人士透露,始終在增加構建所需計算的預算,并且已經(jīng)擴大到每天數(shù)百萬美元。該公司的一個目標是開發(fā)一些功能,允許用戶使用簡單的語音命令來自動執(zhí)行涉及多個步驟的任務。舉例來說,這項技術可以讓用戶命令Siri語音助手用他們最近拍攝的五張照片創(chuàng)建GIF動圖,并將其發(fā)送給朋友。如今,用戶必須手動完成這個過程。

本文引用地址:http://www.butianyuan.cn/article/202309/450326.htm

據(jù)了解該團隊的人士稱,早在四年前,主管約翰·詹南德里亞(John Giannandrea)就被授權組建團隊,開發(fā)被稱為大語言模型(LLM)的對話式(或稱生成式人工智能)。當時,這項技術尚未成為軟件行業(yè)的焦點。在Open于去年推出聊天機器人ChatGPT之后,人們才發(fā)現(xiàn)有先見之明。聊天機器人ChatGPT推動了大語言模型的繁榮。

幾位蘋果員工表示,盡管詹南德里亞多次表達了對由人工智能語言模型驅動的聊天機器人潛在用途的懷疑,但蘋果并不是完全沒有為語言模型的繁榮做好準備。這要歸功于詹南德里亞,他幫助對蘋果的軟件研究文化做出了改變。

這些變化現(xiàn)在正獲得回報,因為大語言模型的出現(xiàn)可能會改變人們創(chuàng)造一切東西的方式,從計算機程序到幻燈片演示再到書籍,都是如此。這項技術還有望自動化涉及文本的繁瑣、重復性的任務,從摘要到處理企業(yè)IT票據(jù)或客戶服務查詢等。

這個名為“基礎模型”(Foundational Models)的對話式人工智能團隊,由幾位曾在谷歌工作多年的工程師組成,詹南德里亞在加入蘋果之前是他們的主管。該團隊由龐若明(Ruoming Pang,音譯)領導,他于2021年加入蘋果,此前在谷歌工作了15年,包括詹南德里亞負責領導的人工智能研究部門。

蘋果組建多個LLM團隊

知情人士表示,“基礎模型”團隊的規(guī)模仍然很小,大約有16人,但用于培訓蘋果最先進模型的預算已經(jīng)增加到每天數(shù)百萬美元。相比之下,開發(fā)ChatGPT的初創(chuàng)企業(yè)Open首席執(zhí)行官薩姆·奧特曼(Sam Altman)曾表示,該公司在幾個月的時間里,花費了超過1億美元來培訓GPT-4,這是該公司為聊天機器人提供支持的最先進軟件。

蘋果的“基礎模型”團隊扮演著與谷歌和Meta等公司人工智能團隊類似的角色。在這些公司,研究人員需要構建人工智能模型,然后其他團隊將這些模型應用到公司的各種產品中。

不過,蘋果似乎至少還有另外兩個相對較新的團隊,正在開發(fā)語言或圖像模型。蘋果最近的一份人工智能研究報告和LinkedIn上的員工簡介顯示,該公司存在一個“視覺智能”(Visual Intelligence)團隊,致力于開發(fā)能夠生成“圖像、視頻或3D場景”的軟件。

另一個團隊正在進行涉及多模式人工智能的長期研究,這種模型可以識別和生成圖像、視頻或文本。這個多模式團隊的領導者之一是喬恩·什倫斯(Jon Shlens),他曾在2021年底開始在蘋果工作,之前在谷歌從事人工智能工作。什倫斯于今年早些時候加入了谷歌的人工智能團隊(現(xiàn)在被稱為Google DeepMind)。谷歌即將推出的Gemini模型具有多模式功能。

蘋果“基礎模型”團隊已經(jīng)開發(fā)出幾個先進的模型,并正在內部測試。一位直接了解蘋果聊天機器人開發(fā)情況的人士說,一款基于大語言模型的蘋果聊天機器人最終可能會與使用蘋果AppleCare客戶互動。AppleCare是該公司提供保修和技術支持的售后服務。

Siri升級

另外,Siri團隊也計劃整合大語言模型,讓蘋果的智能語音助手用戶以目前無法實現(xiàn)的方式自動完成某些復雜的任務,比如前面提到的用簡單指令創(chuàng)建和發(fā)送GIF的例子。這項新功能與蘋果的快捷方式應用Shortcuts有關,該應用允許用戶使用不同的應用手動編程一系列操作,預計將于明年與新版操作系統(tǒng)一起發(fā)布。一位知情人士說,谷歌也一直在努力將其大語言模型與語音助手整合,以便能夠理解和處理更復雜的任務。

據(jù)這位知情人士透露,蘋果“基礎模型”團隊中的成員認為,其最先進的大語言模型AJAX GPT的功能超過了Open的GPT 3.5,后者是支持ChatGPT最初版本的大語言模型。自那以后,OpenAI推出了一系列功能明顯更強大的模型。

關于蘋果如何在其產品中融入大語言模型,目前仍不清楚細節(jié)。據(jù)多位離職的蘋果機器學習工程師說,該公司領導層更喜歡在設備上運行軟件,這提高了隱私和性能,而不是在云服務器上運行。

但這可能很難實現(xiàn)。例如,據(jù)一位直接了解該模型的人士透露,AJAX GPT已經(jīng)接受了2000多億個參數(shù)的培訓。參數(shù)反映了機器學習模型的大小和復雜性,參數(shù)數(shù)量越多,表示模型越復雜,需要更多的存儲空間和計算能力。一個擁有2000多億個參數(shù)的大語言模型,可能不適合在iPhone上運行。

縮小大語言模型的規(guī)模已經(jīng)有先例可循。例如,谷歌的PaLM 2有四種尺寸,其中一種可以在設備上使用,另一種則可以離線使用。

蘋果發(fā)言人拒絕就此置評。

谷歌的影響力

詹南德里亞被同事們稱為J.G.,他最初加入蘋果是為了幫助改進Siri,并為蘋果的軟件注入更多的機器學習功能。盡管他曾多次向同事們表示,對由大語言模型驅動的聊天機器人的潛在用途持懷疑態(tài)度,但一位知情人士表示,在過去一年里,在看到一些內部演示后,他開始承認這項技術有能力完成指定任務。

蘋果“基礎模型”團隊的組建源于詹南德里亞的決定,他希望讓蘋果更像他的前雇主,讓員工在進行各種研究和發(fā)表論文方面有更大的靈活性。此前,對這些做法的限制損害了蘋果招聘人才的能力,盡管該公司成功地在其產品中使用了早期的人工智能技術。

2018年加入蘋果后,詹南德雷亞幫助從谷歌招聘了關鍵工程師和研究人員。他還支持更多地使用谷歌的云服務,包括安裝了谷歌開發(fā)的人工智能芯片(即張量處理單元)的服務器,用來訓練蘋果的機器學習模型,進而幫助改進Siri和提高其他產品功能。

據(jù)了解龐若明的人說,他在神經(jīng)網(wǎng)絡方面發(fā)表的研究成果吸引了大批追隨者。神經(jīng)網(wǎng)絡是機器學習的一個子集,涉及訓練軟件識別數(shù)據(jù)中的模式和關系,類似于人類大腦的工作方式。龐若明某些比較著名的研究涉及神經(jīng)網(wǎng)絡如何與手機處理器協(xié)同工作,以及如何使用并行計算來訓練神經(jīng)網(wǎng)絡,并行計算是將較大的問題分解成多個處理器可以同時計算的較小任務的過程。

開源運動

龐若明對蘋果的影響可以從AXLearn中看出來,這是他的團隊在過去1年中開發(fā)用于培訓AJAX GPT的內部軟件。AXLearn是一個機器學習框架,可以快速訓練機器學習模型。AXLearn的部分構成基于龐若明的研究,并針對谷歌張量處理單元進行了優(yōu)化。

AXLearn是JAX的一個分支,JAX是谷歌研究人員開發(fā)的開源框架。如果將蘋果的AJAX GPT比作一棟房子,那AXLearn就是藍圖,而JAX就是用來繪制藍圖的筆和紙。蘋果用來培訓大語言模型的數(shù)據(jù)主要源自建筑行業(yè),目前尚未公開。

今年7月份,蘋果“基礎模型”團隊悄悄地將AXLearn的代碼上傳到代碼存儲庫GitHub,公眾可以使用它來培訓自己的大語言模型,而不必從頭開始構建所有內容。蘋果公開發(fā)布AXLearn代碼的原因尚不清楚,但公司這樣做通常是希望其他工程師能對模型進行改進。在詹南德雷亞到來之前,對于向來行事隱秘的蘋果來說,開放可用于商業(yè)用途的源代碼的決定顯得不同尋常。

團隊領導

荷蘭計算機科學家阿瑟·范·霍夫(Arthur Van Hoff)最初領導的團隊,后來成為蘋果“基礎模型”團隊的骨干。據(jù)熟悉霍夫的人說,他是上世紀90年代開發(fā)Java的太陽微系統(tǒng)公司團隊的早期成員,后來成為了知名的企業(yè)家?;舴蛴?019年加入蘋果,最初致力于開發(fā)新版Siri,內部代號為黑鳥(Blackbird),但蘋果最終放棄了這個版本。

然后,霍夫的團隊開始專注于構建大語言模型,他們的目標是將其用于黑鳥的基本版本。該團隊最初只有幾名員工,其中最著名的是兩名專門從事自然語言處理的英國研究人員湯姆·岡特(Tom Gunter)和托馬斯·尼克森(Thomas Nickson)。這兩位研究人員都在牛津大學獲得了高等學位,并于2016年加入蘋果從事Siri的研究。

據(jù)知情人士透露,2021年,龐若明加入蘋果,幫助培訓尖端的大語言模型。與其他蘋果研究人員不同,他獲得了留在紐約的特殊請求,并被授權在那里為公司的機器學習團隊建立一個新的前哨基地。幾個月后,蘋果聘請了谷歌前人工智能高管達芙妮·梁(Daphne Luong)來監(jiān)督霍夫的團隊,并聘請谷歌研究員薩米·本吉奧(Samy Bengio)領導一個專注于長期機器學習研究的平行團隊。

龐若明如今接管了“基礎模型”團隊,而霍夫則在今年早些時候開始無限期休假。據(jù)知情人士透露,龐若明團隊的幾名成員目前常駐紐約。

谷歌云交易

龐若明被招聘之際,蘋果內部越來越意識到大語言模型在機器學習領域正變得越來越重要。據(jù)知情人士透露,OpenAI的GPT-3于2020年6月發(fā)布,這促使蘋果機器學習團隊要求獲得更多資金來訓練他們自己的模型。

據(jù)兩名直接了解此事的人士透露,為了節(jié)省成本,蘋果的管理人員歷來鼓勵機器學習工程師使用谷歌的云計算服務,而不是亞馬遜的類似服務,因為谷歌的成本更低。

據(jù)一位熟悉相關討論的離職蘋果高管透露,谷歌高管過去曾對蘋果表示,云服務定價較低,在一定程度上是對兩家公司之間廣泛商業(yè)合作的認可。根據(jù)協(xié)議,谷歌搜索是蘋果Safari瀏覽器的默認搜索提供商。多年來,蘋果始終是全球最大的云服務器租賃商,并已成為谷歌云的最大客戶之一,盡管它仍然是亞馬遜的重要客戶。

一名知情人士表示,蘋果還積極從谷歌和Meta的人工智能團隊中招募人才。自從AXLearn代碼于7月上傳到GitHub上以來,已有18人對其進行了改進,其中至少有12人在過去兩年內加入了蘋果的機器學習團隊。這些人中,有7人曾在谷歌或Meta工作過。



評論


相關推薦

技術專區(qū)

關閉