混合式AI解鎖生成式AI的未來

作者：時(shí)間：2023-05-28 來源：CTIMES

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫查詢

本文敘述混合型是AI的未來第一部分：透過裝置上AI與混合式AI實(shí)現(xiàn)生成式AI的擴(kuò)展。隨著生成式人工智能（AI）的采用速度出現(xiàn)破紀(jì)錄的成長(zhǎng)、以及運(yùn)算需求增加，混合處理的重要性更不可同日而語。然而，如同傳統(tǒng)運(yùn)算從大型主機(jī)和精簡(jiǎn)型計(jì)算機(jī)發(fā)展到當(dāng)前的云端和邊緣裝置混合一樣，AI處理也必須在云端和裝置間進(jìn)行妥善的分配，才能擴(kuò)展并充分發(fā)揮潛力。

混合的AI架構(gòu)不是只在云端進(jìn)行處理，而是在云端和邊緣裝置之間分配并協(xié)調(diào)AI工作負(fù)載。云端和邊緣裝置—智能型手機(jī)、汽車、個(gè)人計(jì)算機(jī)和物聯(lián)網(wǎng)裝置—共同合作，能提供更強(qiáng)大、高效和充分優(yōu)化的AI功能。

主要的動(dòng)機(jī)是節(jié)省成本。以每一筆搜尋的成本為例，相較于傳統(tǒng)的搜尋方法，使用以生成式AI為基礎(chǔ)的搜尋成本估計(jì)會(huì)增加10倍—而這還只是生成式AI的眾多應(yīng)用之一。

混合式AI將使生成式AI開發(fā)人員和供貨商能夠利用邊緣裝置中的運(yùn)算能力來降低成本。此外，混合的AI架構(gòu)（或僅在裝置上運(yùn)行AI）在全球范圍提供效能、個(gè)人化、隱私和安全方面額外的優(yōu)勢(shì)。

這些架構(gòu)可以有不同的卸除選項(xiàng)，根據(jù)模型和查詢復(fù)雜性等要素在云端和裝置間分配處理工作。例如，如果模型大小、提示（prompt）和生成長(zhǎng)度小于特定閾值，并提供可接受的精確度，便能完全在裝置上運(yùn)行推理。如果任務(wù)較為復(fù)雜，模型可以跨云端和裝置之間運(yùn)行。

混合式AI甚至能讓裝置和云端同時(shí)運(yùn)行模型—裝置運(yùn)行模型的輕量版，而云端同時(shí)處理完整模型的多個(gè)代碼（token），并在需要時(shí)修正裝置答案。

圖片.png
圖二 : 在以裝置為中心的混合AI架構(gòu)中，云端僅用于卸除裝置無法充分執(zhí)行的 AI 任務(wù)。

藉由邊緣裝置擴(kuò)展生成式AI
隨著強(qiáng)大的生成式AI模型變得越來越小，裝置上的處理能力不斷提升，混合式AI的潛力也更進(jìn)一步的成長(zhǎng)。具有超過10億個(gè)參數(shù)的AI模型已經(jīng)能在效能和精確度水平與云端相近的手機(jī)上運(yùn)行；而在不久的將來，有100億個(gè)參數(shù)以上的模型預(yù)計(jì)也將能在裝置上運(yùn)行。
混合的AI作法幾乎適用于所有生成式AI應(yīng)用和裝置類型，包括手機(jī)、筆記本電腦、延展實(shí)境頭戴式裝置、汽車和物聯(lián)網(wǎng)。對(duì)于全球生成式AI的擴(kuò)展以及滿足企業(yè)和消費(fèi)者需求而言，這樣的作法相當(dāng)關(guān)鍵。我們堅(jiān)信，混合型就是AI的未來。

（本文作者為高通技術(shù)公司產(chǎn)品管理資深副總裁Ziad Asghar、高通技術(shù)公司工程部門副總裁Jilei Hou）

本文引用地址：http://www.butianyuan.cn/article/202305/447063.htm

新聞中心

混合式AI解鎖生成式AI的未來

評(píng)論

相關(guān)推薦

技術(shù)專區(qū)