機(jī)器學(xué)習(xí)的知識產(chǎn)權(quán)問題
機(jī)器學(xué)習(xí)的知識產(chǎn)權(quán)問題
本文引用地址:http://butianyuan.cn/article/202004/411804.htm假設(shè)一家公司主要生產(chǎn)對于客戶的業(yè)務(wù)運(yùn)營至關(guān)重要的設(shè)備。為了避免發(fā)生故障而對這些客戶產(chǎn)生重大影響,這家公司使用機(jī)器學(xué)習(xí)模型來做出預(yù)防性維護(hù)決策。為了構(gòu)建這種模型,公司花費(fèi)了大量時間、金錢和精力。但是,客戶可以復(fù)制這個知識產(chǎn)權(quán)來自行進(jìn)行維護(hù),這樣就不必繼續(xù)支付維護(hù)合同的費(fèi)用。同時,競爭對手也可能會直接復(fù)制模型來獲取利益,而不是投資構(gòu)建自己的模型。本白皮書探討了機(jī)器學(xué)習(xí)模型的哪些方面將受到知識產(chǎn)權(quán)法律的保護(hù)。
要構(gòu)建用于維護(hù)的機(jī)器學(xué)習(xí)(ML)模型,必須收集并標(biāo)記正確的訓(xùn)練集,選擇正確的架構(gòu)和訓(xùn)練參數(shù)以實現(xiàn)算法精度和速度的優(yōu)化平衡,并投入計算時間來訓(xùn)練模型。但是,如果這個維護(hù)專用的機(jī)器學(xué)習(xí)模型的知識產(chǎn)權(quán)沒有得到妥善保護(hù),競爭對手只需花費(fèi)很少的時間和精力就能復(fù)制和竊取機(jī)器學(xué)習(xí)模型,稍加調(diào)整以免被發(fā)現(xiàn),然后即可直接部署到自己的產(chǎn)品中。這僅僅是一個例子而已。在很多情況中,公司都希望保護(hù)其投資和知識產(chǎn)權(quán),但是現(xiàn)在和將來,應(yīng)該如何保護(hù)機(jī)器學(xué)習(xí)領(lǐng)域的知識產(chǎn)權(quán)呢?
對于任何公司而言,機(jī)器學(xué)習(xí)模型都意味著一筆可觀的投資,同時也是一項寶貴的資產(chǎn)。盡管由機(jī)器學(xué)習(xí)驅(qū)動的業(yè)務(wù)越來越受到青睞,但一些公司可能不愿意在數(shù)據(jù)收集和模型構(gòu)建方面進(jìn)行必要投資,因為他們擔(dān)心競爭對手會竊取勞動果實。一直以來,非實物資產(chǎn)創(chuàng)作方面都有專利或版權(quán)之類的知識產(chǎn)權(quán)保護(hù)。但是,在法律領(lǐng)域中,關(guān)于知識產(chǎn)權(quán)如何保護(hù)機(jī)器學(xué)習(xí)以及具體涵蓋哪些方面,仍然是一個頗具爭議的問題。本白皮書闡述了機(jī)器學(xué)習(xí)知識產(chǎn)權(quán)(IP)方面的法律背景和挑戰(zhàn)。
術(shù)語
在我們深入探討機(jī)器學(xué)習(xí)的知識產(chǎn)權(quán)問題之前,必須先要正確理解術(shù)語。廣義上講,機(jī)器學(xué)習(xí)是針對算法和統(tǒng)計模型的科學(xué)研究。電腦系統(tǒng)使用這些算法和統(tǒng)計模型,依靠模式和推理來高效地執(zhí)行特定任務(wù),而無需使用手動編程的指令。
在機(jī)器學(xué)習(xí)中,通常使用一系列“訓(xùn)練數(shù)據(jù)”推導(dǎo)統(tǒng)計模型的權(quán)重。然后在新情況中運(yùn)用這些權(quán)重,從適用于新情況的模型中獲得答案。一種流行的機(jī)器學(xué)習(xí)模型是神經(jīng)網(wǎng)絡(luò)。為了闡明使用神經(jīng)網(wǎng)絡(luò)的過程,請參考下圖:
用于將圖片標(biāo)記為貓或狗的機(jī)器學(xué)習(xí)模型
這類機(jī)器學(xué)習(xí)分為兩步。首先,在訓(xùn)練階段,推導(dǎo)架構(gòu)參數(shù)以賦予模型特定的功能。我們將這個階段稱為訓(xùn)練模型。模型完成訓(xùn)練后,通過測試數(shù)據(jù)測量模型質(zhì)量。第二步,在推理階段,利用經(jīng)過訓(xùn)練的模型進(jìn)行預(yù)測,例如對新數(shù)據(jù)進(jìn)行分類。雖然所有這些概念在不同文獻(xiàn)中有不同的說法,但在本白皮書中,我們使用以下術(shù)語:
架構(gòu)
神經(jīng)網(wǎng)絡(luò)中的神經(jīng)元、神經(jīng)元之間的連接以及所用激活函數(shù)的集合。架構(gòu)可以有向圖的形式呈現(xiàn)。
訓(xùn)練集
一組用于訓(xùn)練架構(gòu)的數(shù)據(jù),幫助架構(gòu)確定合適的權(quán)重。
測試集
另外一組數(shù)據(jù),用于測試和驗證模型是否提供預(yù)期的結(jié)果。
機(jī)器學(xué)習(xí)系統(tǒng)
實現(xiàn)機(jī)器學(xué)習(xí)(訓(xùn)練和/或推理)的軟件和硬件。
模型
對于神經(jīng)網(wǎng)絡(luò),模型是指與神經(jīng)網(wǎng)絡(luò)架構(gòu)連接相關(guān)聯(lián)的權(quán)重的集合。這些權(quán)重是在訓(xùn)練期間收集的。
訓(xùn)練參數(shù)
用于控制訓(xùn)練算法的參數(shù)。例如:訓(xùn)練集應(yīng)該迭代幾次?在更新權(quán)重之前,要處理多少個數(shù)據(jù)項?在每次更新中,應(yīng)對權(quán)重應(yīng)用多大幅度的更改?使用什么成本函數(shù)進(jìn)行優(yōu)化?
如今,機(jī)器學(xué)習(xí)用于處理各種各樣的任務(wù)。一種主流應(yīng)用是分類,例如識別圖像或視頻中的特定物體,將文本分類為特定類別,以及檢測偽劣品或異常尺寸。
其他應(yīng)用還包括自動駕駛汽車中使用的預(yù)測和物體檢測。對于許多使用機(jī)器學(xué)習(xí)的公司而言,用于機(jī)器學(xué)習(xí)應(yīng)用的訓(xùn)練集和模型是不應(yīng)被競爭對手接觸到的寶貴信息。這就引出了如何通過法律手段保護(hù)這些信息和其他機(jī)器學(xué)習(xí)要素的問題,即知識產(chǎn)權(quán)。
知識產(chǎn)權(quán)
知識產(chǎn)權(quán)(IPR)是指保護(hù)非有形商業(yè)資產(chǎn)免遭第三方盜用的法定權(quán)利。通過法院發(fā)布的法律禁令以及常見的經(jīng)濟(jì)損失賠償和/或侵權(quán)產(chǎn)品沒收處罰,可以制止這一類盜用行為。但是,每種類型的知識產(chǎn)權(quán)都有其特定要求和局限性。在本白皮書中,我們將探討版權(quán)、專利、數(shù)據(jù)庫權(quán)利和商業(yè)秘密。
版權(quán)
版權(quán)是最廣為人知的知識產(chǎn)權(quán)類型。版權(quán)是指禁止復(fù)制和傳播受保護(hù)作品的權(quán)利。這項權(quán)利一直廣泛運(yùn)用于創(chuàng)造藝術(shù)領(lǐng)域,例如音樂、書籍和照片。但是,版權(quán)同樣適用于軟件、手冊、白皮書(甚至是本白皮書?。⒐疽曨l等商業(yè)作品。
這類權(quán)利的相關(guān)法律在世界范圍內(nèi)已經(jīng)達(dá)到非常高的標(biāo)準(zhǔn)化程度。作品在創(chuàng)作后即自動受到保護(hù),無需申請或注冊。甚至不需要版權(quán)聲明,但通常會聲明版權(quán)以震懾潛在的抄襲者。唯一的真實要求是作品中必須存在某種形式的創(chuàng)造性。例如,僅僅列出一串日期不受版權(quán)保護(hù),但巧妙地用句子來表述將受版權(quán)保護(hù)。
版權(quán)的局限性在于只針對實際復(fù)制行為。獨(dú)立再創(chuàng)作同一作品并不算侵犯版權(quán)。再創(chuàng)作的獨(dú)立性可以通過創(chuàng)作過程的相關(guān)記錄或日志進(jìn)行證明。
專利
專利是知識產(chǎn)權(quán)領(lǐng)域的重要組成部分。當(dāng)某項創(chuàng)新受到專利保護(hù)時,任何人都不得制造、使用或出售任何包含該創(chuàng)新的設(shè)備。與版權(quán)不同,專利甚至可以保護(hù)并非通過復(fù)制進(jìn)行的獨(dú)立再創(chuàng)作。專利持有人可以要求他人支付版稅,或者直接終止他人對其創(chuàng)新成果的商業(yè)使用。
專利的主要缺點(diǎn)是必須申請,這會經(jīng)過長達(dá)數(shù)年的漫長審查和高達(dá)數(shù)萬歐元的申請費(fèi)用,并且結(jié)果還不確定。在軟件方面,一個非常復(fù)雜的問題是法律對所謂的“軟件專利”有非常嚴(yán)格的規(guī)定,而這在世界范圍內(nèi)都是令人詬病的問題。因此而出現(xiàn)了非常嚴(yán)格的判例法,從而很難針對大量依賴軟件或自動化的創(chuàng)新執(zhí)行專利權(quán)。
獲得軟件專利的基本準(zhǔn)則是發(fā)明必須提供真實世界中的改進(jìn),而不能僅僅是提高軟件性能。例如,壓縮算法通常被認(rèn)為是專利技術(shù),內(nèi)存效率更高的矩陣乘法技術(shù)也算專利。但是用于準(zhǔn)確預(yù)測下一屆足球世界杯冠軍的算法則不符合申請專利的條件。
數(shù)據(jù)庫權(quán)利
數(shù)據(jù)庫權(quán)利是知識產(chǎn)權(quán)領(lǐng)域中一個相對較新的概念。數(shù)據(jù)庫權(quán)利于上世紀(jì)九十年代末在歐洲提出,旨在保護(hù)信息集合,防止被復(fù)制和重復(fù)使用。數(shù)據(jù)庫權(quán)利的主要要求是在創(chuàng)建或維護(hù)數(shù)據(jù)庫中的數(shù)據(jù)方面進(jìn)行了大量投資。與版權(quán)一樣,數(shù)據(jù)庫權(quán)利無需進(jìn)行正式注冊或申請。
受保護(hù)數(shù)據(jù)庫包括在線詞典、帶標(biāo)記的圖像集合和地圖制圖的源數(shù)據(jù)。關(guān)鍵在于以某種便于搜索和瀏覽的方式組織數(shù)據(jù)。
數(shù)據(jù)庫權(quán)利的復(fù)雜之處在于,該項權(quán)利在歐盟以外的地區(qū)不受認(rèn)可。特別是在擁有著悠久法律傳統(tǒng)的美國,數(shù)據(jù)集合不受知識產(chǎn)權(quán)保護(hù),只有創(chuàng)意作品才能受到版權(quán)保護(hù)。
商業(yè)機(jī)密
在知識產(chǎn)權(quán)世界中,商業(yè)機(jī)密的現(xiàn)狀在全球范圍內(nèi)不一而同。但總體而言,可以通過法律針對盜用受良好保護(hù)信息的行為采取行動。這要求此類信息的所有者表明已采取適當(dāng)?shù)陌踩胧﹣矸乐刮唇?jīng)授權(quán)的訪問。同時,竊取商業(yè)秘密的“嫌疑人”可以通過證明該信息已經(jīng)在公共領(lǐng)域中披露進(jìn)行反駁。
公司通常會通過與客戶或其他第三方簽署保密協(xié)議(NDA)來保護(hù)其商業(yè)機(jī)密。在某些支持違約罰款或其他法律措施的司法管轄區(qū)中,可通過嚴(yán)格的契約義務(wù)禁止復(fù)制或復(fù)用。其他協(xié)議中也可能包含NDA條款。但是,即使使用反向工程等特殊技術(shù),從合法購買產(chǎn)品中挖掘機(jī)密數(shù)據(jù)的個人也不受此類條款的約束。這就限制了商業(yè)機(jī)密法的作用。
面向機(jī)器學(xué)習(xí)的知識產(chǎn)權(quán)保護(hù)
競爭對手或其他意圖不軌的實體會通過多種方法,企圖從機(jī)器學(xué)習(xí)系統(tǒng)創(chuàng)造者的成果或投資中分一杯羹。機(jī)器學(xué)習(xí)的獨(dú)特性引起這樣一個問題:如何利用知識產(chǎn)權(quán)法律保護(hù)這項新技術(shù)的各個方面。
訓(xùn)練集保護(hù)
為特定的機(jī)器學(xué)習(xí)應(yīng)用創(chuàng)建出色的訓(xùn)練集是一項耗時耗財?shù)墓ぷ?。盡管在典型環(huán)境中,侵權(quán)人無法直接訪問此訓(xùn)練集,但是如果通過某些方式獲得了訪問權(quán)限,那么復(fù)制訓(xùn)練集輕而易舉。知識產(chǎn)權(quán)法律的作用正在于此。
如果訓(xùn)練集所有者的主要營業(yè)地點(diǎn)位于歐盟地區(qū),那么訓(xùn)練集將受到 數(shù)據(jù)庫權(quán)利的保護(hù)。但是,這一權(quán)利僅對同樣位于該司法管轄區(qū)的侵權(quán)者具有法律效力。
而更加困難的是能否針對機(jī)器學(xué)習(xí)訓(xùn)練集主張版權(quán)。訓(xùn)練集并不是一件藝術(shù)作品。其目的通常是確保數(shù)據(jù)適合用例。根據(jù)版權(quán)法的規(guī)定,針對主題創(chuàng)建合適的數(shù)據(jù)集并不是一項創(chuàng)造性活動。但是,仍然可以主張版權(quán)的一個方面是對數(shù)據(jù)進(jìn)行分類的方式。如果類別是通過創(chuàng)造性過程(例如,“美麗/丑陋”、“強(qiáng)/弱”、“大/小”)進(jìn)行篩選的,那么就可以認(rèn)為通過創(chuàng)造性標(biāo)記方式創(chuàng)造的訓(xùn)練集受到版權(quán)保護(hù)?;谑聦嵰兀ɡ纭柏?狗”、“交通信號燈/路燈/停車標(biāo)志”)的分類不具備創(chuàng)造性,因此不受版權(quán)保護(hù)。
在某些應(yīng)用領(lǐng)域,訓(xùn)練集是通過模擬或其他人工手段生成的。有另一種觀點(diǎn)認(rèn)為,這樣的訓(xùn)練集可以受到版權(quán)保護(hù),因為所選的模擬或生成方式可以看作是一種創(chuàng)造性選擇。但是,這一觀點(diǎn)從未在法庭上得到檢驗。
通常,公司會對其訓(xùn)練集嚴(yán)格保密。這種做法十分合理,因為使用機(jī)器學(xué)習(xí)模型無需共享訓(xùn)練集。避免訓(xùn)練集被惡意復(fù)制,并對需要擁有訓(xùn)練集的各方施加嚴(yán)格的契約約束似乎是最好的方法。
訓(xùn)練參數(shù)保護(hù)
訓(xùn)練集和模型只是機(jī)器學(xué)習(xí)系統(tǒng)寶貴價值的一部分。驅(qū)動訓(xùn)練算法的參數(shù)也同樣十分寶貴:選擇正確的訓(xùn)練參數(shù)需要經(jīng)驗豐富的工程師花費(fèi)大量時間和精力。
對于創(chuàng)建機(jī)器學(xué)習(xí)系統(tǒng)所用的訓(xùn)練參數(shù)集,版權(quán)保護(hù)是最有用的。如果數(shù)據(jù)科學(xué)家通過創(chuàng)造性工作來選擇合適的訓(xùn)練參數(shù),從而確定這些參數(shù),那么最終得到的參數(shù)集就很有可能受到版權(quán)保護(hù)。但是,如果是通過詳盡搜索(例如評估文獻(xiàn)中提出的許多選項)或算法過程發(fā)現(xiàn)的訓(xùn)練參數(shù),則不受版權(quán)保護(hù)。這一原則同樣適用于使用這些訓(xùn)練參數(shù)和指定訓(xùn)練集生成的模型。
數(shù)據(jù)庫權(quán)利可能不太適用于參數(shù)集,因為數(shù)據(jù)庫權(quán)利的一個標(biāo)準(zhǔn)是集合中的各個元素必須系統(tǒng)地或有條理地排列。參數(shù)集很難符合這個標(biāo)準(zhǔn)。
架構(gòu)保護(hù)
系統(tǒng)架構(gòu)是機(jī)器學(xué)習(xí)系統(tǒng)的基礎(chǔ)。其設(shè)計是確保系統(tǒng)正常運(yùn)行的關(guān)鍵要素。在完成訓(xùn)練后,架構(gòu)就將投入使用。
這類系統(tǒng)包含兩部分:定義架構(gòu)的圖形和實現(xiàn)架構(gòu)的軟件。圖形符合保護(hù)的條件與模型參數(shù)相同。從理論上講,架構(gòu)的創(chuàng)新硬件層面可以申請專利;但是由于這一領(lǐng)域的大多數(shù)創(chuàng)新基本只與軟件有關(guān),因此硬件專利不太現(xiàn)實。實施訓(xùn)練和/或推理的軟件通常會受到版權(quán)保護(hù),因為軟件主要是通過創(chuàng)造性工作設(shè)計而成的。
機(jī)器學(xué)習(xí)系統(tǒng)保護(hù)
理論上,使用精心選擇的參數(shù)集編程并基于特定訓(xùn)練集訓(xùn)練的電腦系統(tǒng)屬于可獲專利的主題范圍。但是,歐洲和美國的現(xiàn)行判例法要求系統(tǒng)的設(shè)計目標(biāo)是執(zhí)行現(xiàn)實世界中的任務(wù),例如駕駛汽車或識別現(xiàn)實世界中的圖像。對于以更抽象的方式運(yùn)行的機(jī)器學(xué)習(xí)系統(tǒng)(例如,在現(xiàn)實世界中缺少特定用例的情況下,進(jìn)行識別和/或分類),能否獲得專利仍未可知。
就像任何其他軟件一樣,機(jī)器學(xué)習(xí)系統(tǒng)的軟件一定可以受到版權(quán)保護(hù)。
機(jī)器學(xué)習(xí)系統(tǒng)的數(shù)據(jù)庫權(quán)利在理論上是有爭議的:爭議點(diǎn)在于數(shù)據(jù)集可通過模型和執(zhí)行該模型的軟件進(jìn)行搜索。但是,這一觀點(diǎn)從未在法庭上或法律文獻(xiàn)中得到檢驗。
舉證責(zé)任
發(fā)現(xiàn)侵權(quán)者和在法庭上證明侵權(quán)是兩件截然不同的事情。在知識產(chǎn)權(quán)訴訟案件中,舉證責(zé)任可能難以實現(xiàn)。一般而言,法院需要得到充分的證據(jù)來確信很有可能存在侵權(quán)。被指控的侵權(quán)人沒有義務(wù)提供相關(guān)證據(jù)。因此,如果需要的證據(jù)在侵權(quán)人的掌握之下,那么知識產(chǎn)權(quán)權(quán)利所有者就可能會遇到問題。一些司法管轄區(qū)允許扣押證據(jù)或要求當(dāng)事方進(jìn)行所謂的“透露”,但這并不能確保權(quán)利所有者得到所需證據(jù)。
根據(jù)版權(quán)法的規(guī)定,如果兩個物品非常相似,那么法院可以反轉(zhuǎn)舉證責(zé)任:侵權(quán)人必須證明其作品是獨(dú)立創(chuàng)作的。但是,這是法院針對特定事實分析的結(jié)果,權(quán)利所有者不應(yīng)依賴于這一機(jī)制。
根據(jù)商業(yè)機(jī)密法的規(guī)定,權(quán)利所有者有時可以選擇要求法院對證據(jù)保密,或者讓獨(dú)立的一方(例如公證人)將證據(jù)與機(jī)密信息進(jìn)行比較,而不必使機(jī)密成為公開法院記錄的一部分。
模型防復(fù)制保護(hù)
當(dāng)機(jī)器學(xué)習(xí)系統(tǒng)在對公眾沒有契約或使用限制的情況下推出時,就可以使用某種獨(dú)特的方法來復(fù)制其功能。本質(zhì)上,抄襲者使用一個未分類項目數(shù)據(jù)集,并將每個項目提交到機(jī)器學(xué)習(xí)系統(tǒng)。每個答案都仔細(xì)地記錄為抄襲者的數(shù)據(jù)集分類。從而獲得一個帶有標(biāo)簽的數(shù)據(jù)集,用來訓(xùn)練相似質(zhì)量的模型。事實證明,即使數(shù)據(jù)集包含非問題域數(shù)據(jù),并且目標(biāo)系統(tǒng)和克隆系統(tǒng)的架構(gòu)與模型參數(shù)不匹配,這一方法仍然有效。根據(jù)版權(quán)或數(shù)據(jù)庫法律的規(guī)定,暫時無法界定這種行為是否合法。原始機(jī)器學(xué)習(xí)系統(tǒng)中的數(shù)據(jù)集未被復(fù)制;只是利用了系統(tǒng)輸出,而且只用來標(biāo)記另一個數(shù)據(jù)集。
如果數(shù)據(jù)集分類本身具有創(chuàng)造性,那么抄襲者可能會因為重復(fù)使用標(biāo)簽而侵犯版權(quán)。即使只是復(fù)制和復(fù)用標(biāo)簽以對完全獨(dú)立的數(shù)據(jù)集進(jìn)行分類,也有可能侵犯版權(quán)。但是,這一觀點(diǎn)從未在法庭上得到檢驗。
機(jī)器學(xué)習(xí)中的水印
知識產(chǎn)權(quán)法律的一個實際問題是權(quán)利所有者必須證明其權(quán)利受到侵犯。
當(dāng)機(jī)器學(xué)習(xí)模型或訓(xùn)練集遭到復(fù)制時,證明侵權(quán)會異常困難,尤其是數(shù)據(jù)涉及現(xiàn)實世界的元素時。抄襲者可以輕松地辯稱,他只不過是從原始來源或位置收集了相同或高度相似的數(shù)據(jù)而已。如果沒有辦法反駁這一論點(diǎn),權(quán)利所有者就會遭到冷落。
水印是指在內(nèi)容中嵌入信息的過程,在正常觀察時可能無法輕易發(fā)現(xiàn)嵌入的信息。數(shù)字水印誕生于1992年12月,自90年代末以來一直為權(quán)利所有者廣泛運(yùn)用,以察覺和追蹤可能發(fā)生的電影和歌曲泄漏。例如,嵌入的信息可以揭露泄漏源頭,或是最初傳播該內(nèi)容的網(wǎng)絡(luò)。
水印在機(jī)器學(xué)習(xí)中也找到了用武之地,但是運(yùn)用方式略有不同。這里的水印是指對原始訓(xùn)練數(shù)據(jù)和/或模型稍作修改以創(chuàng)建某些唯一的模型屬性。例如,可以修改圖像以在特定位置添加標(biāo)志。要檢測這些水印,需要向機(jī)器學(xué)習(xí)系統(tǒng)提供精心制作的秘密圖像,其中包含相同的唯一輸入。獨(dú)立訓(xùn)練的系統(tǒng)會將該圖像歸為普通類別,但是最初訓(xùn)練的系統(tǒng)以及抄襲帶水印機(jī)器學(xué)習(xí)系統(tǒng)的系統(tǒng)都將提供由修改觸發(fā)的唯一輸出。這就可以表明該系統(tǒng)抄襲了原始系統(tǒng)。
這種方法的另一個優(yōu)勢是,水印可以用作創(chuàng)意元素,從而為機(jī)器學(xué)習(xí)系統(tǒng)增加了受版權(quán)保護(hù)的信息。這有助于加強(qiáng)針對抄襲者的版權(quán)主張。
襲者可能會反駁他獨(dú)立使用了相同的水印,或者實際上是自己創(chuàng)建的水印。這樣將扭轉(zhuǎn)關(guān)于抄襲的指控。為了解決此類爭論,必須清晰地記錄選擇和插入水印時的日期和時間。如果沒有有力的證據(jù),版權(quán)所有者將無法提出侵權(quán)主張。
機(jī)器學(xué)習(xí)和知識產(chǎn)權(quán)的未來
由機(jī)器學(xué)習(xí)驅(qū)動的業(yè)務(wù)越來越受到青睞。因此,為了保護(hù)該領(lǐng)域中的投資,對于知識產(chǎn)權(quán)的興趣也在日益增加:從訓(xùn)練集的版權(quán)到分類系統(tǒng)的專利。但是,當(dāng)前這一領(lǐng)域的知識產(chǎn)權(quán)法律和實踐仍處于發(fā)展階段,判例法也非常稀少。因此很難確定面向機(jī)器學(xué)習(xí)系統(tǒng)和機(jī)器學(xué)習(xí)驅(qū)動型產(chǎn)品的法律保護(hù)將發(fā)展到何種程度。
話雖如此,但仍有一些通用說明可供參考,如下表所示:
知識產(chǎn)權(quán)(IPR) | ||||
專利 | 版權(quán) | 數(shù)據(jù)庫權(quán)利 | 商業(yè)機(jī)密 | |
保護(hù) | 技術(shù)創(chuàng)新 | 創(chuàng)意表達(dá)(即不僅僅是辛勤的工作或投資) | 創(chuàng)造集合方面的實質(zhì)性投入 | 信息保密 (例如,通過NDA) |
司法 管轄區(qū) | 全球 | 所有者和侵權(quán)者必須在歐盟境內(nèi) | 全球 | |
受保護(hù)對象 | ||||
架構(gòu) | 否, 但是請參閱下方的軟件 | 對于底層圖形來說不太可能,除非選擇方式具有創(chuàng)造性 | 否 | 是 |
訓(xùn)練集 和 測試集 | 否, 創(chuàng)造性標(biāo)簽或創(chuàng)造性挑選的數(shù)據(jù)集除外 | |||
訓(xùn)練參數(shù) | 不可能, 除非選擇方式具有創(chuàng)造性 | |||
模型 | 不可能 | 不可能, 除非水印、標(biāo)簽、參數(shù)或架構(gòu)選擇方面存在創(chuàng)造性 | 不可能 | |
實現(xiàn)機(jī)器學(xué)習(xí)功能的軟件 | 是, 作為經(jīng)過訓(xùn)練的模型系統(tǒng)的一部分,并且僅針對現(xiàn)實世界中的任務(wù) | 是, 但是實現(xiàn)的功能不受保護(hù) | 否 |
結(jié)論
在本白皮書中,我們闡述了未來哪些機(jī)器學(xué)習(xí)知識產(chǎn)權(quán)將受到哪些知識產(chǎn)權(quán)法律的保護(hù)。那么對于本文開篇的資本設(shè)備示例而言,這意味著什么呢?盡管用于維護(hù)的機(jī)器學(xué)習(xí)模型本身無法獲得專利,但是這一模型的實施可能是符合專利要求的,因為其目的是執(zhí)行現(xiàn)實世界中的任務(wù)。此外,還可以對實現(xiàn)機(jī)器學(xué)習(xí)算法的軟件提出版權(quán)主張。但是,如果抄襲者僅僅是復(fù)制模型(權(quán)重)并在自己的實現(xiàn)中使用,或者如果通過標(biāo)記自己的訓(xùn)練集來創(chuàng)建克隆模型,那么能否進(jìn)行版權(quán)保護(hù)就難以確定。開發(fā)人員必須證明在架構(gòu)設(shè)計、訓(xùn)練參數(shù)、訓(xùn)練集組成或數(shù)據(jù)標(biāo)記方面做出了創(chuàng)造性選擇,并且這些選擇不僅僅是出于技術(shù)考慮。即使能證明這一點(diǎn),也無法確定這種創(chuàng)造性是否充分地存在于模型的克隆/副本中,從而在法庭上得到認(rèn)可。因此,制定應(yīng)對策略來防止克隆或復(fù)制(例如平臺安全)或者融入創(chuàng)造性(例如水印)對于機(jī)器學(xué)習(xí)知識產(chǎn)權(quán)的保護(hù)來說至關(guān)重要。最后,我們要指出,在法庭沒有判例之前,侵權(quán)案件的審判結(jié)果以及法律是否將在這些問題上作出改變只能是推測。盡管如此,公司現(xiàn)在也應(yīng)該開始考慮如何保護(hù)其機(jī)器學(xué)習(xí)知識產(chǎn)權(quán)。
恩智浦半導(dǎo)體致力于通過先進(jìn)的解決方案為人們更智慧安全、便捷的生活保駕護(hù)航。作為全球領(lǐng)先的嵌入式應(yīng)用安全連結(jié)解決方案領(lǐng)導(dǎo)者,恩智浦不斷推動著安全互聯(lián)汽車、工業(yè)與物聯(lián)網(wǎng)、移動設(shè)備及通信基礎(chǔ)設(shè)施市場的創(chuàng)新。除了嵌入式平臺安全之外,恩智浦還提供機(jī)器學(xué)習(xí)模型保護(hù)功能。
機(jī)器學(xué)習(xí)模型完成訓(xùn)練后,將被部署到指定用途的系統(tǒng)中。借助恩智浦? eIQ?機(jī)器學(xué)習(xí)軟件開發(fā)環(huán)境,您就可以在恩智浦i.MX RT交叉處理器和i.MX系列SoC上使用機(jī)器學(xué)習(xí)算法。eIQ?提供推理引擎、神經(jīng)網(wǎng)絡(luò)編譯器和優(yōu)化庫。其中還包含提高機(jī)器學(xué)習(xí)網(wǎng)絡(luò)安全性的方法,能夠解決本文所述的克隆和對抗攻擊等問題。其他機(jī)器學(xué)習(xí)安全措施也已納入發(fā)展計劃。
評論