走過近30年，這個(gè)用邏輯程序表示數(shù)據(jù)的ML算法值得深入了解

發(fā)布人：機(jī)器之心時(shí)間：2020-09-19 來源：工程師

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫查詢

歸納邏輯程序設(shè)計(jì)已「走過」近 30 年的歷程?；仡欉@ 30 年來的發(fā)展軌跡，似乎很少有人提起這種算法，我們用到更多是深度學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)等熱門算法。其實(shí)作為一門相對(duì)冷門的算法，歸納邏輯程序設(shè)計(jì)卻在某些方面優(yōu)于 ML。在這種算法即將迎來 30 周年之際，來自牛津大學(xué)與魯汶大學(xué)的研究者用一篇超長(zhǎng)論文詳細(xì)解讀了歸納邏輯程序設(shè)計(jì)的相關(guān)內(nèi)容。

歸納邏輯程序設(shè)計(jì)（Inductive Logic Programming, ILP）是機(jī)器學(xué)習(xí)的一種形式。與基于統(tǒng)計(jì)的機(jī)器學(xué)習(xí)類似，ILP 也是需要給定一些例子作為訓(xùn)練樣本。所不同的是，基于統(tǒng)計(jì)的機(jī)器學(xué)習(xí)輸出的是一個(gè)統(tǒng)計(jì)學(xué)的分類模型，而 ILP 輸出的是一個(gè)邏輯程序。

近日，來自牛津大學(xué)與魯汶大學(xué)的研究者發(fā)表了一篇論文，該論文介紹了必要的邏輯符號(hào)和主要的 ILP 學(xué)習(xí)設(shè)置。此外還介紹了 ILP 系統(tǒng)的主要組成部分。他們?cè)趲追N維度上比較了幾個(gè) ILP 系統(tǒng)，并詳細(xì)介紹了 Aleph、TILDE、ASPAL 和 Metagol 等四個(gè)系統(tǒng)。最后，研究者還將 ILP 與其他形式的機(jī)器學(xué)習(xí)進(jìn)行對(duì)比，并總結(jié)了 ILP 當(dāng)前的局限性以及未來研究的新方向。

論文地址：https://arxiv.org/pdf/2008.07912.pdf

因?yàn)樵撜撐妮^長(zhǎng)且還在完善的過程中，本文就先摘取了其中的核心內(nèi)容進(jìn)行介紹。

我們首先來了解下論文的核心結(jié)構(gòu)，該論文主要由以下 9 個(gè)部分組成：

· ILP 發(fā)展史（第 1 節(jié)）；

· 描述 ILP 必要的邏輯程序設(shè)計(jì)符號(hào)（第 2 節(jié)）；

· 定義了標(biāo)準(zhǔn)的 ILP 學(xué)習(xí)設(shè)置（從蘊(yùn)含中學(xué)習(xí)、從解釋中學(xué)習(xí)和從滿足性中學(xué)習(xí)）（第 3 節(jié)）；

· 描述構(gòu)建 ILP 系統(tǒng)所需的基本假設(shè)（第 4 節(jié)）；

· 比較了多個(gè) ILP 系統(tǒng)并描述了它們所支持的特征（第 5 節(jié)）；

· 描述了四個(gè) ILP 系統(tǒng)（Aleph、TILDE、ASPAL、和 Metagol）（第 6 節(jié)）；

· 描述了 ILP 應(yīng)用層面（第 7 節(jié)）；

· 將 ILP 與其他形式的 ML 進(jìn)行比較（第 8 節(jié)）；

· 概述未來的研究方向（第 9 節(jié)）。

以下內(nèi)容將重點(diǎn)介紹 ILP 的基礎(chǔ)知識(shí)、選擇 ILP 的理由以及 ILP 的工作方式。

ILP 簡(jiǎn)介

人類智慧的一項(xiàng)非凡成就是擁有學(xué)習(xí)新知識(shí)的能力。歸納法就是一種主要的學(xué)習(xí)類型：從特定觀察（示例）形成通用規(guī)則（假設(shè)）的過程。例如，假設(shè)你從一個(gè)袋子中抽出 10 個(gè)紅色的球，那么你可能會(huì)得出一個(gè)假設(shè)（一個(gè)規(guī)則），即袋子中的所有球都是紅色的。得出此假設(shè)后，你就可以預(yù)測(cè)出袋子中下一個(gè)球的顏色。

機(jī)器學(xué)習(xí)（ML）的目標(biāo)是自動(dòng)化歸納過程。換句話說，機(jī)器學(xué)習(xí)的目標(biāo)是產(chǎn)生一個(gè)能夠泛化訓(xùn)練示例（觀察）的假設(shè)（也稱為模型）。例如，給定帶有標(biāo)簽的貓和狗的圖像，目標(biāo)則是得出一個(gè)預(yù)測(cè)未標(biāo)記圖像是貓還是狗的假設(shè)。

ILP 是 ML 的一種形式。與其他形式的 ML 一樣，ILP 的目標(biāo)是得出一個(gè)可以泛化訓(xùn)練示例的假設(shè)。雖然大多數(shù)形式的 ML 使用表格來表示數(shù)據(jù)（示例和假設(shè)），但 ILP 使用邏輯程序（邏輯規(guī)則集）來表示數(shù)據(jù)。

下表 1 說明使用 ML 與 ILP 的區(qū)別所在：

大多數(shù)形式的 ML 采用標(biāo)準(zhǔn)表格表示來描述 ML 任務(wù)。

ILP 使用邏輯程序來表示數(shù)據(jù)，由三個(gè)集合組成 (B，E+， E-)，其中 B 集合表示背景知識(shí) (BK)，其與特征類似，但可以包含與示例間接關(guān)聯(lián)的關(guān)系和信息；E + 和 E - 分別表示正面例子與負(fù)面例子。

為什么選擇 ILP

ILP 與大多數(shù) ML 方法的根本不同在于，大多數(shù)機(jī)器學(xué)習(xí)方法，如支持向量機(jī)和神經(jīng)網(wǎng)絡(luò)，都依賴于統(tǒng)計(jì)推理。相比之下，ILP 依賴邏輯推理。下表 2 展示了 ILP 和統(tǒng)計(jì) ML 方法之間的不同之處：

由上表可以得出，ML 與 ILP 的主要區(qū)別表現(xiàn)在用例、數(shù)據(jù)、假設(shè)、泛化、可解釋性和知識(shí)遷移 6 個(gè)方面：

· 用例方面：眾所周知，許多形式的 ML 都非常需要數(shù)據(jù)。相比之下，ILP 系統(tǒng)可以基于少量示例進(jìn)行歸納，通常是從單個(gè)示例就能歸納；

· 數(shù)據(jù)方面：與大多數(shù) ML 形式相反，ILP 使用表示為邏輯程序的 BK 進(jìn)行學(xué)習(xí)。使用邏輯程序表示數(shù)據(jù)可以使 ILP 學(xué)習(xí)復(fù)雜的關(guān)系信息，并可以輕松集成專家知識(shí)；

· 假設(shè)：使用邏輯程序表示假設(shè)有很多好處。因?yàn)樗鼈兣c關(guān)系數(shù)據(jù)庫密切相關(guān)，所以邏輯程序自然支持關(guān)系數(shù)據(jù)，例如圖表；

· 泛化能力：ILP 得出的歸納假設(shè)超出了訓(xùn)練數(shù)據(jù)的范圍。相比之下，許多其他形式的 ML 因無法從少量訓(xùn)練示例中進(jìn)行歸納而名聲不佳（尤其是深度學(xué)習(xí)）；

· 可解釋性：由于邏輯與自然語言的相似性，因此人類可以輕松閱讀邏輯程序，這對(duì)于可解釋的 AI 和超強(qiáng)的 ML 至關(guān)重要；

· 知識(shí)遷移：大多數(shù)機(jī)器學(xué)習(xí)算法都是單任務(wù)學(xué)習(xí)，無法重用學(xué)到的知識(shí)。相比之下，由于 ILP 具有符號(hào)表示，它自然支持終身學(xué)習(xí)和遷移學(xué)習(xí)，對(duì)于 AI 來說至關(guān)重要。

ILP 工作方式

ILP 問題通常由三個(gè)集合構(gòu)成：B（背景知識(shí)）、E+（正面例子）和 E-（負(fù)面例子）。ILP 問題是誘導(dǎo)一個(gè)假設(shè) H，其中用 B 來解釋 E + 和 E-。

ILP 主要有三種學(xué)習(xí)設(shè)置：從蘊(yùn)含中學(xué)習(xí)（learning from entailment, LFE）、從解釋行中學(xué)習(xí)（learning from interpretation, LFI）和從可滿足性中學(xué)習(xí)（learning from satisfiability, LFS）。LFE 和 LFI 是目前最流行的學(xué)習(xí)設(shè)置，所以這里著重討論這兩種。

從蘊(yùn)含中學(xué)習(xí)（LFE）

定義 1：對(duì)于給定一個(gè)元組 (B， E + , E ? )：

LFE 的目標(biāo)是返回一個(gè)假設(shè) H，使得：

可以從以下示例中獲得直觀感受，考慮從蘊(yùn)含元組學(xué)習(xí)：

同時(shí)假定存在假設(shè)空間：

那么可以考慮 ILP 系統(tǒng)應(yīng)該返回哪些假設(shè)：

根據(jù)定義 1，一個(gè)假設(shè)必須包含每一個(gè)正面示例（完整的）而不需要負(fù)面示例（一致的）。然而，訓(xùn)練示例往往是混雜的，所以很難找到一個(gè)既完整又一致的假設(shè)。因此，大多數(shù)方法都放寬了這一定義，并試圖找到一個(gè)包含盡可能多的正面示例和盡可能少的負(fù)面示例的假設(shè)。

從解釋中學(xué)習(xí)（LFI）

第二受歡迎的學(xué)習(xí)設(shè)置是 LFI。

定義 2（從解釋中學(xué)習(xí)）：給定元組（B，E+，E?），其中：

LFI 的目標(biāo)是返回一個(gè)假設(shè) H，使得：

示例 2，為了說明 LFI，該論文重用 Law（2018）的示例。考慮以下輸入元組：

同時(shí)假定存在有假設(shè)空間：

要找到一個(gè)解決 LFI 問題（定義 2）的假設(shè) H，必須首先對(duì)每個(gè)示例計(jì)算 B 的最小模型，即：

問題是要找到一個(gè)假設(shè) H，使 M_1 和 M_1 都是 H 的模型，而 M_3 不是。假設(shè) h_1 不是解，因?yàn)?M_1 不是 B∪h_1 的模型；假設(shè) h_1 不是解，因?yàn)?M_1 不是 B∪h_2 的模型；假設(shè) h_3 是一個(gè)解，因?yàn)?M_1 和 M_2 都是 B∪h_3 的模型而 M_# 不是 B∪h_3 的模型。

總體而言，ILP 相關(guān)設(shè)計(jì)架構(gòu)如下：正面示例 + 負(fù)面示例 + 背景知識(shí)?假設(shè)。ILP 所學(xué)模型基于一階邏輯符號(hào)規(guī)則，而非難以理解的黑箱模型。學(xué)習(xí)得到的模型可基于個(gè)體間的關(guān)系建模，而非只對(duì)個(gè)體的標(biāo)記進(jìn)行預(yù)測(cè)。如果你想了解更多細(xì)節(jié)內(nèi)容，請(qǐng)參考該論文。

參考鏈接：https://hyper.ai/wiki/4863

*博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布，僅代表博主個(gè)人觀點(diǎn)，如有侵權(quán)請(qǐng)聯(lián)系工作人員刪除。

博客專欄

走過近30年，這個(gè)用邏輯程序表示數(shù)據(jù)的ML算法值得深入了解

相關(guān)推薦

焦點(diǎn)

推薦視頻

技術(shù)專區(qū)