揭秘阿里打假AI大腦：數據總量186個國家圖書館，1 AI=50000人類，獲創(chuàng)新大獎

作者：李根時間：2019-08-15 來源：量子位

加入技術交流群
- 掃碼加入
  和技術大咖面對面交流
  海量資料庫查詢

另一項體現場景挑戰(zhàn)和技術水平的是安全場景特有的對抗性問題。

本文引用地址：http://butianyuan.cn/article/201908/403730.htm

售假賣家往往會通過改變“標題”和“描述”以躲避傳統(tǒng)規(guī)則和模型的識別，但這并非完全無跡可尋。

混淆語言是一種被用于在對抗交流場景下實現規(guī)避檢測的技術手段。

對抗交流場景包括敏感信息傳播、負面情感表達、秘密行動策劃以及違法交易等?；煜Z言的實現方式通常是在原始文本里進行變異詞的替換。

監(jiān)管機構在識別此類文本時，需要根據一組關鍵詞進行掃描過濾。盡管引入了一些語義擴展技術，但是由于文本中的歧義性以及變異的無邊界，導致識別此類文本的準確率和召回率都十分有限。

阿里在WWW 2019上發(fā)表的論文，集中披露了該方向上的核心進展。

該論文的主要思路是將混淆語言識別轉化為一個文本匹配任務，即每條待檢測信息，是否匹配一個掃描關鍵詞，并且同時整合了文本信息的文本表示和視覺表示。

這里的視覺表示指的是文字自身的視覺效果，而不是信息中的圖片，主要是因為在進行文本變異混淆時，經常會出用一些看起來像的字符進行替換，這種變異導致了混淆后的內容在語義上可能已經跟原始內容沒有任何關聯，但是從視覺效果上卻可以產生聯系。

阿里的模型利用BiLSTM對文本特征進行表示，通過基于模板匹配的方式對視覺特征進行表示，通過多模態(tài)的整合，可以比傳統(tǒng)方法表現出更高的準確率和召回率。

另外就是結合圖像視頻和自然語言處理的多模態(tài)任務解決方法。

論文發(fā)表于ICASSP 2019，其中列舉的任務也頗有意思：通過一段文本描述，自動地編輯源圖像使其符合給出的文本描述，從而簡化圖像編輯流程，是一種基于文本的圖像編輯方法。電商網站中的商品本身就是文字與圖片的混合內容，因此可以期待這項技術可以加強對商品內涵的理解，更有助于發(fā)現假、劣商品。

感興趣的盆友可移步傳送門：http://arxiv.org/abs/1903.07499

最后再介紹一項業(yè)內sexy，且對打假AI貢獻不小的技術進展：小樣本學習。

假貨問題（安全問題）中最頭疼的點，莫過于對新出現的風險缺乏足夠訓練的樣本，導致諸多優(yōu)秀機器學習算法望而卻步。

在CVPR 2018上，阿里安全圖靈實驗室團隊，圍繞業(yè)內前沿的“零樣本視頻檢索”挑戰(zhàn)，給出解決方案。

視頻檢索，通常要在文本和視頻之間提取跨模態(tài)相關性，需要基于內容匹配。

但阿里的方法之不同，在于提出了一種內容無關的方法，通過雙重深度編碼網絡來將視頻和文本編碼為各自模態(tài)的密集式表征。

并且雙重編碼概念簡單、切實有效，還可以端到端學習。

在三個基準數據集MSR-VTT、TRECVID2016、2017上實驗后，證明阿里提出的零樣本視頻檢索方法已達到目前最佳。

論文傳送門：http://arxiv.org/abs/1809.06181

就在最近的機器學習頂會IJCAI-2019上，阿里安全成功舉辦了第一屆AAAC競賽（Alibaba Adversarial AI Challenge）以及AIBS研討會（Artificial Intelligence for Business Security），旨在探索面臨對抗攻擊時，如何解決AI模型的安全性問題。競賽和會議吸引了來自24個國家和地區(qū)的2000多支隊伍參與，過程中涌現出不少新思路和新方法，極大地推動了這一領域的發(fā)展。

“AI發(fā)展趨勢是一定的，但AI應用來解決安全問題時并不能生搬硬套，需要根據實際場景進行AI的技術升級，”薛暉在今年年初的公開采訪中就指出，安全會成為未來AI開發(fā)的最大挑戰(zhàn)， “安全AI”會成為未來網絡安全問題的新解法，也將在2019年迎來爆發(fā)期。

如今阿里“知產保護科技大腦”的成功實踐不斷得到行業(yè)乃至全球的認可，正印證了這一斷言。

阿里打假AI，用技術解決社會問題

打假AI大腦成功，幕后原因并不難分析。這也會是阿里各項業(yè)務在AI時代里還會更繁榮的保證。