不要上手就學(xué)深度學(xué)習(xí)!超詳細(xì)的人工智能專家路線圖,GitHub數(shù)天獲2.1k星
來源:機器之心
想從事人工智能領(lǐng)域的研究,盲目地在網(wǎng)上購買了一本又一本的參考資料,學(xué)習(xí)視頻刷了一遍又一遍…… 反過頭來看,這些方法可能作用并不是很大,卻消耗了大量的時間和金錢。
這時,一種提綱式的學(xué)習(xí)途徑就顯得尤為重要了。如果你想成為數(shù)據(jù)科學(xué)家、機器學(xué)習(xí)或者 AI 專家,而又苦于找不到合適的學(xué)習(xí)方法,本文將提供一組思路清晰、簡單易懂的人工智能專家路線圖。
這是一家德國軟件公司 AMAI GmbH 近期發(fā)布的 GitHub 項目——AI 專家路線圖(AI-Expert-Roadmap)。該路線圖幾乎涵蓋了 AI 領(lǐng)域所有的知識點,并且每個知識點都有詳細(xì)的文檔。有了這個路線圖的指導(dǎo),或許能幫助你快速入門乃至成為 AI 領(lǐng)域的佼佼者。該項目上線短短幾天,已經(jīng)收獲了 2.1k 星。
項目地址:
https://github.com/AMAI-GmbH/AI-Expert-Roadmap
亮點多多的 AI 專家路線圖
對學(xué)習(xí)者非常友好的是,這份 AI 專家路線圖是一個互動版本。每個子模塊所列內(nèi)容都可以鏈接到指定網(wǎng)站,學(xué)習(xí)者可以找到詞條的維基百科或其他來源的釋義和拓展內(nèi)容。此外,如果有新的研究出現(xiàn)時,該路線圖會隨時更新。
該路線圖旨在給學(xué)習(xí)者提供關(guān)于人工智能的整體概念,并在學(xué)習(xí)感到困惑時給予指導(dǎo),而沒有鼓勵學(xué)習(xí)者一味地選擇最先進(jìn)、最熱門的技術(shù)。這是因為在科研中,每個人都需要了解哪種工具最適合自己。換言之,最先進(jìn)、最熱門的技術(shù)不一定是最適合的。
就這份 AI 專家路線圖而言,開發(fā)者列出了任何學(xué)習(xí)路徑所必不可少的一些要素,如論文和代碼、版本控制、語義化版本控制和更新日志。但就具體選擇上,開發(fā)者認(rèn)為在學(xué)習(xí) AI 時不應(yīng)直接過渡到當(dāng)前熱門的技術(shù)——深度學(xué)習(xí),而應(yīng)步步為營,并提供了 3 條可供選擇的學(xué)習(xí)路徑:數(shù)據(jù)科學(xué)家→機器學(xué)習(xí)→深度學(xué)習(xí)…;數(shù)據(jù)科學(xué)家→數(shù)據(jù)工程師…;大數(shù)據(jù)工程師→…
循序漸進(jìn)才是“王道”。
AI 專家路線圖概覽
這部分內(nèi)容簡要總結(jié)了 AI 專家路線圖,并從以下幾個方面著手講解:數(shù)據(jù)科學(xué)家、機器學(xué)習(xí)、深度學(xué)習(xí)、數(shù)據(jù)工程師以及大數(shù)據(jù)工程師。這 5 部分內(nèi)容都有詳細(xì)的學(xué)習(xí)路線圖,點擊圖表任意模塊,都會鏈接到對應(yīng)的內(nèi)容。
數(shù)據(jù)科學(xué)家路線圖
在數(shù)據(jù)科學(xué)家路線圖中,我們可以了解到進(jìn)行 AI 研究所需要的基礎(chǔ):矩陣和線性代數(shù)、數(shù)據(jù)庫、表格數(shù)據(jù)、數(shù)據(jù)格式(JSON、XML、CSV)、正則表達(dá)式等等。
在統(tǒng)計學(xué)方面,該路線圖涵蓋了概率論、概率分布、估計、假設(shè)檢驗、置信區(qū)間、大數(shù)定律、蒙特卡羅方法等等。
在 Python 編程方面,該路線圖展示了 Python 基礎(chǔ)、比較重要的 Python 庫以及所需運行環(huán)境等。
在數(shù)據(jù)來源方面,學(xué)習(xí)者點擊“Awesome Public Datasets”圖標(biāo),就可以鏈接到整理好的公共數(shù)據(jù)集等。接著過渡到可視化和探索性數(shù)據(jù)分析 / 轉(zhuǎn)換 / 整理相關(guān)內(nèi)容,最后進(jìn)入到機器學(xué)習(xí)和數(shù)據(jù)工程師兩個不同的方向。
機器學(xué)習(xí)路線圖
機器學(xué)習(xí)路線圖主要分為 4 大部分:基礎(chǔ)概念、算法、用例以及所用工具。其中基礎(chǔ)概念部分主要包括機器學(xué)習(xí)中常用的概念、梯度下降、訓(xùn)練集、測試集、驗證集等基礎(chǔ)概念;算法部分列舉了 4 類算法:監(jiān)督學(xué)習(xí)、無監(jiān)督學(xué)習(xí)、集成學(xué)習(xí)和強化學(xué)習(xí);用例部分列舉了情感分析、協(xié)同過濾、標(biāo)注和預(yù)測;所用工具部分則介紹了 scikit-learn、spacy 等工具。每部分內(nèi)容都有對應(yīng)的詳細(xì)文檔。
深度學(xué)習(xí)路線圖
機器學(xué)習(xí)之后進(jìn)入到了深度學(xué)習(xí),這是第 1 條可選擇學(xué)習(xí)路徑的最后部分。深度學(xué)習(xí)路線圖由 4 大部分組成:論文、神經(jīng)網(wǎng)絡(luò)、網(wǎng)絡(luò)架構(gòu)以及所用工具。論文部分提供了深度學(xué)習(xí)論文閱讀路線圖以及 SOTA 論文;神經(jīng)網(wǎng)絡(luò)部分提供了一篇詳細(xì)介紹如何理解神經(jīng)網(wǎng)絡(luò)的博客文章;網(wǎng)絡(luò)架構(gòu)部分包括感知器、自動編碼器、CNN、RNN;所用工具部分主要介紹了 TensorFlow 、PyTorch 等。最后給出建議:保持探索、與時俱進(jìn)。
數(shù)據(jù)工程師路線圖
在數(shù)據(jù)科學(xué)家路線圖之后可以直接進(jìn)入到數(shù)據(jù)工程師路線圖,這是第 2 條可選擇的學(xué)習(xí)路徑。該路線圖主要介紹了數(shù)據(jù)格式、數(shù)據(jù)發(fā)現(xiàn)、數(shù)據(jù)集成、數(shù)據(jù)融合、數(shù)據(jù)調(diào)研、數(shù)據(jù)湖和數(shù)據(jù)倉庫以及如何使用 ETL 等多方面內(nèi)容。
大數(shù)據(jù)工程師路線圖
大數(shù)據(jù)工程師路線圖是第 3 條可選擇的學(xué)習(xí)路徑,主要分為 3 部分內(nèi)容:大數(shù)據(jù)架構(gòu)、遵循的原則以及所用工具。大數(shù)據(jù)架構(gòu)部分主要講述了大數(shù)據(jù)分析架構(gòu)模式和最佳實踐;遵循的原則包括數(shù)據(jù)庫管理系統(tǒng)中的數(shù)據(jù)復(fù)制,以及 Hadoop 中 NameNode 和 DataNode 的區(qū)別等;所用工具則介紹了 Hadoop、Spark 等。
參考鏈接:
https://i.am.ai/roadmap/#data-science-roadmap
*博客內(nèi)容為網(wǎng)友個人發(fā)布,僅代表博主個人觀點,如有侵權(quán)請聯(lián)系工作人員刪除。