普通程式設計師如何向人工智慧方向轉型

2021-05-21 08:39:27 字數 5365 閱讀 9490

1樓:風花水月

當下,人工智慧已經成為越來越火的一個方向。普通程

序員,如何轉向人工智慧方向,是知乎上的一個問題。

一.目的

本文的目的是給出一個簡單的,平滑的,易於實現的學習方法,幫助「普通」程式設計師踏入ai領域這個門。這裡,我對普通程式設計師的定義是:擁有大學本科知識;平時工作較忙;自己能獲取的資料有限。

因此,本文更像是一篇「from the scratch」的ai入門教程。

二. ai領域簡介

ai,也就是人工智慧,並不僅僅包括機器學習。曾經,符號與邏輯被認為是人工智慧實現的關鍵,而如今則是基於統計的機器學習佔據了主導地位。最近火熱的深度學習正是機器學習中的一個子項。

目前可以說,學習ai主要的是學習機器學習。

但是,人工智慧並不等同於機器學習,這點在進入這個領域時一定要認識清楚。關於ai領域的發展歷史介紹推薦看周老師寫的《機器學習簡介》。下面一個問題是:

ai的門好跨麼?其實很不好跨。我們以機器學習為例。

在學習過程中,你會面對大量複雜的公式,在實際專案中會面對資料的缺乏,以及艱辛的調參等。如果僅僅是因為覺得這個方向未來會「火」的話,那麼這些困難會容易讓人放棄。考慮到普通程式設計師的特點,而要學習如此困難的學科,是否就是沒有門路的?

答案是否定的。只要制定合適的學習方法即可。

三.學習方法

學習方法的設定簡單說就是回答以下幾個問題:我要學的是什麼?我怎樣學習?

我如何去學習?這三個問題概括說就是:學習目標,學習方針與學習計劃。

學習目標比較清楚,就是踏入ai領域這個門。這個目標不大,因此實現起來也較為容易。「過大的目標時就是為了你日後放棄它時找到了足夠的理由」。

學習方針可以總結為「興趣為先,踐學結合」。簡單說就是先培養興趣,然後學習中把實踐穿插進來,螺旋式提高。這種方式學習效果好,而且不容易讓人放棄。

有了學習方針以後,就可以制定學習計劃,也稱為學習路線。下面就是學習路線的介紹。

四.學習路線

我推薦的學習路線是這樣的,如下圖:

這個學習路線是這樣設計的:首先了解這個領域,建立起全面的視野,培養起充足的興趣,然後開始學習機器學習的基礎,這裡選擇一門由淺入深的課程來學習,課程最好有足夠的實驗能夠進行實戰。基礎打下後,對機器學習已經有了充足的瞭解,可以用機器學習來解決一個實際的問題。

這時還是可以把機器學習方法當作一個黑盒子來處理的。實戰經驗積累以後,可以考慮繼續進行學習。這時候有兩個選擇,深度學習或者繼續機器學習。

深度學習是目前最火熱的機器學習方向,其中一些方法已經跟傳統的機器學習不太一樣,因此可以單獨學習。除了深度學習以外,機器學習還包括統計學習,整合學習等實用方法。

如果條件足夠,可以同時學習兩者,一些規律對兩者是共通的。學習完後,你已經具備了較強的知識儲備,可以進入較難的實戰。這時候有兩個選擇,工業界的可以選擇看開源專案,以改**為目的來讀**;學術界的可以看特定領域的**,為解決問題而想**文。

無論哪者,都需要知識過硬,以及較強的編碼能力,因此很能考察和鍛鍊水平。經過這個階段以後,可以說是踏入ai領域的門了。「師傅領進門,修行在個人」。之後的路就要自己走了。

下面是關於每個階段的具體介紹:

0.領域瞭解

在學習任何一門知識之前,首先第一步就是了解這個知識是什麼?它能做什麼事?它的價值在什麼地方?

如果不理解這些的話,那麼學習本身就是一個沒有方向的舟,不知道駛向何處,也極易有沉船的風險。瞭解這些問題後,你才能培養出興趣,興趣是最好的引路人,學習的動力與持久力才能讓你應付接下來的若干個階段。關於機器學習是什麼,能做什麼,它與深度學習以及人工智慧的關係,可以看我寫的部落格從機器學習談起。

1.知識準備

如果你離校過久,或者覺得基礎不牢,最好事先做一下準備複習工作。「工欲善其事,必先利其器」。以下的準備工作不多,但足以應付後面階段的學習。

數學:複習以下基本知識。線性代數:矩陣乘法;高數:求導;概率論:條件與後驗概率。其他的一些知識可以在後面的學習的過程中按需再補;

2.機器學習

機器學習的第一門課程首推andrew ng的機器學習。這門課程有以下特點:難度適中,同時有足夠的實戰例子,非常適合第一次學習的人。

cs229這門課程我這裡不推薦,為什麼,原因有以下:

3.實踐做專案

學習完了基礎課程,你對機器學習就有了初步瞭解。現在使用它們是沒有問題的,你可以把機器學習演算法當作黑盒子,放進去資料,就會有結果。在實戰中你更需要去關心如何獲取資料,以及怎麼調參等。

如果有時間,自己動手做一個簡單的實踐專案是最好的。

這裡需要選擇一個應用方向,是影象(計算機視覺),音訊(語音識別),還是文字(自然語言處理)。這裡推薦選擇影象領域,這裡面的開源專案較多,入門也較簡單,可以使用opencv做開發,裡面已經實現好了神經網路,svm等機器學習演算法。專案做好後,可以開源到到 github 上面,然後不斷完善它。

實戰專案做完後,你可以繼續進一步深入學習,這時候有兩個選擇,深度學習和繼續機器學習;

4.深度學習

深度學習:深度學習是目前最火熱的研究方向。有以下特點:

知識更新快,較為零碎,沒有系統講解的書。因此學習的資源也相對零散,下面是一些資源介紹。其中不推薦的部分並不代表不好,而是在這個初學階段不合適:

推薦,ufldl:非常好的dl基礎教程,也是andrew ng寫的。有很詳盡的推導,有翻譯,且翻譯質量很高;推薦,deep learning (*****):

2023年nature上的**,由三位深度學習界的大牛所寫,讀完全篇**,給人高屋建瓴,一覽眾山小的感覺,強烈推薦。如果只能讀一篇**瞭解深度學習,我推薦此篇。這篇**有同名的中文翻譯;推薦,neural ***works and deep learning:

這本書的作者非常擅長以淺顯的語言表達深刻的道理,雖然沒有翻譯,但是閱讀並不困難;推薦,recurrent neural ***works:結合一個實際案例告訴你rnn是什麼,整篇教程學完以後,會讓你對rnn如何產生作用的有很清晰的認識,而這個效果,甚至是讀幾篇相關**所沒有的;不推薦,neural ***works for machine learning university of toronto coursera:深度學習創始人教的課,最大的問題是太難,而且老先生的吐字有時不是很標準;不推薦,deep learning (book):

同樣也是由深度學習大牛所寫的書,但感覺就像是第二作者,也就是他的學生所寫的。很多內容都講了,但是感覺也沒講出什麼內容來,只是告訴你來自那篇**,這樣的話可能直接閱讀**更合適。不推薦,cs231n:

李菲菲的課程,很有名,專門講**n。但是這門課程有一個最大的問題,就是沒有字幕,雖然有youtube的自動翻譯字幕,但有還不如沒有。

5.繼續機器學習

深度學習未必就是未來的一定主流,至少一些大牛是這麼認為的。傳統的機器學習有如下特點,知識系統化,有相對經典的書。其中統計學習(代表svm)與整合學習(代表adaboost)是在實踐中使用非常多的技術。

下面是相關資源:

推薦,機器學習(周志華):如果是在以前,機器學習方面的經典教材首推prml,但現在周老師的書出來以後,就不再是這樣了。首先推薦讀周老師的書。

這本書有一個特點,那就是再難的道理也能用淺顯精煉的語言表達出來。正如周老師的名言:「體現你水平的地方是把難的東西講容易了,而不是把容易的東西講難,想把一個東西講難實在太簡單」;

不推薦,pattern recognition and machine learning:當前階段不推薦。prml是以貝葉斯的觀點看待很多機器學習方法,這也是它的一大特色。

但對於初學者來說,這種觀點其實並無必要。而且此書沒有中文翻譯,當前階段硬啃很容易放棄;

6.開源專案

當知識儲備較為充足時,學習可以再次轉入實踐階段。這時候的實踐仍然可以分兩步走,學習經典的開源專案或者發表高質量的**。開源專案的學習應該以儘量以優化為目的,單純為讀**而學習效果往往不太好。

好的開源專案都可以在github 裡搜尋。這裡以深度學習為例。深度學習的開源優秀庫有很多,例如torch,theano等等,這裡列舉其中的兩個:

推薦,deeplearntoolbox:較早的一個深度學習庫,用matlab語言撰寫,較為適合從剛學習的課程轉入學習。遺憾的是作者不再維護它了;

推薦,tensorflow:google的開源庫,時至今日,已經有40000多個star,非常驚人,支援移動裝置;

7.會議**

較好的課程都會推薦你一些**。一些著名的技術與方法往往誕生於一些重要的會議。因此,看往年的會議**是深入學習的方法。

在這時,一些**中的內容會驅使你學習數學中你不擅長的部分。有時候你會覺得數學知識儲備不夠,因此往往需要學習一些輔助課程。

當你看完足夠的**以後,在這個階段,如果是在校學生,可以選擇某個課題,以**文為目的來學習研究。一般來說,**是工作的產物。有時候一篇基於實驗的**往往需要你寫**或者基於開源專案。

因此開源專案的學習與會議**的工作兩者之間是有相關的。

兩者可以同時進行學習。關於在**看**,可以看一下ccf推薦排名,瞭解一下這個領域裡有哪些優秀的會議。

下面介紹兩個影象與機器學習領域的著名頂級會議:

cvpr:與另兩個會議iccv和eccv合稱計算機視覺領域的三大會,注意會議每年的主頁是變動的,因此搜尋需要加上年份;conference on neural information processing systems:簡稱nips,許多重要的工作發表在這上面,例如關於**n的一篇重要**就是發表在上面;

8.自由學習

到這裡了,可以說是進入這個門了。下面可以依據興趣來自由學習。前階段不推薦的學習資源也可隨意學習,下面是點評:

cs229:ng寫的講義很不錯,其中關於svm的推導部分很清晰,想學習svm推薦;neural ***works for machine learning:大牛的視角跟人就是不一樣,看看hinton對神經網路是怎麼看的,往往會讓你有種原來如此的感悟。

其實看這門課程也等同於讀**,因為幾乎每節課的參考資料裡都有**要你讀;cs231n: convolutional neural ***works for visual recognition:最新的知識,還有詳細的作業。

國內應該有團隊對字幕進行了翻譯,可以找找;prml:作為一門經典的機器學習書籍,是很有閱讀必要的,會讓你對機器學習擁有一個其他的觀察視角;

五.總結

本文的目的是幫助對ai領域瞭解不深,但又想進入的同學踏入這個門。這裡只說踏入,是因為這個領域的專精實在非常困難,需要數年的積累與努力。在進行領域學習前,充分認識自己的特點,制定合適的學習方法是十分重要的。

首先得對這個領域進行充分了解,培養興趣。在學習時,保持著循序漸進的學習方針,不要猛進的學習過難資源;結合著學習與實踐相輔的策略,不要只讀只看,實際動手才有成就感。學習某個資源時要有充分的目的,不是為了學開源專案而看**,而是為了寫開源專案而看;不是為了**文而寫**,而是為了做事情而寫**。

如果一個學習資源對你過難,並不代表一定是你的問題,可能是學習資源的演講或撰寫人的問題。能把難的問題講簡單的人才是真正有水平的人。所以,一定要學習優質資源,而不是不分青紅皁白的學習。

最後,牢記以興趣來學習。學習的時間很長,過程也很艱難,而只有興趣才是讓你持之以恆,攻克難關的最佳助力。

如何成為一名程式設計師,如何成為一名合格程式設計師

從一名普通的司機,到一名程式設計師他是如何做到的 會持續更新各行業各領域的知識 先學會做 第一步 如何成為一名合格程式設計師 一 需求理解能力 在開發過程中,要在需求細節不明的情況下,有責任設法搞清楚,積極學習程式設計思想和方法,並在設計 編碼工作中自覺應用,對有一些複雜程度的設計,主動申請設計審查...

普通人眼裡的程式設計師是怎樣的,在大家眼中,程式設計師是一個怎樣的職業

這些大神在普通人類和初級程式設計師眼裡是無所不能的,是他們嚮往的目標,在中級程式設計師和高階程式設計師眼裡,這些大神就是他自己,只不過他還沒紅起來而已。在普通人眼裡,程式設計師一般都是那種玩電腦非常厲害的,而且他們總是每天在電腦面前不出門,也不願意打扮自己,每天都沉迷在程式中。程式設計師不是一般的人...

程式設計師如何在30歲達到百萬年薪

程式設計師 英文programmer 是從事程式開發 維護的專業人員。一般將程式設計師分為程式設計人員和程式編碼人員,但兩者的界限並不非常清楚,特別是在中國。軟體從業人員分為初級程式設計師 高階程式設計師 系統分析員,系統架構師,測試工程師五大類。程式設計師賺的多好像是業界公認的一項職業,但是程式設...