-->

免费看在线a黄视频|99爽99操日韩毛片儿|91停婷在线无码观看|日韩三级片小视频|一级黄片免费播放|欧美成人视频网站导航|亚洲日韩欧美七区|国产视频在线观看91|人成视频免费在线播放|国产精品成人在线免费观看

違規(guī)提示

請(qǐng)您遵循相關(guān)法律法規(guī),避免再次出現(xiàn)類似問(wèn)題

如有任何疑問(wèn),請(qǐng)聯(lián)系support@tmtpost.com

關(guān)閉
第二課:如何獲得一個(gè)好的機(jī)器學(xué)習(xí)系統(tǒng)?
陳雨強(qiáng) / 人工智能在工業(yè)界應(yīng)用的必經(jīng)之路
第二課:如何獲得一個(gè)好的機(jī)器學(xué)習(xí)系統(tǒng)?

第二課:如何獲得一個(gè)好的機(jī)器學(xué)習(xí)系統(tǒng)?

小欣:這節(jié)課,陳雨強(qiáng)老師會(huì)為我們講解如何獲得一個(gè)好的機(jī)器學(xué)習(xí)系統(tǒng)。

陳雨強(qiáng):我們?nèi)绻胍鲆粋€(gè)好的人工智能機(jī)器學(xué)習(xí)系統(tǒng)的話,我們所需要具備的條件有哪些?好的機(jī)器學(xué)習(xí)系統(tǒng)一定是可擴(kuò)展的機(jī)器學(xué)習(xí)系統(tǒng)??蓴U(kuò)展的機(jī)器學(xué)習(xí)系統(tǒng)并不等于可擴(kuò)展的系統(tǒng),這里面最大的區(qū)別是什么呢?

最大的區(qū)別就是可擴(kuò)展的機(jī)器學(xué)習(xí)系統(tǒng),一方面數(shù)據(jù)處理的吞吐隨著集群和機(jī)器數(shù)量的增加而增加,這是傳統(tǒng)的可擴(kuò)展系統(tǒng);而另一方面可擴(kuò)展機(jī)器學(xué)習(xí)系統(tǒng)指的是智能的水平和體驗(yàn)的壁壘隨著業(yè)務(wù)和數(shù)據(jù)的增加而增加,這個(gè)可能是機(jī)器學(xué)習(xí)最不可替代的價(jià)值所在。

過(guò)去要建立競(jìng)爭(zhēng)壁壘主要是通過(guò)業(yè)務(wù)的創(chuàng)新、行業(yè)的跑馬圈地、通過(guò)新的渠道來(lái)提升效率。這種方式中對(duì)于產(chǎn)品本身來(lái)說(shuō)是相對(duì)容易被抄襲的,而資本的投入、運(yùn)營(yíng)的強(qiáng)度、渠道是否完整是整個(gè)公司成功的關(guān)鍵。但是隨著數(shù)據(jù)和AI的普及現(xiàn)在有了一個(gè)新的方式,就是通過(guò)時(shí)間和數(shù)據(jù)創(chuàng)造壁壘。

比如現(xiàn)在的搜索引擎,即使有人有了百度全部的代碼也很難做出一個(gè)超過(guò)百度體驗(yàn)水平的搜索引擎,因?yàn)榘俣葥碛凶罱耆袊?guó)上十億人所有的搜索數(shù)據(jù)。如果沒(méi)有了這些數(shù)據(jù)的話,即使有同樣的算法也沒(méi)有辦法得到同樣的體驗(yàn)水平。從這個(gè)角度上來(lái)說(shuō),將來(lái)的競(jìng)爭(zhēng)壁壘將不僅僅只是在我們的業(yè)務(wù)上,更會(huì)在我們的數(shù)據(jù)上。有了更多的數(shù)據(jù)我們就可以通過(guò)人工智能產(chǎn)生更高的壁壘,然后拉開(kāi)更大的差距。

那怎樣獲得一個(gè)高智能水平的可擴(kuò)展的機(jī)器學(xué)習(xí)系統(tǒng)呢?1960年代到1990年代,Vapnik 和 Chervonenkis提出了“VC維”理論,形式化地描述了機(jī)器學(xué)習(xí)算法對(duì)復(fù)雜函數(shù)擬合的能力。“VC維”類似人腦內(nèi)的神經(jīng)元,有越多的神經(jīng)元代表這個(gè)人越聰明。但有越高的智商不一定會(huì)有越高的成就,還有一個(gè)很關(guān)鍵的因素就是你需要有很多的經(jīng)歷。只有智商比較高同時(shí)又很多經(jīng)歷的人才能悟出很多的道理,機(jī)器學(xué)習(xí)“VC維”也是講的這么一個(gè)道理。

過(guò)去的數(shù)據(jù)不是很大,所以隨著我們迭代的增加,訓(xùn)練損失函數(shù)在不斷的下降,測(cè)試損失函數(shù)會(huì)先下降后上升。這個(gè)地方我們需要控制VC維,讓模型不要共擬合。這好比你是一個(gè)比較聰明的孩子,小的時(shí)候不能讓你過(guò)度地思考,因?yàn)槟愕木Ρ容^少,所以非常容易誤入歧途。其實(shí)比較好的做法是我們使用VC維比較低的模型,讓訓(xùn)練的損失和測(cè)試的損失函數(shù)同時(shí)下降,這是我們認(rèn)為比較好的一個(gè)模型。

當(dāng)然這只是故事的一半,隨著時(shí)代的不斷的發(fā)展會(huì)發(fā)現(xiàn)數(shù)據(jù)會(huì)越來(lái)越多,如果我們把橫軸替換成數(shù)據(jù)這個(gè)維度,數(shù)據(jù)從小到大這么一個(gè)過(guò)程,我們會(huì)發(fā)現(xiàn)有兩條曲線。其中第一條曲線是說(shuō),過(guò)去的是這條over-fitting的曲線,在數(shù)據(jù)比較小的時(shí)候,我們低VC維的模型比高VC維的模型效果好。因?yàn)楦遃C維的模型會(huì)over-fitting,但是隨著數(shù)據(jù)越來(lái)越多的時(shí)候,高VC維的效果會(huì)不斷提升而低VC維系統(tǒng)會(huì)達(dá)到一個(gè)上階,這就是所謂的under-fitting的問(wèn)題。

在將來(lái)大數(shù)據(jù)的時(shí)代,under-fitting可能是更需要關(guān)注的一個(gè)問(wèn)題。因?yàn)閡nder-fitting會(huì)限制你使用大數(shù)據(jù),以及限制數(shù)據(jù)價(jià)值的體現(xiàn)。所以說(shuō)在大數(shù)據(jù)時(shí)代里面我們強(qiáng)調(diào)可擴(kuò)展的概念,智能水平、模型的效果應(yīng)該隨著數(shù)據(jù)的增加而不斷增加,而不是隨著數(shù)據(jù)的增加達(dá)到一個(gè)瓶頸,我們要設(shè)計(jì)的系統(tǒng)應(yīng)該是高VC維的系統(tǒng)。

小欣:下節(jié)課,陳雨強(qiáng)老師會(huì)為我們講解如何提高VC維。

【版權(quán)歸鈦媒體所有,未經(jīng)許可不得轉(zhuǎn)載】

分享課程:
大家都在學(xué)
72問(wèn) 有聲書系列 / 中國(guó)經(jīng)濟(jì)2021
精品小課 揭秘黃金投資:2022年以來(lái)上漲表現(xiàn)最好的資產(chǎn)之一
精品小課 阿里人力資源體系課

Oh! no

您是否確認(rèn)要?jiǎng)h除該條評(píng)論嗎?

全部課程 ( 6 )
倒序播放

00:00
/
00:00
X1.0

注冊(cè)郵箱未驗(yàn)證

我們已向下方郵箱發(fā)送了驗(yàn)證郵件,請(qǐng)查收并按提示驗(yàn)證您的郵箱。

如果您沒(méi)有收到郵件,請(qǐng)留意垃圾郵件箱。

更換郵箱

您當(dāng)前使用的郵箱可能無(wú)法接收驗(yàn)證郵件,建議您更換郵箱

賬號(hào)合并

經(jīng)檢測(cè),你是“鈦媒體”和“商業(yè)價(jià)值”的注冊(cè)用戶?,F(xiàn)在,我們對(duì)兩個(gè)產(chǎn)品因進(jìn)行整合,需要您選擇一個(gè)賬號(hào)用來(lái)登錄。無(wú)論您選擇哪個(gè)賬號(hào),兩個(gè)賬號(hào)的原有信息都會(huì)合并在一起。對(duì)于給您造成的不便,我們深感歉意。