中文字幕国产91无码|AV成人手机在线|av成人先锋在线|911无码在线国产人人操|91蜜桃视频精品免费在线|极品美女A∨片在线看|日韩在线成人视频日韩|电影三级成人黄免费影片|超碰97国产在线|国产成人精品色情免费视频

  • +1

機(jī)器學(xué)習(xí)大牛吳恩達(dá):調(diào)優(yōu)數(shù)據(jù)比調(diào)優(yōu)模型更重要

澎湃新聞?dòng)浾?邵文
2021-09-14 20:09
來源:澎湃新聞
? 科學(xué)湃 >
聽全文
字號(hào)

9月14日,在線上舉行的亞馬遜云科技中國峰會(huì)上,亞馬遜云科技人工智能與機(jī)器學(xué)習(xí)副總裁Swami Sivasubramanian對話人工智能教育公司DeepLearning.AI創(chuàng)始人吳恩達(dá)(Andrew Ng),討論機(jī)器學(xué)習(xí)的未來、下一代機(jī)器學(xué)習(xí)從業(yè)者需要掌握的基本技能以及如何彌合機(jī)器學(xué)習(xí)中概念驗(yàn)證與生產(chǎn)之間的差距。

左為吳恩達(dá),右為Swami Sivasubramanian

吳恩達(dá)是人工智能教育公司DeepLearning.AI的創(chuàng)始人,工業(yè)人工智能平臺(tái)公司Landing AI的創(chuàng)始人兼CEO ,在線學(xué)習(xí)供應(yīng)商Coursera的聯(lián)合創(chuàng)始人兼董事長。吳恩達(dá)曾在谷歌工作,是谷歌大腦深度學(xué)習(xí)項(xiàng)目的創(chuàng)始人和負(fù)責(zé)人,曾任百度人工智能首席科學(xué)家。他還是斯坦福大學(xué)計(jì)算機(jī)科學(xué)的兼職教授,領(lǐng)導(dǎo)著一個(gè)關(guān)于人工智能、機(jī)器學(xué)習(xí)和深度學(xué)習(xí)的研究小組。

吳恩達(dá)在現(xiàn)場分享了將機(jī)器學(xué)習(xí)從概念驗(yàn)證帶入生產(chǎn)的技巧,快速贏得第一個(gè)項(xiàng)目以獲得推進(jìn)動(dòng)力的重要性,以及確保負(fù)責(zé)制定和執(zhí)行機(jī)器學(xué)習(xí)策略的高管獲得有關(guān)該技術(shù)的充分教育的建議。

"我看到組織所犯的第一個(gè)錯(cuò)誤是啟動(dòng)時(shí)間太長或計(jì)劃時(shí)間太長。CIO(Chief Information Officer,首席信息官)說‘我的數(shù)據(jù)一團(tuán)糟,我的digital silo(數(shù)字筒倉)需要完全清理。'然而事實(shí)上,基本上每個(gè)人的silos(庫)中都有凌亂的數(shù)據(jù),”吳恩達(dá)說。

吳恩達(dá)認(rèn)為,啟動(dòng)一個(gè)小型試點(diǎn)項(xiàng)目以獲得快速勝利非常重要。“幾乎每家公司都已經(jīng)有足夠的數(shù)據(jù)開始著手,我發(fā)現(xiàn)直接加入進(jìn)來,快速贏得一個(gè)較小的項(xiàng)目,并利用從中學(xué)到的知識(shí)隨著時(shí)間的推移,發(fā)展成越來越大的項(xiàng)目的這些公司發(fā)展情況更好?!?/p>

那么如何為機(jī)器學(xué)習(xí)項(xiàng)目制定關(guān)鍵績效指標(biāo)呢?對此,吳恩達(dá)的回答是,“如果你是第一次從事一個(gè)項(xiàng)目,一個(gè)全新的應(yīng)用程序,很難為AI團(tuán)隊(duì)制定成功的目標(biāo)指標(biāo)。作為團(tuán)隊(duì)正在開展的項(xiàng)目,很難建立一些合理的基線績效水平。我認(rèn)為你只需要快速構(gòu)建第一個(gè)原型系統(tǒng)(prototype system),了解可能的情況。

更進(jìn)一步,很多公司起步時(shí)往往發(fā)現(xiàn)數(shù)據(jù)是不夠的,而數(shù)據(jù)是機(jī)器學(xué)習(xí)的燃料,這時(shí)候該怎么辦?吳恩達(dá)提出,“我的典型建議是直接進(jìn)入并開始使用小數(shù)據(jù)集做一些事情,然后通常會(huì)收集到更多數(shù)據(jù)。我發(fā)現(xiàn)對于許多實(shí)際應(yīng)用程序而言,與以模型為中心的方法(您持有數(shù)據(jù)修復(fù)并嘗試改進(jìn)代碼)相比,持有代碼修復(fù)并迭代改進(jìn)數(shù)據(jù)更有用。這是Mops(機(jī)器學(xué)習(xí)操作,Machine Learning Operations)的新生部分,我認(rèn)為目前還沒有人真正擁有出色的工具。”

MLOps是AI領(lǐng)域中一個(gè)相對較新的概念,旨在確保模型輸出質(zhì)量的同時(shí),加快機(jī)器學(xué)習(xí)模型的開發(fā)和生產(chǎn)部署,是數(shù)據(jù)科學(xué)家與操作專業(yè)人員之間進(jìn)行協(xié)作和交流以幫助管理機(jī)器學(xué)習(xí)任務(wù)生命周期的一種實(shí)踐。MLOps基于可提高工作流效率的DevOps(用于促進(jìn)開發(fā)應(yīng)用程序/軟件工程、技術(shù)運(yùn)營和質(zhì)量保障部門之間的溝通、協(xié)作與整合)原理和做法演變而來。

機(jī)器學(xué)習(xí)的進(jìn)步是模型帶來的還是數(shù)據(jù)帶來的一直存在巨大爭議,吳恩達(dá)在2021年4月18日生日當(dāng)天發(fā)布的一個(gè)視頻中表示,一個(gè)機(jī)器學(xué)習(xí)團(tuán)隊(duì)80%的工作應(yīng)該放在數(shù)據(jù)準(zhǔn)備上,確保數(shù)據(jù)質(zhì)量是最重要的工作。MLOps則是保證數(shù)據(jù)質(zhì)量在整個(gè)的機(jī)器學(xué)習(xí)工程中是高質(zhì)量、一致的重要工具,對此,吳恩達(dá)做了進(jìn)一步解釋。

“在實(shí)驗(yàn)室中訓(xùn)練AI模型然后發(fā)表論文并產(chǎn)生良好結(jié)果令人興奮。但是當(dāng)人們審視機(jī)器學(xué)習(xí)項(xiàng)目的生命周期時(shí),需要做的不僅僅是訓(xùn)練模型,還需要審視項(xiàng)目的范圍,決定做什么,不做什么,還有收集數(shù)據(jù)并確保數(shù)據(jù)的高質(zhì)量等等。然后將其推向生產(chǎn),審視其解決任何性能或公平問題的表現(xiàn),”由此,吳恩達(dá)認(rèn)為,如果能夠構(gòu)建這樣的工具,那么就可以授權(quán)更多人構(gòu)建、部署、維護(hù)和有效使用機(jī)器學(xué)習(xí)系統(tǒng)。

“AI系統(tǒng)不僅僅是代碼(code),而是代碼加數(shù)據(jù)(data)。對于代碼,我們有一個(gè)DevOps紀(jì)律。在數(shù)據(jù)方面,為了管理項(xiàng)目中持續(xù)的高質(zhì)量數(shù)據(jù)流,MLOps需要更加迭代。他們需要共同努力,”吳恩達(dá)表示。

最后,對于剛畢業(yè)的工程師,吳恩達(dá)給出了自己的建議,“我發(fā)現(xiàn)人工智能領(lǐng)域表現(xiàn)最好的是‘T型’人才——擁有廣泛的技術(shù)知識(shí)基礎(chǔ)以及真正在某些領(lǐng)域深耕。課程作業(yè)往往是個(gè)人獲得廣泛的技術(shù)知識(shí)基礎(chǔ)的一種非常有效的方式。然后超過某個(gè)點(diǎn),為了獲得更深入的知識(shí),你必須跳進(jìn)去做項(xiàng)目工作。我們都想建立一個(gè)能造福許多人,創(chuàng)造巨大的經(jīng)濟(jì)的項(xiàng)目。社區(qū)也很重要,我認(rèn)為我們都是由周圍的人塑造的,所以找志同道合的人互相分享知識(shí)?!?/p>

    責(zé)任編輯:李躍群
    校對:張亮亮
    澎湃新聞報(bào)料:021-962866
    澎湃新聞,未經(jīng)授權(quán)不得轉(zhuǎn)載
            查看更多

            掃碼下載澎湃新聞客戶端

            滬ICP備14003370號(hào)

            滬公網(wǎng)安備31010602000299號(hào)

            互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006

            增值電信業(yè)務(wù)經(jīng)營許可證:滬B2-2017116

            ? 2014-2026 上海東方報(bào)業(yè)有限公司