應(yīng)用

技術(shù)

物聯(lián)網(wǎng)世界 >> 物聯(lián)網(wǎng)新聞 >> 物聯(lián)網(wǎng)熱點(diǎn)新聞
企業(yè)注冊(cè)個(gè)人注冊(cè)登錄

當(dāng)機(jī)器學(xué)習(xí)遇見“眾包”,新一代人工智能訓(xùn)練模式誕生

2018-09-04 13:48 獵云網(wǎng)

導(dǎo)讀:十多年前,我第一次接觸“眾包”這個(gè)概念,當(dāng)時(shí)我還是倫敦商學(xué)院的一名學(xué)生。那天,我們的教授拿著一罐硬幣走進(jìn)了教室。

  編者注:本文的作者Simon Schneider是眾包經(jīng)濟(jì)領(lǐng)域的企業(yè)家,也是ECSI的董事。

  十多年前,我第一次接觸“眾包”這個(gè)概念,當(dāng)時(shí)我還是倫敦商學(xué)院的一名學(xué)生。那天,我們的教授拿著一罐硬幣走進(jìn)了教室。

  他讓我們每個(gè)人都猜一下罐子里有多少錢。罐子在教室里傳了一圈,同時(shí)教授在白板上記下了每人的猜想數(shù)額,總共有100左右,當(dāng)時(shí)我估計(jì)里面有30英鎊。所有同學(xué)都估計(jì)完畢后,教授打開了一個(gè)信封,從中取出了一張紙條并告訴我們:罐子里的硬幣實(shí)際金額為18.76英鎊。

  最開始我認(rèn)為教授想要告訴大家,“罐中幣”這個(gè)猜想本身是不合理的,但教授接下來的舉動(dòng)卻出乎我的意料:他計(jì)算了我們所有人的猜測數(shù)目的平均值,計(jì)算結(jié)果出奇地接近18.76英鎊。眾人智慧的力量就這樣呈現(xiàn)在我們眼前,并且比我們自己99%的估計(jì)值都要精準(zhǔn)(我們中只有一個(gè)人確實(shí)猜到了真實(shí)的數(shù)額)。

  幾個(gè)月后,我和我的同學(xué)Janeen成立了一家眾包公司。當(dāng)時(shí)我們召集了最優(yōu)秀的安全和防務(wù)創(chuàng)新者來解決行業(yè)和政府客戶方面復(fù)雜難題。那是2005年,當(dāng)時(shí)的眾包浪潮孕育了InnoCentive、維基百科以及Amazon Mechanical Turk,這三家公司在獲取和使用大眾的知識(shí)和靈感方面處于領(lǐng)先地位。

  現(xiàn)有公司還啟動(dòng)了各種眾包計(jì)劃,共同創(chuàng)建像My Starbucks Ideas(星巴克客戶意見及創(chuàng)意反饋網(wǎng)站)這樣的產(chǎn)品,以抓牢客戶和供應(yīng)商的心。

  第二代眾包

  在過去的幾年里,眾包已經(jīng)發(fā)展成為一種更務(wù)實(shí)的企業(yè)方法,企業(yè)們進(jìn)行眾包不再是為了共創(chuàng)產(chǎn)品或者提高創(chuàng)造力,而是為了對(duì)他們的人工智能系統(tǒng)進(jìn)行訓(xùn)練。

  谷歌董事長兼長期服務(wù)首席執(zhí)行官Eric Schmidt在2016年表示,下一代谷歌將成為眾包AI公司。他說,如果他想創(chuàng)辦一家新公司,他會(huì)以眾包的形式從眾多專家中獲取數(shù)據(jù),并用于培養(yǎng)具有學(xué)習(xí)能力的人工智能,這些人工智能最終會(huì)變得比任何一位專家都更加優(yōu)秀,然后我們會(huì)將我們的人工智能反過來賣給這些專家。

  還有一些大型企業(yè)利用眾包來提供那些通常由承包商或員工執(zhí)行的服務(wù)。例如,Swisscom收購了眾包平臺(tái)Mila,并將其維護(hù)和維修工作進(jìn)行對(duì)外眾包。該公司似乎還希望通過智能手機(jī)和AR從這些人群中收集數(shù)據(jù),用于培訓(xùn)AI系統(tǒng)來執(zhí)行大部分人工工作。

  那么人群目前來講只是AI的炮灰嗎?

  眾包的關(guān)鍵是外包“微任務(wù)”,這些“微任務(wù)”往往不需要個(gè)人付出太多努力(比如猜測罐子里的硬幣數(shù)額),但當(dāng)這些任務(wù)被眾人執(zhí)行時(shí)卻能帶來真實(shí)的價(jià)值。

  在人工智能的時(shí)代,我們看到了這樣的一個(gè)反差現(xiàn)象:單獨(dú)的個(gè)人數(shù)據(jù)是無用的,但數(shù)千個(gè)的眾人數(shù)據(jù)卻能夠共同創(chuàng)造出真實(shí)價(jià)值。

  但我預(yù)測眾包會(huì)走的更遠(yuǎn)。今天,我們正在利用人群的知識(shí)以對(duì)數(shù)據(jù)進(jìn)行判斷——例如將圖片標(biāo)記為日落或日出。但下一步將是人群自主提供數(shù)據(jù)集,例如,我們可以每天以人工智能系統(tǒng)所需的數(shù)據(jù)格式提供有關(guān)我們自己的健康信息,以便醫(yī)藥公司開發(fā)新藥。比如我曾經(jīng)推薦過的一家強(qiáng)大的非營利性企業(yè),即CancerBase,就正在研究治療癌癥的方法。在下一代眾包中,人群將會(huì)因其提供數(shù)據(jù)而獲得報(bào)酬,或者像CancerBase一樣,人群將會(huì)自愿免費(fèi)提供數(shù)據(jù),以幫助推進(jìn)人類醫(yī)療水平的發(fā)展。

  那么在新一代的眾包背景下,我的“罐中幣”問題會(huì)變成什么樣呢?教授不會(huì)要求學(xué)生對(duì)硬幣的數(shù)量進(jìn)行估計(jì),而是要求他們每個(gè)人從錢包中拍下一組隨機(jī)的硬幣照片。然后,學(xué)生將會(huì)在照片上寫上圖片中的硬幣數(shù)量,并將這張照片發(fā)送到AI應(yīng)用程序,然后該AI就精確地判斷出任何罐子中包含的硬幣數(shù)額。

  歡迎來到一個(gè)嶄新的眾包世界,而我們每個(gè)人都將為眾包提供數(shù)據(jù)。