技術(shù)
導(dǎo)讀:當(dāng)企業(yè)老板們不斷督促人工智能開發(fā)者們加快研發(fā)速度時(shí),這些開發(fā)者們卻發(fā)現(xiàn),他們成了一群看似風(fēng)光卻有苦難言的人。
盡管在年初被區(qū)塊鏈短暫搶占過頭條,但人工智能依然是 2018 年最令科技行業(yè)關(guān)注的領(lǐng)域之一。
當(dāng)然,這種關(guān)注已經(jīng)不再局限于人工智能所能代表的未來遠(yuǎn)景,而聚焦當(dāng)下的具體考量,比如圍繞人工智能落地能力的質(zhì)疑就成為今年諸多創(chuàng)業(yè)公司所面臨的巨大挑戰(zhàn),更進(jìn)一步,盡管過去幾年諸多科技巨頭,如 Google、FB,相繼開放了自己的深度學(xué)習(xí)框架,業(yè)內(nèi)也有不少開源的訓(xùn)練數(shù)據(jù)集,但人工智能開發(fā)者依然處在一個(gè)非常尷尬的階段,當(dāng)企業(yè)老板們不斷督促開發(fā)者們加快研發(fā)速度的時(shí)候,這些開發(fā)者卻發(fā)現(xiàn),他們成了一群看似風(fēng)光卻有苦難言的人。
國外的月亮到底有多圓?
作為當(dāng)下人工智能領(lǐng)域最具代表的女性科學(xué)家,李飛飛常常將「人工智能沒有國界」這句話掛在嘴邊,這句話當(dāng)然沒錯(cuò),但如果考慮到李飛飛是在推廣 Google 深度學(xué)習(xí)開源框架 Tonsorflow 語境下去說這句話,或許我們還應(yīng)該多一點(diǎn)疑問:難道國外的月亮真的那么圓?
我們不可否認(rèn) Tensorflow、Cafe 等國外開源框架給整個(gè)機(jī)器學(xué)習(xí)行業(yè)所帶來的意義,它不僅直接降低了機(jī)器學(xué)習(xí)的門檻,也給了全球人工智能從業(yè)者們幾乎平等接觸新技術(shù)的機(jī)會(huì)。
國外常見的深度學(xué)習(xí)框架
但人工智能遠(yuǎn)不是技術(shù)那么簡單。與過往軟件開發(fā)相比,人工智能開發(fā)首先需要海量的數(shù)據(jù)支撐,這一點(diǎn)行業(yè)內(nèi)的多個(gè)開源數(shù)據(jù)集或許可以解決問題。
其次,有了數(shù)據(jù)之后開始訓(xùn)練模型,這需要強(qiáng)大但必須廉價(jià)的計(jì)算能力,以 Google 力推的 Tensorflow 為例,你當(dāng)然可以在本地進(jìn)行數(shù)據(jù)計(jì)算,但選擇價(jià)格高昂的英偉達(dá) GPU 并非每個(gè)開發(fā)者都能承擔(dān)。那剩下的選擇就只能依靠云端,Google Cloud Plateform 的確擁有強(qiáng)大、靈活、低價(jià)的計(jì)算能力,但考慮 Google Cloud 沒有在國內(nèi)落地,當(dāng)要部署產(chǎn)品時(shí),時(shí)延始終是一個(gè)無解的問題。
再次,即便上述難題都可以解決,Google 、FB 這些等巨頭幾乎無法觸及到中國人工智能開發(fā)者生態(tài)體系,這意味著,除了技術(shù)紅利外,中國的人工智能開發(fā)者們根本得不到資金、接口、測(cè)試環(huán)境、解決方案等層面支持,尤其是中美兩國人工智能開發(fā)、創(chuàng)業(yè)的大環(huán)境有很大差異。因此,中國開發(fā)者們可以利用 Tensorflow 等國外優(yōu)秀的開源的框架快速了解技術(shù)發(fā)展態(tài)勢(shì),但要真正依靠這些框架實(shí)現(xiàn)人工智能開發(fā)的全流程甚至創(chuàng)業(yè)拿融資,幾乎是不可能的事情。
可以信任 BAT 嗎?
歷史上,在美國西部淘金熱中,縱然只有一部分人淘到金,更多淘金者死于人性的貪婪,但卻成就了一批為淘金者提供服務(wù)——如衣服、工具——的公司。
在中國人工智能這場淘金熱中,這些提供服務(wù)的公司也無處不在,比如 BAT。
這些國內(nèi)巨頭天然比 Google、FB 更懂中國市場,他們也能提供更多的資金、資源支撐,但擺在人工智能開發(fā)者以及人工智能創(chuàng)業(yè)公司面前的,卻有兩個(gè)不可回避的矛盾。
其一,與互聯(lián)網(wǎng)領(lǐng)域的創(chuàng)業(yè)類似,如何站隊(duì)以及站在哪一隊(duì)可能是一個(gè)比技術(shù)選項(xiàng)還要困難的選擇題 。特別是騰訊、阿里所信奉的「買賽道」投資邏輯,同時(shí)投資某特定領(lǐng)域的兩家甚至多家公司,這從投資角度來看當(dāng)然是一種最理性的選擇,但對(duì)創(chuàng)業(yè)公司而言,卻是一個(gè)巨大的不確定性。
而在國內(nèi),人工智能創(chuàng)業(yè)幾乎拜托不了 BAT 的陰影,你的人工智能電商產(chǎn)品要么會(huì)被阿里巴巴滅掉,要么歸于騰訊旗下;你的人工智能社交應(yīng)用也需要在阿里和騰訊之間左右逢源才能擁有流量支撐。
其二,對(duì)于廣大中小人工智能開發(fā)者們而言,BAT 看似提供了一系列資金、資源的賦能計(jì)劃,卻也是一種對(duì)于自身產(chǎn)品的營銷宣傳 。比如當(dāng)下基于云端機(jī)器學(xué)習(xí)的產(chǎn)品,BAT 依托自己的公有云平臺(tái)都提供了非常誘人(就是低價(jià))的入門選擇,但就像上文所言,人工智能開發(fā)的鏈條非常長,從模型訓(xùn)練到部署需要不少計(jì)算資源,目前這些云平臺(tái)的計(jì)算資源費(fèi)用依然高舉不下,最終也是轉(zhuǎn)嫁到開發(fā)者們身上。
正因?yàn)榇耍芏嚅_發(fā)者們?yōu)榱斯?jié)約成本智能減少相關(guān)測(cè)試,并快速將產(chǎn)品投入市場,而由于產(chǎn)品功能沒有得到足夠測(cè)試,導(dǎo)致產(chǎn)品體驗(yàn)無法真正得以保證。
人工智能開發(fā)者們到底需要什么?
站在開發(fā)者的角度去看人工智能,首先,能否提供一個(gè)更靈活的硬件環(huán)境,比如芯片的選擇,Google TPU 固然是一個(gè)非常好的產(chǎn)品,但該產(chǎn)品只支持云端訓(xùn)練,而英偉達(dá) GPU 顯然也不是面向最普通的人工智能開發(fā)者群體。
其次,能否提供從模型訓(xùn)練到模型部署的一體化框架。目前的開源框架更多圍繞的是模型訓(xùn)練,而從訓(xùn)練到部署,卻是兩個(gè)完全不同的問題。比如,由數(shù)據(jù)科學(xué)家和機(jī)器學(xué)習(xí)研究人員完成模型構(gòu)建和訓(xùn)練,而部署則由軟件工程師、機(jī)器學(xué)習(xí)工程師和數(shù)據(jù)工程師來完成,再比如,模型訓(xùn)練通常由多人在多臺(tái)虛擬服務(wù)器上完成,而部署模型需要具備擴(kuò)展的能力,能夠處理海量的 API 請(qǐng)求。
第三,可能也是最重要的一點(diǎn),在國內(nèi),除了 BAT 之外,還有誰能提供面向人工智能開發(fā)者的服務(wù)?這不僅需要技術(shù)過硬,還需要擁有強(qiáng)大的品牌效應(yīng),從而快速形成人工智能生態(tài)。
一個(gè)可能的候選者:華為。
長期以來,華為作為一家 IT 硬件廠商,使得其積累了不少硬件研發(fā)經(jīng)驗(yàn),從而具備了在人工智能芯片領(lǐng)域的研發(fā)能力。而如果考慮到這幾年智能手機(jī)上海思麒麟芯片的表現(xiàn),或許我們也可以期待華為在云端人工智能芯片的布局。
另一方面,如上文所言,人工智能開發(fā)鏈條非常長,使得面向開發(fā)者的服務(wù)必須投入巨大的人力、財(cái)力和物力,從這個(gè)角度去看,BAT 之外,也只有華為才能支撐起這樣的巨大投入。
事實(shí)上,上述猜測(cè)也可以從最近華為的一些對(duì)外表態(tài)中得以佐證。在本月初的一次公共活動(dòng)上,華為公司輪值董事長胡厚崑強(qiáng)調(diào),人工智能面向企業(yè)是華為下一步發(fā)展的重點(diǎn)。而再聯(lián)系到今年 4 月時(shí)任華為輪值董事長徐直軍對(duì)今年華為全聯(lián)接大會(huì)的表態(tài),也可以進(jìn)一步證實(shí)一件事:華為的確要在人工智能領(lǐng)域發(fā)力,時(shí)間可能就在 10 月份的全聯(lián)接大會(huì)上!
現(xiàn)在去搜索華為 2018 全聯(lián)接大會(huì)官網(wǎng)可以發(fā)現(xiàn),AI、云儼然是大會(huì)的關(guān)鍵詞,同時(shí)在日程里也可以看到「華為將首發(fā)AI戰(zhàn)略,以全應(yīng)變,敬請(qǐng)期待!」的表述,種種跡象都表明了華為在人工智能領(lǐng)域的布局,以這家公司的體量和行業(yè)號(hào)召力,的確有實(shí)力給人工智能開發(fā)者,尤其是中國人工智能開發(fā)者帶來驚喜。
在不久前舉行的[2018中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)] 上,華為云 BU 總裁鄭葉來提出了{(lán)華為云 普惠AI}的概念,提倡要讓 AI 高而不貴,讓所有企業(yè)用戶用得起、用得好、用得放心。而這大概也是華為發(fā)力全棧AI戰(zhàn)略的初衷吧。但到底如何解決困擾人工智能開發(fā)過程中的難題和痛點(diǎn),我們只能拭目以待了。
寫在最后:開發(fā)者的黃金時(shí)代正在到來
表面看起來,歷次技術(shù)革命所帶來是工具革新,但背后的真正驅(qū)動(dòng)力卻是人,或者準(zhǔn)確地說,是掌握新工具的人,這個(gè)規(guī)律在人工智能時(shí)代也適用。
我們看到了Google、微軟在開源項(xiàng)目上的巨大投入,我們也目睹了 BAT 為爭奪開發(fā)者們關(guān)注的激烈角逐,但一場場以「開發(fā)者」名義的大會(huì)背后,卻并沒有給人工智能開發(fā)者們帶來可以真正解決問題的工具,他們依然缺乏資金、依然在不同工具之間切換、依然擔(dān)心巨頭們誘人項(xiàng)目背后的套路,這遠(yuǎn)不是人工智能發(fā)展的理想狀態(tài)。
可喜的是,上述這些障礙和困境也正在被解決。上月的 Google Cloud Next 大會(huì)上,Google 發(fā)布了面向終端機(jī)器學(xué)習(xí)的芯片 TPU Edge,意圖也是打通云到端的機(jī)器學(xué)習(xí)。以當(dāng)下這個(gè)時(shí)間節(jié)點(diǎn)去看,2018 年接下來的日子里,包括 NIPS、IEEE ICDM 等重磅人工智能學(xué)術(shù)會(huì)議還將悉數(shù)登場,而華為 10 月份的全聯(lián)接大會(huì),在一系列預(yù)熱之后,也勢(shì)必成為人工智能開發(fā)者、研究者們需要重點(diǎn)關(guān)注的會(huì)議,屬于人工智能開發(fā)者的黃金時(shí)代正在到來。