阿裡未給過達摩院清晰定義,但達摩院或將重新定義阿裡
文|莊洲
2008年,馬雲邀請後來的阿裡雲創始人王堅從微軟亞洲研究院加入阿裡時,抱有一個夙願:在阿裡打造一個彙集頂尖技術人才的研究院。這個研究院,不應該僅僅服務於商業,它更應該在某種程度上引領技術的浪潮。
後來的故事是,阿裡研究院沒做成,日後領跑中國雲計算行業的阿裡雲誕生了。
2014年,阿裡巴巴在紐交所上市,阿裡雲跨過生死線,“研究院”的設想被重提議程。這次,在王堅的推動下,達摩院前身、專注於數據科學的iDST(institute of Data Science & Technologies,數據科學與技術研究院)於硅谷成立。
2017年,隨著阿裡啟動技術大中臺戰略,馬雲經深思熟慮認為阿裡巴巴已經“ready”,決定成立包容更多領域的研究院,同時為其命名“達摩院”。歷經近10年,跨越三次關鍵節點,阿裡做技術研究院的執念得以實現。此時阿裡已攢下一些家當,對達摩院“3年1000億”的投入規劃,比初創阿裡雲時“堅持10年每年投10億”更加大手筆。
3年多過去,已在全球8個地區設立研究中心、網羅了30多位海內外高校教授及10多位IEEE Fellow級科學家的達摩院,堪稱全阿裡最燒錢的部門,或許也是中國最燒錢的企業研究院之一。其佈局囊括AI、芯片、量子計算、自動駕駛、5G等需長期重投入的前沿領域。
2月2日,阿裡發佈2021財年第三季度財報,成立12年後,阿裡雲守得雲開見月明,首次扭虧為盈。阿裡巴巴上個10年最大的技術押注已見分曉,而這個10年最大的技術押注才拉開序幕。在財報分析師電話會上,阿裡巴巴董事會主席兼首席執行官張勇表示“將對達摩院加大投入”。三年裡,阿裡對達摩院的投入一直在加碼。相關信息源顯示,達摩院量子計算團隊正在杭州夢想小鎮建設第二個硬件實驗室,以增強量子芯片製備和測試能力,縮短研發週期,擴大創新空間。
從成立之初,達摩院即被阿裡寄予厚望:一是支撐阿裡業務發展,二是使阿裡巴巴成為國際科技創新的領軍力量,此外,它還要活得比阿裡巴巴更久。這無疑是一個極具挑戰的願景。3年裡,積聚了大量科研牛人與資金的達摩院,是否已如期望的那樣燎原了阿裡的技術之火?
我們梳理了達摩院三年來的成果、路線及佈局,試圖勾勒其何去何從。
第三條路徑
基因與土壤,註定了達摩院不會復刻傳統企業研究院的發展模式。
成立儀式上,馬雲對達摩院未來的路怎麼走並無確切答案。但有一點他很肯定,研究院研而不發,純粹地“research for fun”,不可能長久;純粹地“research for profit”,不致力於解決社會問題,更不可能長久。
達摩院要尋找的應該是第三條路徑:“Research for solving the problem with profit and fun”。
達摩院相當一部分科學家來自象牙塔般的高校。但經歷長期的理論研究後,他們都向往著“硬幣的另一面”:從在學術界探索“無用之美”,到在工業界創造“有用之美”。
加入阿裡前,施堯耘為密歇根大學安娜堡分校終身教授,是美國計算機系裡第一個以量子計算論文博士畢業,並靠此拿到終身制教職的科學家。“我做了20多年量子信息科學的理論研究,今後如果也能為量子計算的實現作出貢獻,我覺得自己的研究生涯就完整了。”施堯耘如此解釋他熱情投身阿裡巴巴的原因。他創立並領導的達摩院量子實驗室,以實現量子計算的潛能為目標。
在大規模的招兵買馬後,達摩院創造了什麼?通過公開資料,我們整理了3年來達摩院發佈的重大成果:
如果拆解達摩院大部分領域技術研發的路線,會發現一個規律:技術往往從難處入手,而落地則從下沉場景入手。
自動駕駛是一個典型領域。成立3週年之際,達摩院自動駕駛實驗室對外發布的重磅成果,不是酷炫的demo版無人駕駛乘用車,而是即將大規模商用的末端物流車“小蠻驢”。
與名字一樣樸實,小蠻驢的主要功能是給消費者送貨。背後易被忽略的事實是:小蠻驢實際集成了最前沿的人工智能和L4級別自動駕駛技術,能在0.01秒內同時預判上百行人與車輛的意圖進行避障,其行駛的人機混合場景,複雜度已超越高速公路等結構化道路。
小蠻驢成本的降低源於技術上的創新突破:一是改進了包含激光雷達等昂貴傳感器在內的感知體系,比如,達摩院自研的感知算法,實現了對低線束激光雷達的高線束模擬;二是自研嵌入式計算平臺,定製了高性能、低成本和低功耗的計算單元;三是深度定製了包括運動底盤在內的硬件設備,實現了軟硬件高度一體化。
自動駕駛實驗室負責人王剛,放棄新加坡南洋理工大學終身教職加入阿裡後,曾帶著團隊在阿裡園區中長時間訓練無人駕駛乘用車,但最終選擇先從末端物流場景切入。因為這一場景能較快落地,適合在真實環境中快速迭代技術,同時其有相當廣泛的應用前景,不僅對阿裡電商業務有支撐作用,還有望應對服務行業勞動力不足的社會問題。
達摩院機器智能實驗室負責人金榕,曾列舉團隊最令他振奮的三大底層技術突破:
一是自然語言處理領域,翻譯團隊打造出AliTranX國際化多語言基礎設施,自研模型用一套框架實現了214種語言之間多領域的任意轉譯,過去按傳統技術需為每個領域研發214*213種模型;
二是語音領域,達摩院研發出大小不到40MB的SAN-M-SCAMA語音識別系統,可離線部署在移動端,識別效果媲美超過100GB的雲端系統;
三是數學規劃求解器領域,這是一項典型的“卡脖子”技術,國外頭部公司已有近三十年技術積累,達摩院自主研發的求解器MindOpt,連續兩年在國際權威測評榜單中獲得單純形法測試第一,今年其對線性規劃問題的求解速度達到每題40秒,刷新了去年84.3秒的成績。
達摩院在語言、語音、求解器等幾大AI基礎技術領域的路徑選擇,同樣符合技術高打、場景下沉的務實路線。據瞭解,翻譯技術首先應用於被稱為國際版淘寶的速賣通平臺(ALiExpress),幫助連接上億海內外賣家、買家,數月前速賣通實現了全球首場翻譯直播,同時,技術已向眾多跨境電商、教育企業開放,日均調用量超13億次;端上語音系統,首先應用於高德,方便上億用戶在隧道等離線環境中持續使用語音導航,技術同步通過阿裡雲向社會開放;求解器技術最早用於解決阿裡雲計算資源調度難題,此後被應用於新零售、新制造、智能物流等多個場景,不久前MindOpt成為國內首個免費開放的商用求解器。
硬幣的另一面,產出結果看起來沒那麼浪漫,產出過程又充滿艱苦、繁瑣的工程工作。但置身其中的金榕還是發掘出了強烈的技術美感:從214*213種模型,到萬模歸一;從100GB的系統,到40MB的系統;從84.3秒的求解速度,到40秒……每一個數字產生微小變化,都意味著技術一步步被淬鍊至極致。
一位達摩院人士表示,達摩院與普通研發部門最大的不同是,在這裡,技術是為了場景,但場景又是為了實現技術的極簡與優美。業務價值是途徑,而不是目的地。
這似乎是平衡技術理想與業務探索的一條可行路徑。
戰略、佈局與週期
儘管達摩院的技術目標是為了“有用之美”,但如仔細觀察,會發現其實驗室設置涵蓋了將在長、中、短期內擁有應用前景的技術。這一佈局,顯然為了讓達摩院既能搶佔技術高地,又能穿越技術週期。
近幾年,阿裡對量子計算、芯片等長週期領域不斷加大投入,但在一個商業上極其成功的公司,從事可能長期看不到落地可能的研究工作,仍頗具壓力。量子實驗室負責人施堯耘常被人問起,“如何說服行癲(阿裡雲智能總裁、達摩院院長張建鋒)做量子計算?”看起來,阿裡巴巴的主營電商業務,與仍被巨大不確定性縈繞的量子研究,相去甚遠。
(達摩院量子實驗室,研究人員正在調試量子計算設備)
“不是我說服行癲,是他把我招過來的,是他要做量子計算的。” 施堯耘說,“戰略決斷是我最佩服行癲的地方。”
在一次內部業務會上,張建鋒曾同下屬們討論技術戰略,他說,“什麼是戰略?戰略就是讓你有恐懼感的問題,比如量子計算。”讓他有恐懼感的一個場景是,“有一天,阿裡巴巴買再多的服務器、芯片,都算不過一臺量子計算機。”
儘管得到張建鋒的大力支持,施堯耘還是經常受到內外的質疑,特別是“為什麼阿裡巴巴要做量子計算?”他一開始嘗試以很嚴密的邏輯來論證,比如從“算力是阿裡的核心競爭力”,推導出阿裡必須做量子計算。後來,隨著對“真實世界”體感的加深,他不再堅持這樣“義正嚴辭”的論證。“我現在覺得阿裡巴巴也不是說必須要做量子計算,因為做有做的活法,不做有不做的活法。就像我們每天面臨的很多事情一樣,這是一個選擇的問題。But our choices decide who we are(選擇決定了我們成為什麼人。)”
在施堯耘看來,這個選擇就像“一面鏡子”,照出公司管理層是否真有決心做長期的科研投入。在更長的週期內,這個選擇將“決定阿裡巴巴會成為什麼”。達摩院成立前,張建鋒已想好要開創阿裡自己的量子研究,“yes or no”的問題解決了,但“how”的問題被移棒給了施堯耘。
經歷了一段時間的摸索,施堯耘的思路逐漸清晰。目前,整個項目以研究超導硬件為核心,其路線的選擇不盲目跟風,與主流形成差異化:在最基本的元件即量子比特上採取和領先團隊不同的比特類型,並且優先提升小系統的質量(“高精度”),再逐步擴大系統的規模(“多比特”)。
這一抉擇將繼續考驗阿裡巴巴高層和量子團隊的“定力”。3年前,施堯耘曾表示,量子計算機離商業化還需十年;此後幾年中,他仍說還需十年。對此他解釋,十年是一個“虛數”,有兩層意思:“It’s not immediate, but it’s not impossible, either(不是馬上,但也不是不可能)。”
發現新材料可能是量子計算最早的商業應用之一。施堯耘曾制定一個以經典計算進軍計算材料科學,並逐漸過渡到使用量子計算的規劃。向張建鋒彙報的時候,他覺得這個計劃雖不能一開始就“養活”自己,至少是一條清晰的商業化道路,他特意強調,“也許很快就可以有收入”。張建鋒明確答覆,“你別想掙錢的事,要聚焦,集中精力做好研究。”此後,施堯耘愉快地將商業宏圖束之高閣,兩方達成聚焦基礎研究的默契。
施堯耘視量子實驗室的事業為“長徵”,基於長期基礎研究項目來打造團隊文化和內部制度。他給團隊自由的學術氛圍,大家像在學校裡一樣腦暴、做實驗、發論文、組織和參加各類學術會議和講座;但同時施堯耘又致力打造一支“學術鐵軍”:各個時間點的目標要十分明確,執行方案要充分論證和對焦,方法強調系統性,而業績的評定要做到嚴謹公正,獎罰分明。
做芯片是達摩院探索前沿技術的另一場長徵。2018年,達摩院成立一年之際,阿裡將同年收購的中天微系統有限公司與達摩院自研芯片業務整合,成立平頭哥半導體公司。時隔一年,平頭哥再次出現在公眾視野之中,接連發布了業界性能最強的RISC-V處理器玄鐵910、阿裡巴巴第一顆自研芯片含光800。此後,平頭哥兩年少有對外發聲。據瞭解,平頭哥團隊除研發芯片產品外,在芯片底層技術研究上也已走在行業前列。其團隊研發的新型存算一體架構正在攻克性能牆、內存牆、摩爾定律趨緩等歷史遺留難題,有望大幅提升芯片性能。
(2019年9月25日,在杭州雲棲大會上,張建鋒宣佈阿裡巴巴發佈第一顆芯片)
對達摩院的傾力投入至今,已給阿裡巴巴技術體系帶來哪些變量?
3年時間不足以下結論,但至少有幾條線索可以管中窺豹:
一是,在計算領域儲備了包含芯片、量子計算等具備顛覆性算力的下一代技術,同時對芯片、量子超導硬件的研發,帶領阿裡進入此前極少涉足的高精尖硬件領域。
二是,在人工智能領域搭建了包含語言、語音、視覺、決策智能等技術在內的完整佈局,煥新了阿裡巴巴內部業務,同時這些技術以阿裡雲為底座對外輸出,拓展了阿裡的業務範疇。
三是,融匯打通了阿裡巴巴的前沿技術,為創造技術新物種提供了可能性,比如孵化集大成的自動駕駛、機器人產品。
施堯耘跟張勇交流時,有一點讓他印象深刻,張勇說,“你不要問我阿裡巴巴想做什麼,你就是阿裡巴巴。”
達摩院成立之初,阿裡巴巴未給它清晰定義,但在達摩院不斷演變的過程中,它或將重新定義阿裡巴巴。
活得比阿裡巴巴更久
一個企業研究院,要想活得比母體更久,唯一的辦法是:離開母體的庇廕,對更廣闊的社會直接創造價值。
在初步自證野心與能力後,達摩院向外生長的速度正不斷加快。
3年多時間裡,達摩院發佈了超過1000篇國際學術論文,取得了60多項國際學術競賽第一。而完成理論-論文-專利的傳統研究階段後,達摩院的技術團隊往往會迅速尋找應用場景,許多業務場景阿裡巴巴過去未曾涉足。
疫情期間,達摩院AI技術在醫療領域展現出極強爆發力:1月底,達摩院利用其自然語言處理、語音AI能力,連夜研發出智能疫情機器人,免費為全國57 座城市撥打1600 萬通防控摸排電話;2月1日,達摩院與浙江省疾控中心合作,利用AI 算法,將疑似病例基因分析時間縮至半小時;2月15日,達摩院研發的新冠 CT 影像AI診斷系統,在鄭州小湯山醫院上線,20 秒即可判讀疑似患者影像,準確率高達 99%。
(醫護人員使用達摩院AI識別新冠肺炎病例CT)
在城市大腦、工業、農業、遙感等領域,達摩院也成功深入行業。最新報道顯示,達摩院城市大腦相關技術已落地全球數十個城市;工業AI團隊研發了廢鋼AI定級系統,對廢鋼的定級準確率達95%,扣重準確率達90%;去年汛情期間,達摩院遙感AI團隊開發出防汛水體識別算法,協助水利部完成了262個臨河房屋識別任務、149個水體識別任務。
搭建開源、開放的研究合作生態,是達摩院向外自我延展的另一種方式。
即便在最前沿的技術領域,達摩院也並不吝於第一時間向學術界及工業界分享研究成果。據瞭解,在芯片領域,平頭哥已開源包含玄鐵處理器、基礎接口、開發環境等在內的MCU平臺;在量子領域,量子實驗室開源了自研量子計算模擬器“太章2.0”及一系列量子應用案例;在認知智能領域,智能計算實驗室開源了超大規模分佈式圖計算平臺GraphScope。
平頭哥副總裁孟建熠認為,開源一方面回饋了全球技術社區,一方面給了阿裡與其他技術夥伴快速協同的機會。基於玄鐵處理器和AI算法,平頭哥和國內藍牙芯片廠商中科藍訊共同設計了新一代智能語音芯片,降低了芯片研發週期及成本投入。
在過去3年中,達摩院還構建起了龐大的學術合作網絡。自2018年起,達摩院發起了“青橙獎”,該獎項每年評選10位中國青年學者,為其提供人均100萬元獎金及全方位學術支持,此後還發起了阿裡巴巴三大學術合作項目(AIR、ARF、ATP),資助前沿性的研究、為學者提供阿裡訪學機會,並與高校聯合培養博士生等人才。
數據顯示,通過以上項目,達摩院已與20多個國家的140多所高校及科研院所建立起合作,其合作項目超800個,合作學者超過450人,聯合培養博士生及博士後達到120多人。該速度不亞於國內外一流學術機構。
但在達摩院機器智能實驗室負責人金榕看來,達摩院前3年最重要的成就,不是研究成果,也不是應用落地,而是找到了“把技術變成生產力”的方法。
“以前,科學家在企業裡,就像一個參謀,介紹一些前沿技術,然後企業可以對這個技術有所投入。但要把技術變成生產力,中間有非常多的鴻溝和大坑,這其中需要理論突破,也需要應用創新,將已相對成熟的技術和場景結合起來,不斷迭代優化。”金榕認為,“達摩院非常幸運,過去幾年,我們花了很多力氣,找到了這種方法。”
在一場內部分享會上,金榕對臺下的同事們總結,“對一個研究機構來說,3年很短,我們還沒有創造了不起的事情,但為將來創造‘了不起’的事情建立了基礎。”
同時,他也認為,今天到了一個新的時間點。“每個人都有這樣的願望,多年以後問自己,我究竟留下了什麼代表作?接下來就是每個人挑戰自己的技術極限,做出真正炫酷的技術。”
轉載請超鏈接註明:頭條資訊 » 行業觀察|達摩院三年,阿裡巴巴更懂技術了嗎?
免責聲明 :非本網註明原創的信息,皆為程序自動獲取互聯網,目的在於傳遞更多信息,並不代表本網贊同其觀點和對其真實性負責;如此頁面有侵犯到您的權益,請給站長發送郵件,並提供相關證明(版權證明、身份證正反面、侵權鏈接),站長將在收到郵件24小時內刪除。