協(xié)會(huì )官方微信

首頁(yè)  >>  新聞資訊  >>  行業(yè)動(dòng)態(tài)  >>  正文

中國工程院院士孫凝暉給正國級、副國級講課的萬(wàn)字長(cháng)稿
《人工智能與智能計算的發(fā)展》

發(fā)布時(shí)間:2024-6-3     來(lái)源:中國人大網(wǎng)    編輯:衡盛楠    審核:張經(jīng)緯 王靜


委員長(cháng)、各位副委員長(cháng)、秘書(shū)長(cháng)、各位委員:

人工智能領(lǐng)域近年來(lái)正在迎來(lái)一場(chǎng)由生成式人工智能大模型引領(lǐng)的爆發(fā)式發(fā)展。20221130日,OpenAI公司推出一款人工智能對話(huà)聊天機器人ChatGPT,其出色的自然語(yǔ)言生成能力引起了全世界范圍的廣泛關(guān)注,2個(gè)月突破1億用戶(hù),國內外隨即掀起了一場(chǎng)大模型浪潮,Gemini、文心一言、Copilot、LLaMA、SAM、SORA等各種大模型如雨后春筍般涌現,2022年也被譽(yù)為大模型元年。當前信息時(shí)代正加快進(jìn)入智能計算的發(fā)展階段,人工智能技術(shù)上的突破層出不窮,逐漸深入地賦能千行百業(yè),推動(dòng)人工智能與數據要素成為新質(zhì)生產(chǎn)力的典型代表。習近平總書(shū)記指出,把新一代人工智能作為推動(dòng)科技跨越發(fā)展、產(chǎn)業(yè)優(yōu)化升級、生產(chǎn)力整體躍升的驅動(dòng)力量,努力實(shí)現高質(zhì)量發(fā)展。黨的十八大以來(lái),以習近平同志為核心的黨中央高度重視智能經(jīng)濟發(fā)展,促進(jìn)人工智能和實(shí)體經(jīng)濟深度融合,為高質(zhì)量發(fā)展注入強勁動(dòng)力。

一、計算技術(shù)發(fā)展簡(jiǎn)介

計算技術(shù)的發(fā)展歷史大致可分為四個(gè)階段,算盤(pán)的出現標志著(zhù)人類(lèi)進(jìn)入第一代——機械計算時(shí)代,第二代——電子計算的標志是出現電子器件與電子計算機,互聯(lián)網(wǎng)的出現使我們進(jìn)入第三代——網(wǎng)絡(luò )計算,當前人類(lèi)社會(huì )正在進(jìn)入第四階段——智能計算。

早期的計算裝置是手動(dòng)輔助計算裝置和半自動(dòng)計算裝置,人類(lèi)計算工具的歷史是從公元1200年的中國算盤(pán)開(kāi)始,隨后出現了納皮爾籌(1612年)和滾輪式加法器(1642年),到1672年第一臺自動(dòng)完成四則運算的計算裝置——步進(jìn)計算器誕生了。

機械計算時(shí)期已經(jīng)出現了現代計算機的一些基本概念。查爾斯巴貝奇(Charles Babbage)提出了差分機(1822年)與分析機(1834年)的設計構想,支持自動(dòng)機械計算。這一時(shí)期,編程與程序的概念基本形成,編程的概念起源于雅卡爾提花機,通過(guò)打孔卡片控制印花圖案,最終演變?yōu)橥ㄟ^(guò)計算指令的形式來(lái)存儲所有數學(xué)計算步驟;人類(lèi)歷史的第一個(gè)程序員是詩(shī)人拜倫之女艾達(Ada),她為巴貝奇差分機編寫(xiě)了一組求解伯努利數列的計算指令,這套指令也是人類(lèi)歷史上第一套計算機算法程序,它將硬件和軟件分離,第一次出現程序的概念。

直到在二十世紀上半葉,出現了布爾代數(數學(xué))、圖靈機(計算模型) 、馮諾依曼體系結構(架構) 、晶體管(器件)這四個(gè)現代計算技術(shù)的科學(xué)基礎。其中,布爾代數用來(lái)描述程序和硬件如CPU的底層邏輯;圖靈機是一種通用的計算模型,將復雜任務(wù)轉化為自動(dòng)計算、不需人工干預的自動(dòng)化過(guò)程;馮諾依曼體系結構提出了構造計算機的三個(gè)基本原則:采用二進(jìn)制邏輯、程序存儲執行、以及計算機由運算器、控制器、存儲器、輸入設備、輸出設備這五個(gè)基本單元組成;晶體管是構成基本的邏輯電路和存儲電路的半導體器件,是建造現代計算機之塔的磚塊?;谝陨峡茖W(xué)基礎,計算技術(shù)得以高速發(fā)展,形成規模龐大的產(chǎn)業(yè)。

1946年世界上第一臺電子計算機ENIAC誕生到二十一世紀的今天,已經(jīng)形成了五類(lèi)成功的平臺型計算系統。當前各領(lǐng)域各種類(lèi)型的應用,都可以由這五類(lèi)平臺型計算裝置支撐。第一類(lèi)是高性能計算平臺,解決了國家核心部門(mén)的科學(xué)與工程計算問(wèn)題;第二類(lèi)是企業(yè)計算平臺,又稱(chēng)服務(wù)器,用于企業(yè)級的數據管理、事務(wù)處理,當前像百度、阿里和騰訊這些互聯(lián)網(wǎng)公司的計算平臺都屬于這一類(lèi);第三類(lèi)是個(gè)人電腦平臺,以桌面應用的形式出現,人們通過(guò)桌面應用與個(gè)人電腦交互;第四類(lèi)是智能手機,主要特點(diǎn)是移動(dòng)便攜,手機通過(guò)網(wǎng)絡(luò )連接數據中心,以互聯(lián)網(wǎng)應用為主,它們分布式地部署在數據中心和手機終端;第五類(lèi)是嵌入式計算機,嵌入到工業(yè)裝備和軍事設備,通過(guò)實(shí)時(shí)的控制,保障在確定時(shí)間內完成特定任務(wù)。這五類(lèi)裝置幾乎覆蓋了我們信息社會(huì )的方方面面,長(cháng)期以來(lái)人們追求的以智能計算應用為中心的第六類(lèi)平臺型計算系統尚未形成。

現代計算技術(shù)的發(fā)展大致可以劃分為三個(gè)時(shí)代。IT1.0又稱(chēng)電子計算時(shí)代(1950-1970),基本特征是以為中心。計算技術(shù)的基本架構形成,隨著(zhù)集成電路工藝的進(jìn)步,基本計算單元的尺度快速微縮,晶體管密度、計算性能和可靠性不斷提升,計算機在科學(xué)工程計算、企業(yè)數據處理中得到了廣泛應用。

IT2.0又稱(chēng)網(wǎng)絡(luò )計算時(shí)代(1980-2020),以為中心?;ヂ?lián)網(wǎng)將人使用的終端與后臺的數據中心連接,互聯(lián)網(wǎng)應用通過(guò)智能終端與人進(jìn)行交互。以亞馬遜等為代表的互聯(lián)網(wǎng)公司提出了云計算的思想,將后臺的算力封裝成一個(gè)公共服務(wù)租借給第三方用戶(hù),形成了云計算與大數據產(chǎn)業(yè)。

IT3.0又稱(chēng)智能計算時(shí)代,始于2020年,與IT2.0相比增加了的概念,即物理世界的各種端側設備,被數字化、網(wǎng)絡(luò )化和智能化,實(shí)現--三元融合。智能計算時(shí)代,除了互聯(lián)網(wǎng)以外,還有數據基礎設施,支撐各類(lèi)終端通過(guò)端邊云實(shí)現萬(wàn)物互聯(lián),終端、物端、邊緣、云都嵌入AI,提供與ChatGPT類(lèi)似的大模型智能服務(wù),最終實(shí)現有計算的地方就有AI智能。智能計算帶來(lái)了巨量的數據、人工智能算法的突破和對算力的爆發(fā)性需求。

二、智能計算發(fā)展簡(jiǎn)介

智能計算包括人工智能技術(shù)與它的計算載體,大致歷經(jīng)了四個(gè)階段,分別為通用計算裝置、邏輯推理專(zhuān)家系統、深度學(xué)習計算系統、大模型計算系統。

智能計算的起點(diǎn)是通用自動(dòng)計算裝置(1946年)。艾倫·圖靈(Alan Turing)和馮·諾依曼(John von Neumann)等科學(xué)家,一開(kāi)始都希望能夠模擬人腦處理知識的過(guò)程,發(fā)明像人腦一樣思考的機器,雖未能實(shí)現,但卻解決了計算的自動(dòng)化問(wèn)題。通用自動(dòng)計算裝置的出現,也推動(dòng)了1956年人工智能(AI)概念的誕生,此后所有人工智能技術(shù)的發(fā)展都是建立在新一代計算設備與更強的計算能力之上的。

智能計算發(fā)展的第二階段是邏輯推理專(zhuān)家系統(1990年)。E.A.費根鮑姆(Edward Albert Feigenbaum)等符號智能學(xué)派的科學(xué)家以邏輯和推理能力自動(dòng)化為主要目標,提出了能夠將知識符號進(jìn)行邏輯推理的專(zhuān)家系統。人的先驗知識以知識符號的形式進(jìn)入計算機,使計算機能夠在特定領(lǐng)域輔助人類(lèi)進(jìn)行一定的邏輯判斷和決策,但專(zhuān)家系統嚴重依賴(lài)于手工生成的知識庫或規則庫。這類(lèi)專(zhuān)家系統的典型代表是日本的五代機和我國863計劃支持的306智能計算機主題,日本在邏輯專(zhuān)家系統中采取專(zhuān)用計算平臺和Prolog這樣的知識推理語(yǔ)言完成應用級推理任務(wù);我國采取了與日本不同的技術(shù)路線(xiàn),以通用計算平臺為基礎,將智能任務(wù)變成人工智能算法,將硬件和系統軟件都接入通用計算平臺,并催生了曙光、漢王、科大訊飛等一批骨干企業(yè)。

符號計算系統的局限性在于其爆炸的計算時(shí)空復雜度,即符號計算系統只能解決線(xiàn)性增長(cháng)問(wèn)題,對于高維復雜空間問(wèn)題是無(wú)法求解的,從而限制了能夠處理問(wèn)題的大小。同時(shí)因為符號計算系統是基于知識規則建立的,我們又無(wú)法對所有的常識用窮舉法來(lái)進(jìn)行枚舉,它的應用范圍就受到了很大的限制。隨著(zhù)第二次AI寒冬的到來(lái),第一代智能計算機逐漸退出歷史舞臺。

直到2014年左右,智能計算進(jìn)階到第三階段——深度學(xué)習計算系統。以杰弗里·辛頓(Geoffrey Hinton)等為代表的連接智能學(xué)派,以學(xué)習能力自動(dòng)化為目標,發(fā)明了深度學(xué)習等新AI算法。通過(guò)深度神經(jīng)元網(wǎng)絡(luò )的自動(dòng)學(xué)習,大幅提升了模型統計歸納的能力,在模式識別等應用效果上取得了巨大突破,某些場(chǎng)景的識別精度甚至超越了人類(lèi)。以人臉識別為例,整個(gè)神經(jīng)網(wǎng)絡(luò )的訓練過(guò)程相當于一個(gè)網(wǎng)絡(luò )參數調整的過(guò)程,將大量的經(jīng)過(guò)標注的人臉圖片數據輸入神經(jīng)網(wǎng)絡(luò ),然后進(jìn)行網(wǎng)絡(luò )間參數調整,讓神經(jīng)網(wǎng)絡(luò )輸出的結果的概率無(wú)限逼近真實(shí)結果。神經(jīng)網(wǎng)絡(luò )輸出真實(shí)情況的概率越大,參數就越大,從而將知識和規則編碼到網(wǎng)絡(luò )參數中,這樣只要數據足夠多,就可以對各種大量的常識進(jìn)行學(xué)習,通用性得到極大的提升。連接智能的應用更加廣泛,包括語(yǔ)音識別、人臉識別、自動(dòng)駕駛等。在計算載體方面,中國科學(xué)院計算技術(shù)研究所2013年提出了國際首個(gè)深度學(xué)習處理器架構,國際知名的硬件廠(chǎng)商英偉達(NVIDIA)持續發(fā)布了多款性能領(lǐng)先的通用GPU芯片,都是深度學(xué)習計算系統的典型代表。

智能計算發(fā)展的第四階段是大模型計算系統(2020年)。在人工智能大模型技術(shù)的推動(dòng)下,智能計算邁向新的高度。2020年,AI小模型+判別式轉向大模型+生成式,從傳統的人臉識別、目標檢測、文本分類(lèi),升級到如今的文本生成、3D數字人生成、圖像生成、語(yǔ)音生成、視頻生成。大語(yǔ)言模型在對話(huà)系統領(lǐng)域的一個(gè)典型應用是OpenAI公司的ChatGPT,它采用預訓練基座大語(yǔ)言模型GPT-3,引入3000億單詞的訓練語(yǔ)料,相當于互聯(lián)網(wǎng)上所有英語(yǔ)文字的總和。其基本原理是:通過(guò)給它一個(gè)輸入,讓它預測下一個(gè)單詞來(lái)訓練模型,通過(guò)大量訓練提升預測精確度,最終達到向它詢(xún)問(wèn)一個(gè)問(wèn)題,大模型產(chǎn)生一個(gè)答案,與人即時(shí)對話(huà)。在基座大模型的基礎上,再給它一些提示詞進(jìn)行有監督的指令微調,通過(guò)人類(lèi)的<指令,回復>對逐漸讓模型學(xué)會(huì )如何與人進(jìn)行多輪對話(huà);最后,通過(guò)人為設計和自動(dòng)生成的獎勵函數來(lái)進(jìn)行強化學(xué)習迭代,逐步實(shí)現大模型與人類(lèi)價(jià)值觀(guān)的對齊。

大模型的特點(diǎn)是以取勝,其中有三層含義,(1)參數大,GPT-3就有1700億個(gè)參數;(2)訓練數據大,ChatGPT大約用了3000億個(gè)單詞,570GB訓練數據;(3)算力需求大,GPT-3大約用了上萬(wàn)塊V100 GPU進(jìn)行訓練。為滿(mǎn)足大模型對智能算力爆炸式增加的需求,國內外都在大規模建設耗資巨大的新型智算中心,英偉達公司也推出了采用256個(gè)H100芯片,150TB海量GPU內存等構成的大模型智能計算系統。

大模型的出現帶來(lái)了三個(gè)變革。一是技術(shù)上的規模定律(Scaling Law),即很多AI模型的精度在參數規模超過(guò)某個(gè)閾值后模型能力快速提升,其原因在科學(xué)界還不是非常清楚,有很大的爭議。AI模型的性能與模型參數規模、數據集大小、算力總量三個(gè)變量成對數線(xiàn)性關(guān)系,因此可以通過(guò)增大模型的規模來(lái)不斷提高模型的性能。目前最前沿的大模型GPT-4參數量已經(jīng)達到了萬(wàn)億到十萬(wàn)億量級,并且仍在不斷增長(cháng)中;二是產(chǎn)業(yè)上算力需求爆炸式增長(cháng),千億參數規模大模型的訓練通常需要在數千乃至數萬(wàn)GPU卡上訓練2-3個(gè)月時(shí)間,急劇增加的算力需求帶動(dòng)相關(guān)算力企業(yè)超高速發(fā)展,英偉達的市值接近兩萬(wàn)億美元,對于芯片企業(yè)以前從來(lái)沒(méi)有發(fā)生過(guò);三是社會(huì )上沖擊勞動(dòng)力市場(chǎng),北京大學(xué)國家發(fā)展研究院與智聯(lián)招聘聯(lián)合發(fā)布的《AI大模型對我國勞動(dòng)力市場(chǎng)潛在影響研究》報告指出,受影響最大的20個(gè)職業(yè)中財會(huì )、銷(xiāo)售、文書(shū)位于前列,需要與人打交道并提供服務(wù)的體力勞動(dòng)型工作,如人力資源、行政、后勤等反而相對更安全。

人工智能的技術(shù)前沿將朝著(zhù)以下四個(gè)方向發(fā)展。第一個(gè)前沿方向為多模態(tài)大模型。從人類(lèi)視角出發(fā),人類(lèi)智能是天然多模態(tài)的,人擁有眼、耳、鼻、舌、身、嘴(語(yǔ)言),從AI視角出發(fā),視覺(jué),聽(tīng)覺(jué)等也都可以建模為token②的序列,可采取與大語(yǔ)言模型相同的方法進(jìn)行學(xué)習,并進(jìn)一步與語(yǔ)言中的語(yǔ)義進(jìn)行對齊,實(shí)現多模態(tài)對齊的智能能力。

第二個(gè)前沿方向為視頻生成大模型。OpenAI2024215日發(fā)布文生視頻模型SORA,將視頻生成時(shí)長(cháng)從幾秒鐘大幅提升到一分鐘,且在分辨率、畫(huà)面真實(shí)度、時(shí)序一致性等方面都有顯著(zhù)提升。SORA的最大意義是它具備了世界模型的基本特征,即人類(lèi)觀(guān)察世界并進(jìn)一步預測世界的能力。世界模型是建立在理解世界的基本物理常識(如,水往低處流等)之上,然后觀(guān)察并預測下一秒將要發(fā)生什么事件。雖然SORA要成為世界模型仍然存在很多問(wèn)題,但可以認為SORA學(xué)會(huì )了畫(huà)面想象力和分鐘級未來(lái)預測能力,這是世界模型的基礎特征。

第三個(gè)前沿方向為具身智能。具身智能指有身體并支持與物理世界進(jìn)行交互的智能體,如機器人、無(wú)人車(chē)等,通過(guò)多模態(tài)大模型處理多種傳感數據輸入,由大模型生成運動(dòng)指令對智能體進(jìn)行驅動(dòng),替代傳統基于規則或者數學(xué)公式的運動(dòng)驅動(dòng)方式,實(shí)現虛擬和現實(shí)的深度融合。因此,具有具身智能的機器人,可以聚集人工智能的三大流派:以神經(jīng)網(wǎng)絡(luò )為代表的連接主義,以知識工程為代表的符號主義和控制論相關(guān)的行為主義,三大流派可以同時(shí)作用在一個(gè)智能體,這預期會(huì )帶來(lái)新的技術(shù)突破。

第四個(gè)前沿方向是AI4R(AI for Research)成為科學(xué)發(fā)現與技術(shù)發(fā)明的主要范式。當前科學(xué)發(fā)現主要依賴(lài)于實(shí)驗和人腦智慧,由人類(lèi)進(jìn)行大膽猜想、小心求證,信息技術(shù)無(wú)論是計算和數據,都只是起到一些輔助和驗證的作用。相較于人類(lèi),人工智能在記憶力、高維復雜、全視野、推理深度、猜想等方面具有較大優(yōu)勢,是否能以AI為主進(jìn)行一些科學(xué)發(fā)現和技術(shù)發(fā)明,大幅提升人類(lèi)科學(xué)發(fā)現的效率,比如主動(dòng)發(fā)現物理學(xué)規律、預測蛋白質(zhì)結構、設計高性能芯片、高效合成新藥等。因為人工智能大模型具有全量數據,具備上帝視角,通過(guò)深度學(xué)習的能力,可以比人向前看更多步數,如能實(shí)現從推斷(inference)到推理(reasoning)的躍升,人工智能模型就有潛力具備愛(ài)因斯坦一樣的想象力和科學(xué)猜想能力,極大提升人類(lèi)科學(xué)發(fā)現的效率,打破人類(lèi)的認知邊界。這才是真正的顛覆所在。

最后,通用人工智能Artificial General Intelligence,簡(jiǎn)稱(chēng)AGI)是一個(gè)極具挑戰的話(huà)題,極具爭論性。曾經(jīng)有一個(gè)哲學(xué)家和一個(gè)神經(jīng)科學(xué)家打賭:25年后(即2023年)科研人員是否能夠揭示大腦如何實(shí)現意識?當時(shí)關(guān)于意識有兩個(gè)流派,一個(gè)叫集成信息理論,一個(gè)叫全局網(wǎng)絡(luò )工作空間理論,前者認為意識是由大腦中特定類(lèi)型神經(jīng)元連接形成的結構,后者指出意識是當信息通過(guò)互連網(wǎng)絡(luò )傳播到大腦區域時(shí)產(chǎn)生的。2023年,人們通過(guò)六個(gè)獨立實(shí)驗室進(jìn)行了對抗性實(shí)驗,結果與兩種理論均不完全匹配,哲學(xué)家贏(yíng)了,神經(jīng)科學(xué)家輸了。通過(guò)這一場(chǎng)賭約,可以看出人們總是希望人工智能能夠了解人類(lèi)的認知和大腦的奧秘。從物理學(xué)的視角看,物理學(xué)是對宏觀(guān)世界有了透徹理解后,從量子物理起步開(kāi)啟了對微觀(guān)世界的理解。智能世界與物理世界一樣,都是具有巨大復雜度的研究對象,AI大模型仍然是通過(guò)數據驅動(dòng)等研究宏觀(guān)世界的方法,提高機器的智能水平,對智能宏觀(guān)世界理解并不夠,直接到神經(jīng)系統微觀(guān)世界尋找答案是困難的。人工智能自誕生以來(lái),一直承載著(zhù)人類(lèi)關(guān)于智能與意識的種種夢(mèng)想與幻想,也激勵著(zhù)人們不斷探索。

三、人工智能的安全風(fēng)險

人工智能的發(fā)展促進(jìn)了當今世界科技進(jìn)步的同時(shí),也帶來(lái)了很多安全風(fēng)險,要從技術(shù)與法規兩方面加以應對。

首先是互聯(lián)網(wǎng)虛假信息泛濫。這里列舉若干場(chǎng)景:一是數字分身。AI Yoon是首個(gè)使用 DeepFake 技術(shù)合成的官方候選人,這個(gè)數字人以韓國國民力量黨候選人尹錫悅(Yoon Suk-yeol)為原型,借助尹錫悅 20 小時(shí)的音頻和視頻片段、以及其專(zhuān)門(mén)為研究人員錄制的 3000 多個(gè)句子,由當地一家 DeepFake 技術(shù)公司創(chuàng )建了虛擬形象 AI Yoon,并在網(wǎng)絡(luò )上迅速走紅。實(shí)際上 AI Yoon 表達的內容是由競選團隊撰寫(xiě)的,而不是候選人本人。

二是偽造視頻,尤其是偽造領(lǐng)導人視頻引起國際爭端,擾亂選舉秩序,或引起突發(fā)輿情事件,如偽造尼克松宣布第一次登月失敗,偽造烏克蘭總統澤連斯基宣布投降的信息,這些行為導致新聞媒體行業(yè)的社會(huì )信任衰退。

三是偽造新聞,主要通過(guò)虛假新聞自動(dòng)生成牟取非法利益,使用ChatGPT生成熱點(diǎn)新聞,賺取流量,截至2023630日全球生成偽造新聞網(wǎng)站已達277個(gè),嚴重擾亂社會(huì )秩序。

四是換臉變聲,用于詐騙。如由于AI語(yǔ)音模仿了企業(yè)高管的聲音,一家香港國際企業(yè)因此被騙3500萬(wàn)美元。

五是生成不雅圖片,特別是針對公眾人物。如影視明星的色情視頻制作,造成不良社會(huì )影響。因此,迫切需要發(fā)展互聯(lián)網(wǎng)虛假信息的偽造檢測技術(shù)。

其次,AI大模型面臨嚴重可信問(wèn)題。這些問(wèn)題包括:(1一本正經(jīng)胡說(shuō)八道的事實(shí)性錯誤;(2)以西方價(jià)值觀(guān)敘事,輸出政治偏見(jiàn)和錯誤言論;(3)易被誘導,輸出錯誤知識和有害內容;(4)數據安全問(wèn)題加重,大模型成為重要敏感數據的誘捕器,ChatGPT將用戶(hù)輸入納入訓練數據庫,用于改善ChatGPT,美方能夠利用大模型獲得公開(kāi)渠道覆蓋不到的中文語(yǔ)料,掌握我們自己都可能不掌握的中國知識。因此,迫切需要發(fā)展大模型安全監管技術(shù)與自己的可信大模型。

除了技術(shù)手段外,人工智能安全保障需要相關(guān)立法工作。2021年科技部發(fā)布《新一代人工智能倫理規范》,20228月,全國信息安全標準化技術(shù)委員會(huì )發(fā)布《信息安全技術(shù) 機器學(xué)習算法安全評估規范》,2022-2023年,中央網(wǎng)信辦先后發(fā)布《互聯(lián)網(wǎng)信息服務(wù)算法推薦管理規定》《互聯(lián)網(wǎng)信息服務(wù)深度合成管理規定》《生成式人工智能服務(wù)管理辦法》等。歐美國家也先后出臺法規,2018525日,歐盟出臺《通用數據保護條例》,2022104日,美國發(fā)布《人工智能權利法案藍圖》,2024313日,歐洲議會(huì )通過(guò)了歐盟《人工智能法案》。

我國應加快推進(jìn)《人工智能法》出臺,構建人工智能治理體系,確保人工智能的發(fā)展和應用遵循人類(lèi)共同價(jià)值觀(guān),促進(jìn)人機和諧友好;創(chuàng )造有利于人工智能技術(shù)研究、開(kāi)發(fā)、應用的政策環(huán)境;建立合理披露機制和審計評估機制,理解人工智能機制原理和決策過(guò)程;明確人工智能系統的安全責任和問(wèn)責機制,可追溯責任主體并補救;推動(dòng)形成公平合理、開(kāi)放包容的國際人工智能治理規則。

四、中國智能計算發(fā)展困境

人工智能技術(shù)與智能計算產(chǎn)業(yè)處于中美科技競爭的焦點(diǎn),我國在過(guò)去幾年雖然取得了很大的成績(jì),但依然面臨諸多發(fā)展困境,特別是由美國的科技打壓政策帶來(lái)的困難。

困境一為美國在AI核心能力上長(cháng)期處于領(lǐng)先地位,中國處于跟蹤模式。中國在AI高端人才數量、AI基礎算法創(chuàng )新、AI底座大模型能力(大語(yǔ)言模型、文生圖模型、文生視頻模型)、底座大模型訓練數據、底座大模型訓練算力等,都與美國存在一定的差距,并且這種差距還將持續很長(cháng)一段時(shí)間。

困境二為高端算力產(chǎn)品禁售,高端芯片工藝長(cháng)期被卡。A100,H100,B200等高端智算芯片對華禁售。華為、龍芯、寒武紀、曙光、海光等企業(yè)都進(jìn)入實(shí)體清單,它們芯片制造的先進(jìn)工藝受限,國內可滿(mǎn)足規模量產(chǎn)的工藝節點(diǎn)落后國際先進(jìn)水平2-3代,核心算力芯片的性能落后國際先進(jìn)水平2-3代。

困境三為國內智能計算生態(tài)孱弱,AI開(kāi)發(fā)框架滲透率不足。英偉達CUDA⑤(Compute Unified Device Architecture, 通用計算設備架構)生態(tài)完備,已形成了事實(shí)上的壟斷。國內生態(tài)孱弱,具體表現在:一是研發(fā)人員不足,英偉達CUDA生態(tài)有近2萬(wàn)人開(kāi)發(fā),是國內所有智能芯片公司人員總和的20倍;二是開(kāi)發(fā)工具不足,CUDA550個(gè)SDK(Software Development Kit, 軟件開(kāi)發(fā)工具包),是國內相關(guān)企業(yè)的上百倍;三是資金投入不足,英偉達每年投入50億美元,是國內相關(guān)公司的幾十倍;四是AI開(kāi)發(fā)框架TensorFlow占據工業(yè)類(lèi)市場(chǎng),PyTorch占據研究類(lèi)市場(chǎng),百度飛槳等國產(chǎn)AI開(kāi)發(fā)框架的開(kāi)發(fā)人員只有國外框架的1/10。更為嚴重的是國內企業(yè)之間山頭林立,無(wú)法形成合力,從智能應用、開(kāi)發(fā)框架、系統軟件、智能芯片,雖然每層都有相關(guān)產(chǎn)品,但各層之間沒(méi)有深度適配,無(wú)法形成一個(gè)有競爭力的技術(shù)體系。

困境四為AI應用于行業(yè)時(shí)成本、門(mén)檻居高不下。當前我國AI應用主要集中在互聯(lián)網(wǎng)行業(yè)和一些國防領(lǐng)域。AI技術(shù)推廣應用于各行各業(yè)時(shí),特別是從互聯(lián)網(wǎng)行業(yè)遷移到非互聯(lián)網(wǎng)行業(yè),需要進(jìn)行大量的定制工作,遷移難度大,單次使用成本高。最后,我國在AI領(lǐng)域的人才數量與實(shí)際需求相比也明顯不足。

五、中國如何發(fā)展智能計算的道路選擇

人工智能發(fā)展的道路選擇對我國至關(guān)重要,關(guān)系到發(fā)展的可持續性與最終的國際競爭格局。當前人工智能的使用成本十分高昂,微軟Copilot套件要支付每月10美元的使用費用,ChatGPT每天消耗50萬(wàn)千瓦時(shí)的電力,英偉達B200芯片價(jià)格高達3萬(wàn)美元以上??傮w來(lái)說(shuō),我國應發(fā)展用得起、安全可信的人工智能技術(shù),消除我國信息貧困人口、并造福一帶一路國家;低門(mén)檻地賦能各行各業(yè),讓我國的優(yōu)勢產(chǎn)業(yè)保持競爭力,讓相對落后的產(chǎn)業(yè)能夠大幅地縮小差距。

選擇一:統一技術(shù)體系走閉源封閉,還是開(kāi)源開(kāi)放的道路?

支撐智能計算產(chǎn)業(yè)的是一個(gè)相互緊耦合的技術(shù)體系,即由一系列技術(shù)標準和知識產(chǎn)權將材料、器件、工藝、芯片、整機、系統軟件、應用軟件等密切聯(lián)系在一起的技術(shù)整體。我國發(fā)展智能計算技術(shù)體系存在三條道路:

一是追趕兼容美國主導的A體系。我國大多數互聯(lián)網(wǎng)企業(yè)走的是GPGPU/CUDA兼容道路,很多芯片領(lǐng)域的創(chuàng )業(yè)企業(yè)在生態(tài)構建上也是盡量與CUDA兼容,這條道路較為現實(shí)。由于在算力方面美國對我國工藝和芯片帶寬的限制,在算法方面國內生態(tài)林立很難形成統一,生態(tài)成熟度嚴重受限,在數據方面中文高質(zhì)量數據匱乏,這些因素會(huì )使得追趕者與領(lǐng)先者的差距很難縮小,一些時(shí)候還會(huì )進(jìn)一步拉大。

二是構建專(zhuān)用封閉的B體系。在軍事、氣象、司法等專(zhuān)用領(lǐng)域構建企業(yè)封閉生態(tài),基于國產(chǎn)成熟工藝生產(chǎn)芯片,相對于底座大模型更加關(guān)注特定領(lǐng)域垂直類(lèi)大模型,訓練大模型更多采用領(lǐng)域專(zhuān)有高質(zhì)量數據等。這條道路易于形成完整可控的技術(shù)體系與生態(tài),我國一些大型骨干企業(yè)走的是這條道路,它的缺點(diǎn)是封閉,無(wú)法凝聚國內大多數力量,也很難實(shí)現全球化。

三是全球共建開(kāi)源開(kāi)放的C體系。用開(kāi)源打破生態(tài)壟斷,降低企業(yè)擁有核心技術(shù)的門(mén)檻,讓每個(gè)企業(yè)都能低成本地做自己的芯片,形成智能芯片的汪洋大海,滿(mǎn)足無(wú)處不在的智能需求。用開(kāi)放形成統一的技術(shù)體系,我國企業(yè)與全球化力量聯(lián)合起來(lái)共建基于國際標準的統一智能計算軟件棧。形成企業(yè)競爭前共享機制,共享高質(zhì)量數據庫,共享開(kāi)源通用底座大模型。對于全球開(kāi)源生態(tài),我國企業(yè)在互聯(lián)網(wǎng)時(shí)代收益良多,我國更多的是使用者,是參與者,在智能時(shí)代我國企業(yè)在RISC-V⑥+AI開(kāi)源技術(shù)體系上應更多地成為主力貢獻者,成為全球化開(kāi)放共享的主導力量。

選擇二:拼算法模型,還是拼新型基礎設施?

人工智能技術(shù)要賦能各行各業(yè),具有典型的長(cháng)尾效應。我國80%的中小微企業(yè),需要的是低門(mén)檻、低價(jià)格的智能服務(wù)。因此,我國智能計算產(chǎn)業(yè)必須建立在新的數據空間基礎設施之上,其中關(guān)鍵是我國應率先實(shí)現智能要素即數據、算力、算法的全面基礎設施化。這項工作可比肩二十世紀初美國信息高速公路計劃(即信息基礎設施建設)對互聯(lián)網(wǎng)產(chǎn)業(yè)的歷史作用。

信息社會(huì )最核心的生產(chǎn)力是網(wǎng)絡(luò )空間(Cyberspace)。網(wǎng)絡(luò )空間的演進(jìn)過(guò)程是:從機器一元連接構成的計算空間,演進(jìn)到人機信息二元連接構成的信息空間,再演進(jìn)到人機物數據三元連接構成的數據空間。從數據空間看,人工智能的本質(zhì)是數據的百煉成鋼,大模型就是對互聯(lián)網(wǎng)全量數據進(jìn)行深度加工后的產(chǎn)物。在數字化時(shí)代,在互聯(lián)網(wǎng)上傳輸的是信息流,是算力對數據進(jìn)行粗加工后的結構化抽象;在智能時(shí)代,在互聯(lián)網(wǎng)上傳輸的是智能流,是算力對數據進(jìn)行深度加工與精煉后的模型化抽象。智能計算的一個(gè)核心特征就是用數值計算、數據分析、人工智能等算法,在算力池中加工海量數據件,得到智能模型,再嵌入到信息世界、物理世界的各個(gè)過(guò)程中。

我國政府已經(jīng)前瞻性地提前布局了新型基礎設施,在世界各國競爭中搶占了先機。首先,數據已成為國家戰略信息資源。數據具有資源要素與價(jià)值加工兩重屬性,數據的資源要素屬性包括生產(chǎn)、獲取、傳輸、匯聚、流通、交易、權屬、資產(chǎn)、安全等各個(gè)環(huán)節,我國應繼續加大力度建設國家數據樞紐與數據流通基礎設施。

其次,AI大模型就是數據空間的一類(lèi)算法基礎設施。以通用大模型為基座,構建大模型研發(fā)與應用的基礎設施,支撐廣大企業(yè)研發(fā)領(lǐng)域專(zhuān)用大模型,服務(wù)于機器人、無(wú)人駕駛、可穿戴設備、智能家居、智能安防等行業(yè),覆蓋長(cháng)尾應用。

最后,全國一體化算力網(wǎng)建設在推動(dòng)算力的基礎設施化上發(fā)揮了先導作用。算力基礎設施化的中國方案,應在大幅度降低算力使用成本和使用門(mén)檻的同時(shí),為最廣范圍覆蓋人群提供高通量、高品質(zhì)的智能服務(wù)。算力基礎設施的中國方案需要具備兩低一高,即在供給側,大幅度降低算力器件、算力設備、網(wǎng)絡(luò )連接、數據獲取、算法模型調用、電力消耗、運營(yíng)維護、開(kāi)發(fā)部署的總成本,讓廣大中小企業(yè)都消費得起高品質(zhì)的算力服務(wù),有積極性開(kāi)發(fā)算力網(wǎng)應用;在消費側,大幅度降低廣大用戶(hù)的算力使用門(mén)檻,面向大眾的公共服務(wù)必須做到易獲取、易使用,像水電一樣即開(kāi)即用,像編寫(xiě)網(wǎng)頁(yè)一樣輕松定制算力服務(wù),開(kāi)發(fā)算力網(wǎng)應用。在服務(wù)效率側,中國的算力服務(wù)要實(shí)現低熵高通量,其中高通量是指在實(shí)現高并發(fā)度服務(wù)的同時(shí),端到端服務(wù)的響應時(shí)間可滿(mǎn)足率高;低熵是指在高并發(fā)負載中出現資源無(wú)序競爭的情況下,保障系統通量不急劇下降。保障算得多對中國尤其重要。

選擇三:AI+著(zhù)重賦能虛擬經(jīng)濟,還是發(fā)力實(shí)體經(jīng)濟?

“AI+”的成效是人工智能價(jià)值的試金石。次貸危機后,美國制造業(yè)增加值占GDP的比重從1950年的28%降低為2021年的11%,美國制造業(yè)在全行業(yè)就業(yè)人數占比從1979年的35%降低為2022年的8%,可見(jiàn)美國更傾向于回報率更高的虛擬經(jīng)濟,輕視投資成本高且經(jīng)濟回報率低的實(shí)體經(jīng)濟。中國傾向于實(shí)體經(jīng)濟與虛擬經(jīng)濟同步發(fā)展,更加重視發(fā)展裝備制造、新能源汽車(chē)、光伏發(fā)電、鋰電池、高鐵、5G等實(shí)體經(jīng)濟。

相應地美國AI主要應用于虛擬經(jīng)濟和IT基礎工具,AI技術(shù)也是脫實(shí)向虛,自2007年以來(lái)硅谷不斷炒作虛擬現實(shí)(Virtual Reality,VR)、元宇宙、區塊鏈、Web3.0、深度學(xué)習、AI大模型等,是這個(gè)趨勢的反映。

我國的優(yōu)勢在實(shí)體經(jīng)濟,制造業(yè)全球產(chǎn)業(yè)門(mén)類(lèi)最齊全,體系最完整,特點(diǎn)是場(chǎng)景多、私有數據多。我國應精選若干行業(yè)加大投入,形成可低門(mén)檻全行業(yè)推廣的范式,如選擇裝備制造業(yè)作為延續優(yōu)勢代表性行業(yè),選擇醫藥業(yè)作為快速縮短差距的代表性行業(yè)。賦能實(shí)體經(jīng)濟的技術(shù)難點(diǎn)是AI算法與物理機理的融合。

人工智能技術(shù)成功的關(guān)鍵是能否讓一個(gè)行業(yè)或一個(gè)產(chǎn)品的成本大幅下降,從而將用戶(hù)數與產(chǎn)業(yè)規模擴大10倍,產(chǎn)生類(lèi)似于蒸汽機對于紡織業(yè),智能手機對于互聯(lián)網(wǎng)業(yè)的變革效果。

我國應走出適合自己的人工智能賦能實(shí)體經(jīng)濟的高質(zhì)量發(fā)展道路。

注釋?zhuān)?/span>

模式識別是指用計算的方法根據樣本的特征將樣本劃分到一定的類(lèi)別中去,是通過(guò)計算機用數學(xué)方法來(lái)研究模式的自動(dòng)處理和判讀,把環(huán)境與客體統稱(chēng)為模式。以圖像處理與計算機視覺(jué)、語(yǔ)音語(yǔ)言信息處理、腦網(wǎng)絡(luò )組、類(lèi)腦智能等為主要研究方向。

②Token可翻譯為詞元,指自然語(yǔ)言處理過(guò)程中用來(lái)表示單詞或短語(yǔ)的符號。token可以是單個(gè)字符,也可以是多個(gè)字符組成的序列。

通用人工智能是指擁有與人類(lèi)相當甚至超過(guò)人類(lèi)智能的人工智能類(lèi)型。通用人工智能不僅能像人類(lèi)一樣進(jìn)行感知、理解、學(xué)習和推理等基礎思維能力,還能在不同領(lǐng)域靈活應用、快速學(xué)習和創(chuàng )造性思考。通用人工智能的研究目標是尋求統一的理論框架來(lái)解釋各種智能現象。

芯片制造工藝指制造CPUGPU的制程,即晶體管門(mén)電路的尺寸,單位為納米,目前國際上實(shí)現量產(chǎn)的最先進(jìn)工藝以臺積電的3nm為代表。更先進(jìn)的制造工藝可以使CPUGPU內部集成更多的晶體管,使處理器具有更多的功能以及更高的性能,面積更小,成本更低等。

⑤CUDA是英偉達公司設計研發(fā)一種并行計算平臺和編程模型,包含了CUDA指令集架構以及GPU內部的并行計算引擎。開(kāi)發(fā)人員可以使用C語(yǔ)言來(lái)為CUDA架構編寫(xiě)程序,所編寫(xiě)出的程序可以在支持CUDA的處理器上以超高性能運行。

⑥RISC-V(發(fā)音為“risk-five”)是一個(gè)由美國加州大學(xué)伯克利分校發(fā)起的開(kāi)放通用指令集架構,相比于其他付費指令集,RISC-V允許任何人免費地使用RISC-V指令集設計、制造和銷(xiāo)售芯片和軟件。

長(cháng)尾效應是指那些原來(lái)不受到重視的銷(xiāo)量小但種類(lèi)多的產(chǎn)品或服務(wù)由于總量巨大,累積起來(lái)的總收益超過(guò)主流產(chǎn)品的現象。在互聯(lián)網(wǎng)領(lǐng)域,長(cháng)尾效應尤為顯著(zhù)。

高并發(fā)通常指通過(guò)設計保證系統能夠同時(shí)并行處理很多請求。

主講人系中國工程院院士,中國科學(xué)院計算技術(shù)研究所研究員、學(xué)術(shù)委員會(huì )主任

中國儀器儀表行業(yè)協(xié)會(huì )版權所有   |   京ICP備13023518號-1   |   京公網(wǎng)安備 110102003807
地址:北京市西城區百萬(wàn)莊大街16號1號樓6層   |   郵編:100037   |   電話(huà):010-68596456 / 68596458
戰略合作伙伴、技術(shù)支持:中國機械工業(yè)聯(lián)合會(huì )機經(jīng)網(wǎng)(MEI)