關于我們
書單推薦
新書推薦
|
智能工程 全書共10章分別從構建非生物智能體、感知、描述、連接、記憶和理解、學習與交互、智能體運算模式與處理功能、資源和任務功能系統、生存、思維、控制與主體性、智能體生命周期等角度深入討論了智能體的方方面面,本書討論一個極為龐大、復雜,且沒有先例、沒有形成共識的智能體或機器智能系統的實現機理、過程、要點,沒有能、也做不到面面俱到,存在作者有意或無意忽略的環(huán)節(jié)。本書沒有在工程細節(jié)層面討論,只是在整體實現的主要環(huán)節(jié)的可實現性進行了框架性討論。 前 言 歷經兩年,本書終于脫稿。在2015年的寫作計劃中,并沒有這一本書。當時的考慮是,將信息和智能這兩種客觀存在的屬性和發(fā)生發(fā)展規(guī)律說清楚,把超越人類智能的非生物智能體的目標、要求、邏輯架構說清楚,我的研究目標就完成了。因此,2018年年初,我的書桌上已經將寫作《論信息》和《智能原理》兩本書的參考資料撤掉,換上了經濟學相關的資料。過了幾個月,收到一些讀者對兩本書的反饋,感到有必要就非生物智能體如何實現再寫一本書。原因在于沿著《論信息》和《智能原理》兩本書的認識邏輯和理論框架,去設計這種功能上媲美甚至寬于AGI的非生物智能體,方法上還不采用流行的人工智能領域的模式和算法,可能難以達到,需要將實現思路進行系統的介紹。于是我重新回到已經劃了句號的領域,開始《智能工程》的寫作,并將三本書合在一起,稱為“智能三部曲”。 本書的非生物智能體,本質上是機器智能,重點是以生物智能為模板,在既有機器智能的基礎上,實現以含義計算為基礎,以理解為前提,可以自我積累知識和經驗的非生物智能,也就是具有理解、思考、判斷、決策行為的思維機器。這種機器能夠與人合作,能夠集成既有的機器智能,能以持續(xù)增長的模式發(fā)展。 開始的時候,我低估了寫作的難度,以為在理論和邏輯方面已經厘清的問題,只需要具體化就可以了,隨著研究和寫作的進展,發(fā)現這個判斷是錯誤的。難點集中在三個地方:第一,什么樣的體系架構能實現《智能原理》中定義的非生物智能體的所有功能和要求;第二,用傳統的IT模式形成的軟硬件,如何轉變?yōu)楹x—理解—思維—行為的智能處理模式;第三,可實現性應該在什么顆粒度水平描述。 對于第一個問題,本書第1章中的圖1.5是回答的總綱。智能體的架構要支持其所有活動過程:認知、任務、生存和控制。智能體的架構要滿足智能體的8個原則要求:主體性、多樣性、發(fā)展性、生存性、交互性、結構性、傳承性、整體性。滿足這些要求的一種可能架構由圖1.5中給出的11個功能體系組成。它的所有構件,從基礎的微處理器到此上各個層面的功能集合,均具備自主、自治的獨立性,又處于相應功能集合和整體的有效管理和控制之下。11個功能體系是:感知、描述、連接、記憶、學習、交互、處理、任務、資源、生存和控制。 主體性、生存性這兩個要求,主要通過四個功能模塊實現:資源模塊、生存模塊、思維模塊和控制模塊。資源模塊聯合生存模塊保證智能體正常運轉,思維模塊辨析智能體面臨的風險,控制模塊決策并主導應急處置。智能體所有構件均被賦予自主、自治的獨立性,以避免系統性風險,提高智能體生存性。傳承性要求主要通過生命周期的前三個階段:初始、賦予、培育來體現,并在此后的學習和交互過程中延續(xù)。發(fā)展性的要求主要通過學習模塊實現,學習是發(fā)展的主要來源,其他功能模塊也會在自身行為中總結成長,或經由學習提升自身功能。交互性的要求主要通過交互功能模塊實現,以滿足智能體感知、學習、任務、資源和生存各個功能對交互的需求。結構性和整體性這兩個既矛盾又統一的要求,主要通過11個功能體系內在的自主結構和相互之間的協同模塊,控制功能的整體協調實現。 認知、任務、生存、控制這四個智能過程涵蓋了智能體的全部構成要素、功能和行為。每個過程的實現都需要11個功能體系的支持,都在生命周期的全過程發(fā)揮作用,全書就是從實現這四個過程的需要去安排11個功能體系的結構、功能、相互關系。本書對這四個過程的功能及其實現有四個特別的安排,這是閱讀和使用本書的關鍵。 第一,認知過程以理解為目的,以智能體可自主發(fā)展為中心,以逐步疊加為路徑,而智能體所有的功能,包括認知的發(fā)展,均基于認知!爸疄橹,不知為不知,是知也”這句2500年前孔子的名言是本書的哲學基礎!安环e硅步,何以至千里”是本書實踐路徑所遵循的原則。以互聯網為平臺,以交互功能為媒介,一個字接著一個字、一個動作接著一個動作、一個場景接著一個場景,一個主題接著一個主題,將人類智能的進展用愚公移山的精神,大規(guī)模自主并行,疊加到智能體的記憶中,形成遠遠超越一個自然人可理解、可使用的記憶,并在交互和使用中校驗、完善。與認知相關的功能體系設計就是按照這樣的原則執(zhí)行的。 第二,任務過程是以認知的積累為基礎的,也就是只承擔能夠做的任務,力所不逮的不承擔。智能體認知過程的核心就是先積累常識和基礎知識,待達到一定程度后,在擬承擔的任務類型方向不斷深化,達到專精的程度。所謂專精,就是對所有需要求解的問題在實際工作場景的所有可能形式都已經遍歷,所有這些形式的求解過程也已經遍歷,而且形成的所有求解過程都是確定的,或即使存在一定的不確定性,也不影響結果可靠性要求。換言之,圍繞任務的認知,就是力爭窮盡一個個特定任務的問題空間和解空間,任務執(zhí)行只承擔可以判斷解的路徑是確定的問題。有些人可能認為,窮盡特定問題的問題空間和解空間是一個不可能實現的命題,從抽象的角度,或者從純邏輯的角度,可以得出這樣的結論,但從實際經濟社會的工作崗位看,隨著發(fā)展,絕大部分工作崗位的任務,其問題空間和解空間是可以窮盡的。一個生產線上的工人,一個銷售員、一個理財師、管理者,在實際工作中處理的的問題類型及其變形都是有限的。對于智能體來說,從可窮盡的開始,在其龐大、不知疲倦、快速度迭代、相互獨立又可以協同的認知功能支持下,可窮盡空間的問題類型會越來越多,在一定的發(fā)展階段,就會超越普通的員工,并能繼續(xù)發(fā)展,超越一群人,直至超越大部分人,直到具有所有人都達不到的新特征或新高度。 第三,生存過程是當智能體成為社會獨立主體時,能承擔社會責任,能不間斷、自主地積累知識、經驗、技能、事實、數據,所必需的是在生命周期的某個時間點開始能將生存能力掌控在自己手里。 第四,控制過程更是智能體所有過程能夠形成、發(fā)展、發(fā)揮作用的關鍵。智能體是由數以千億到萬億量級的自治構件組成的,這些不同類型、功能、層級的自治構件都有各自和相互之間的控制和協調功能,這是控制過程的基礎和重要的組成部分。智能體的控制更重要的是整體的控制,這是控制功能系統的職責?刂乒δ苡袃蓚重要模塊,一是意識和思維,對智能體的運行和環(huán)境不間斷地觀察,分析判斷是否存在風險,是否存在被局部忽略,控制功能體系處置的事項;二是智能體全局的決策、控制、調度和處置。 對于另一個難點,本書以六個功能系統中的相關功能和規(guī)則,解釋為什么可以將傳統的IT模式組成的軟硬件,轉變?yōu)楹x—理解—思維—決策—控制的智能處理模式。 其實,傳統的數據庫管理系統、數據分析系統、商業(yè)智能系統,都能通過嚴格的數據控制、數據格式、數據字典和確定的處理函數,從數字(符號)得出預期的、具有含義的結論,也可以根據數據結構、函數和數據字典給出解釋。這就是從符號中得出了含義的結果,也可以說在這個范疇內,系統可以給出數據庫中的特定字段、處理結果的“理解”,因為它可以解釋。缺點在于,不能泛化、跨系統積累,只在該系統能達到的范疇和深度。這個例子也給我們一個重要的啟示,剛性的符合數字內在含義的結構和處理、解釋規(guī)則,是可以從符號中導出含義的。盡管另外一些處理模式也可以得出符合所處理符號隱含的含義,但如果不可解釋,就不能認為是智能的,智能的基本條件是能解釋。 基于這樣的分析,我們能將得到信息以一種結構化的、可解釋的方式轉換感知到的對象(符號),然后以智能體統一的、可理解的符號和標識體系對這些符號進行轉換,并保持由傳感器決定的感知內容及感知對象的全部結構,以及靜態(tài)的各種空間關系;動態(tài)的則加上時間序列的所有細化對象的空間關系,再與已有的以前感知的同類對象、以前描述的同類符號轉換,用連接表述本次感知的全部關系,把感知對象的基本單元與已有的記憶比較,將所有的關系顯性表述。經由這樣的模式保存起來的感知對象,就轉換成了智能體可理解、可利用的記憶。這里有三個關鍵環(huán)節(jié),感知、連接和記憶。感知把關是基礎,所有的外部對象(文檔、圖形、音視頻),必須經由唯一的感知器感知,一個感知器感知的結果,都可以由描述功能以智能體可理解的符號表示。實現這個要求的方法就是感知器的單一性,如一個漢字,就是一個傳感器;一種聲紋特征就是一個傳感器,聲音是片段聲紋的時間序列;圖像則以一個個基本形狀特征及色彩組合為傳感器,視頻是圖像系列。數以十億、百億的邏輯感知微處理器和數量較少的協同的物理感知微處理器與其識別對象的描述處理器直連,將對象中的要素及其連接描述完成后傳送到記憶,在記憶與其他可能的相關連接成為智能體所有功能模塊可理解、可利用的記憶單元。任務過程在一定意義上是認知過程的逆過程,任務被感知后,進入規(guī)定的任務類區(qū)域,在該任務類匹配到適用的執(zhí)行微處理器,通過執(zhí)行微處理器調用物質資源、記憶單元和確定的處理微處理器,完成任務的執(zhí)行。生存和控制過程也以類似的模式完成。所有的智能體功能過程或智能行為以感知為起點,用特殊的結構,實現了從符號到含義、從存儲到記憶、從計算到理解的轉換。 最后一個難點本質上是技術性問題、工作量問題。顆粒度越細,工作量越大,對理論到實踐的前瞻性要求越高。本書在寫作的初期計劃用28章的大篇幅,在類似于概念設計的顆粒度層次上完成,后來發(fā)現工作量太大,也沒有必要,因為本書的任務不是以具體項目的方式去考慮,而是對可實現性的一種解釋,所以盡可能將顆粒度放大,能看到可實現就達到了本書的目的。最粗略的估計,一個通用的非生物智能體是一個大體需要千億美元或萬億元人民幣量級的資金,用6~8年時間,高峰時需要數千人的開發(fā)團隊及大量基于互聯網的志愿者參與的工程。它沒有先例,細粒度的討論缺乏基礎。所以,本書沒有描述細節(jié),去掉了原計劃中對主要功能實現例子的邏輯過程描述。既有篇幅與前兩本書一致性的考慮,也有不約束實現模式和細節(jié)多樣性想象的考慮。 有人說,這個系統太過龐大復雜,熱力學第二定律必然使其窒息;有人說這樣的系統必然存在計算復雜性,并因此而崩潰。實際上這是在不同維度上的思考。智能體的所有過程都是含義處理,含義處理的基礎是理解,在理解上疊加,是1+1+…直至一個個邏輯對象、 1984-2001, 國家信息化中心;2001-2008,國務院信息辦;2008-2015,工業(yè)和信息化部副部長。研究領域:漢字信息處理,信息系統和網絡的設計和開發(fā),信息經濟學,信息法學,國家信息化發(fā)展戰(zhàn)略,人工智能理論等。1981年以來,先后發(fā)表了150余篇論文,著有《專家系統及其在管理中的應用》,《知識經濟時代的企業(yè)技術創(chuàng)新和改造》、《企業(yè)信息化建設與管理》、《論信息》《智能原理》等著作。 目 錄
你還可能感興趣
我要評論
|