反饋數(shù)據(jù)規(guī)模、頻率、機制在二十一世紀已發(fā)生根本變化,這是數(shù)字化和智能的本質,也是影響未來商業(yè)重要的變量之一。在技術領域,用戶行為反饋帶來互聯(lián)網的相關性,AI算法的誤差、獎勵、強度等反饋機制涌現(xiàn)智能,基于簡單反饋規(guī)則的算法,結合海量的反饋數(shù)據(jù),正在創(chuàng)造讓人驚奇的表現(xiàn),并解決復雜問題,無論是搜索、推薦引擎還是大規(guī)模預訓練模型。在商業(yè)領域,新的商業(yè)模式總是基于新的生產力而誕生,特斯拉影子模式、預訓練大模型(GPT)、谷歌自動駕駛(Waymo)、亞馬遜智能化應用、奈飛正在以基于數(shù)字化反饋流的算法自學習能力贏得優(yōu)勢。
這本書將為讀者介紹數(shù)字時代技術與商業(yè)的第一性原理,在更普適的認知、科學、萬物演化的背后,如何提出創(chuàng)造性地假設,如何高效率地反饋,如何建立模擬演化機制,是更為通用的反饋系統(tǒng)常識,為讀者帶來解決問題的全新視角。
這本書寫給將生存在未來的讀者,特別是對于那些希望在數(shù)字化時代持續(xù)創(chuàng)新的新一代管理者,以及新一代的跨界思考者。
埃隆?馬斯克(ElonMusk)在一次訪談中被問到,人生中zui大的挑戰(zhàn)是什么。他一反常態(tài)地沉思了很長時間后的答案是:確保你能有糾錯反饋循環(huán),然后,能夠持續(xù)保持這個循環(huán)。
反饋在一個強調學習能力的時代尤其關鍵,它是一種測量,是一種分類,更是化解復雜性的根本方式,任何事物都能從反饋中找到打開新世界的線索,也能從反饋中找到改進的方向。
就像在練字的過程中,你要從字帖與自己書寫的字之間的偏差找到改進方向。
就像在股票市場,特別是在復雜交互增加的環(huán)境下,只有持續(xù)的動態(tài)反饋機制才可以幫助我們更好地把握明確的機會。
在今天,你和你的組織,顯然需要立基于高效的反饋系統(tǒng),建立學習效率優(yōu)勢,獲取快的進化速度。
當數(shù)字化和智能化的能力越來越普及,比軟件、數(shù)據(jù)和算法這些工具更重要的是數(shù)字化和智能化的思想,我們是否建立了適合新時代的世界觀、數(shù)字化思維方式和基礎知識體系?正是當下的你需要突破的主要瓶頸。
微小的努力只要有反饋就有意義。身處數(shù)字化時代,再小的個體都要善于利用反饋效應,這將幫助你在變革業(yè)務、制定戰(zhàn)略、優(yōu)化決策及高效地處理復雜性問題等方面更快速地建立優(yōu)勢。
1.反饋是什么
在2019年,曾經有朋友和我討論,傳統(tǒng)搜索引擎的地位會被采用相近模式的新競爭者顛覆掉嗎?我告訴他,概率不高。互聯(lián)網超級應用核心的優(yōu)勢在于海量的用戶反饋數(shù)據(jù)。在搜索引擎里,有億萬用戶正在通過搜索與內容互動,這些反饋數(shù)據(jù)和其他信號一起對內容質量和相關性進行排序。更重要的是,反饋數(shù)據(jù)的規(guī)模已經形成不斷自我強化的正反饋效應,越多用戶搜索和點擊,就越能準確地對內容排序,就有越多用戶使用。如果不能用新一代的游戲規(guī)則建立新的正反饋效應,一般很難在存量市場里實現(xiàn)翻盤,就像很多搜索戰(zhàn)爭在成熟的PC搜索戰(zhàn)場打響,卻并未改變競爭格局,而短視頻、社交等其他賽道的應用產品內的搜索則很難使用戶對其形成第一認知,并以此促進用戶規(guī)模和反饋規(guī)模的正反饋。不僅搜索如此,推薦引擎等幾乎所有的互聯(lián)網分發(fā)產品背后的運行邏輯也都是大規(guī)模的用戶在以海量實時的瀏覽行為對內容、商品和服務的質量做反饋。
互聯(lián)網的變革,本質上是大規(guī)模用戶行為的實時數(shù)字化反饋。普通數(shù)據(jù)價值有限,反饋數(shù)據(jù)才更有價值,用戶的應用反饋是基于某種假設的反饋,其中包含著需求的表達、質量的評估等關于世界在如何運轉的規(guī)律。但是,這需要算法的自學習能力和符合高價值數(shù)據(jù)分布和算法自學習機制的產品架構,才能充分釋放海量反饋數(shù)據(jù)中的潛在知識。
這一代人工智能技術也是基于反饋機制創(chuàng)新而實現(xiàn)了突破。對于樣本數(shù)據(jù)中隱藏的規(guī)律,算法會有一個初始預測假設。然后,復雜的高維計算會被約簡為梯度反饋問題來優(yōu)化求解。也可以簡單理解為,預測值與真實值的偏差度量會被反饋給模型,進而向偏差小的方向自動調整模型參數(shù),并不斷重復這個假設和反饋的循環(huán)實現(xiàn)持續(xù)學習的效果。就像練字的過程中,你要從字帖與自己書寫的字之間的偏差找到改進方向。智能在并不追求細節(jié)準確的海量數(shù)據(jù)反饋下涌現(xiàn),結合強大算力,神經網絡這種計算模式在反饋機制創(chuàng)新的作用下,具備越來越強大的自學習能力。
DeepMind(一家AI研究公司)首席研究科學家、倫敦大學學院教授大衛(wèi)?席爾瓦(David Silver)及其合作者在一篇題為 Reward is enough (獎勵反饋)的論文里提到,人工智能及其相關能力不是通過制定和解決復雜問題而產生的,而是通過堅持一個簡單而強大的原則:獎勵大化,他強調的本質上也是一種反饋機制。
不僅是在互聯(lián)網和AI領域,反饋還有更廣義的存在價值和內涵。反饋是有假設檢驗能力的信息,能夠基于此發(fā)揮著推動假設演變的交互作用。而假設是我們深入認識這個世界的動態(tài)過程中不斷更新的認知和狀態(tài),假設也是世界自身向前演化的基礎方式和起點。對于觀察者的認知過程,假設就是A/B Test(假設測試)里面的題目,反饋就是結果。對于被觀察者的演變過程,例如生物的基因變異在提出新假設,而自然選擇就是反饋。觀察者的認知和被觀察者的演化,其實是同一個過程的兩個視角。
一切只能證偽不能證明。波普爾說,一切真理換個角度看都是等待證偽檢驗的假設。反饋則是一種測量,是一種分類,是化解復雜性的根本方式。我們通過反饋對假設的檢驗來收斂相對分散的假設,并使我們有足夠的信心將這些假設付諸實踐。這個過程就是從假設與反饋的偏差中找到打開新世界的線索。只有你把腳伸進水里那一刻,你的皮膚感受到的刺激才能告訴你這里的水溫適不適合游泳,你的感受就是反饋。就像勵志的歌詞里唱的不去開始就永遠不知道,就是這個再簡單不過的檢驗方式所包含的信息,在驅動認知與萬物演化。
我們將要討論的反饋和經典控制論里的反饋并不相同,反饋是因為基于主動、有傾向性的假設而具有意義,是對假設的測試、應用、模擬,是對假設的檢驗和推動。而假設也會在反饋的驅動下,基于從假設到反饋的快速循環(huán)形成知識進化和持續(xù)升級的復利效應。例如,算法模型的預測就是一個主動假設,并非被動和隨機。建立假設的能力和反饋一樣重要,假設和反饋共同決定了效率。更準確地界定是假設-反饋循環(huán)(Hypothesis Feedback loop,HFL)框架下的反饋;蛟S,我們稱為數(shù)字認知論會更貼切一些。在這個框架里,抽象演繹體系和實證歸納體系統(tǒng)一在一起,并在相互推動中被不斷加速。特別是以數(shù)字化的方式抽象概括、虛擬化之后,以數(shù)學邏輯的方式基于HFL可以實現(xiàn)更快演化。下一步,HFL還要將數(shù)字化升級為智能化,加速萬事萬物運轉,使整個社會的成本歷史性地下降。
反饋看起來極其簡單而常見,但它的內涵遠不僅是維納(Wiener)早在經典的控制論中提到的,反饋是為了消除偏差帶來控制,例如,今天更多是從偏差反饋中擬合、學習和解釋世界。我們希望討論的是,當它與具體的場景結合起來并運行于其基礎層面時,呈現(xiàn)出的不同具體實踐。
2. 反饋為什么如此重要
反饋在一個強調學習能力的時代尤其關鍵。我們的世界正在全球、國家、公司的不同層面上經歷兩種轉變,一個是從水平、規(guī)模驅動的增長轉向深度和創(chuàng)新驅動的增長。另一個轉變是大環(huán)境正在加速復雜化。應對這些變化,都需要我們提升學習效率,而學習的本質就是假設和反饋的循環(huán),特別是在數(shù)據(jù)和智能算法革命性加速反饋效率的新技術條件下。其實,認知的突破和世界的演進都是在反饋的驅動之下發(fā)生的。
復雜性和不確定性混淆的世界
復雜性、不確定性,這兩者經常被混雜在一起。復雜性是計算問題,是由很多簡單因素和規(guī)則的疊加、交互影響和反饋效應加速帶來的。比如,少了一顆釘子,掉了一個馬掌,失去一匹戰(zhàn)馬,輸?shù)粢粓鰬?zhàn)爭,滅亡一個國家的混沌現(xiàn)象,比如天體之間的三體現(xiàn)象。不確定性是世界運行規(guī)則及對其本質屬性的認知問題,比如量子態(tài)。我們將重點討論可計算的復雜性,人們平時所說的不確定性并不是量子物理所描述的不確定性,本質上是復雜性。為了保持語言一致,本書中也會使用不確定性這個詞匯,其內含保持與大眾用法的一致,即表達認知層面的不明確。
瑞典皇家科學院將2021年的諾貝爾物理學獎授予三位在復雜系統(tǒng)(Complexity Science)研究上做在突出貢獻的物理學家,他們正在嘗試以更多元的交叉視角來尋找對復雜系統(tǒng)的更好解釋。今天的世界正越來越呈現(xiàn)出復雜系統(tǒng)的特點,創(chuàng)新和復雜性就是這個不斷加速中的世界所呈現(xiàn)出的兩面性。更加違反直覺的是,這種復雜性通常都是在沒有控制的情況下,由極少數(shù)簡單的反饋規(guī)則演化而來;開放系統(tǒng)的內外部反饋使其比封閉更容易在混亂中形成自發(fā)秩序;不精確的自適應性反饋驅動的演進也比控制更容易在快速變化中獲得生存機會。無論你是否準備好,我們就生存在這些新假設下面。有很多你已經習以為常,卻正在不斷失效的做法,都需要在新的假設之下被重新評估。
以簡單化解復雜的反饋機制
1997年擊敗國際象棋世界冠軍卡斯帕羅夫的方法是基于人工規(guī)則的大規(guī)模的深度搜索,早期的翻譯也是基于大量人工規(guī)則,然而這些方法后來都因為不可逆地變得越來越復雜而不可繼續(xù);谕ㄓ、簡單的反饋機制和算法規(guī)則配合算力和數(shù)據(jù)的放大來解決問題被證明是可持續(xù)的,算法會不斷提升通用性,強化學習就是簡單反饋規(guī)則在海量重復學習中涌現(xiàn)智能,ChatGPT(預訓練語言大模型)代表的大規(guī)模預訓練模型基于簡單規(guī)則和海量數(shù)據(jù)就能涌現(xiàn)讓人意外的語言能力。而基于人工規(guī)則的系統(tǒng)更適合在數(shù)據(jù)驅動的模式下做可靠性的底線保障。
進化過程中基因變異形成的新假設和自然選擇的反饋,共同幫助生物向更高的適應能力演化;科學家的假想和思想實驗,以及實驗室內外不同形式的實驗和實踐反饋,在推動科學發(fā)展;互聯(lián)網通過海量用戶行為投票反饋來決定排序策略的預估模型,從而實現(xiàn)個性化;AI算法根據(jù)反饋數(shù)據(jù)調節(jié)模型參數(shù)和網絡結構,從而涌現(xiàn)智能;反饋信息推動了腦和思維的形成。甚至,你身邊的更多例子都是在基于這個樸素的方式在運行。就像你在讀過這本書之后才能形成反饋,才會知道自己對它的預期是否準確,這可以幫助你在以后做出更好的判斷。
這看似一個簡單的框架,卻在不同的組織團體內、在不同的生物神經系統(tǒng)內,在不同的具體情景下,表現(xiàn)為形式不同的反饋傳遞機制。而且,這種細小的差別會在反饋循環(huán)中被迅速疊加和放大,在不同的反饋循環(huán)之間又存在交互影響,這就造就了世界的復雜萬象。反過來看,在同一類別、同一領域中,不同參與者、不同模式表現(xiàn)出的差異,就有來自不同假設與反饋機制的作用。這也是我想在這本書里討論的,簡單的規(guī)則在反饋機制作用下演化出一切,在案例、規(guī)律、原理三個層次分別展開。你的切入點可以是從反饋的結構、主體、關系、機制等角度,反饋數(shù)據(jù)的規(guī)模、速度等維度。
這個簡單框架的復雜性還體現(xiàn)在,任何看似確定的假設都已經被市場充分消化,基于此的靜態(tài)推演就不可靠,因為參與者總是會基于此做出進一步的反饋,就像股票市場。特別是在復雜交互增加的環(huán)境下,只有持續(xù)的動態(tài)反饋機制才可以幫助我們更好地把握明確的機會。
3. 數(shù)字化加速反饋,逼近認知加速的奇點
反饋本身也沒有意義,如何以不同的方式更高效地轉化和利用反饋中隱藏的信息,反饋才有了意義。如果說這個時代有什么特別,另一個很重要的變化是數(shù)字化從根本上改變了反饋數(shù)據(jù)的規(guī)模、全面性、速度、精度,在反饋數(shù)據(jù)質量和效率同步提升的背后是數(shù)字化技術創(chuàng)新與反饋結構、機制的共同進展。顯著的例子,包括互聯(lián)網和物聯(lián)網節(jié)點的密度及其產生的實時數(shù)據(jù)流。也包括人工智能深度神經網絡的深度和層次結構,在反向傳播反饋機制下涌現(xiàn)的智能。還有,區(qū)塊鏈技術支持下的個體對個體的去中心化反饋結構,以新信用機制催生Web3.0(第三代互聯(lián)網);镜姆答仚C制規(guī)律會以不同的形式重復出現(xiàn)在不同的應用場景,并起到決定作用。
此外,AI在處理大規(guī)模數(shù)據(jù)方面也具備了統(tǒng)計潛在規(guī)律,并發(fā)現(xiàn)假設的能力,從而能夠實現(xiàn)自學習。特別是在物理等自然學科陷入實驗手段不足這一困境的階段,新的研究范式出現(xiàn)是一個好消息。
這些重要的變化組合在一起,就形成了更加快速的HFL循環(huán),就像把整個世界裝進了數(shù)字化的加速器,隨時有新的撞擊幫我們打開新的世界。如果說互聯(lián)網改變了連接價值的方式,那么數(shù)字化將改變創(chuàng)造價值的方式。當數(shù)字化和智能化的能力越來越普及,比軟件、數(shù)據(jù)和算法這些工具更重要的是數(shù)字化和智能化的思想,我們是否建立了適合新時代的世界觀、數(shù)字化思維方式
韓博,在BAT從事十余年集團戰(zhàn)略改革與創(chuàng)新工作,推動AI業(yè)務落地,有多項個人人工智能算法發(fā)明專利授權。前奧美創(chuàng)意,服務IBM、Thinkpad等品牌,獲得多項創(chuàng)意獎項。
前 言
第1章? 在數(shù)字化反饋中指數(shù)級加速
一切解決問題的方法都可以通過數(shù)字化反饋的方法來表示和優(yōu)化。當反饋數(shù)據(jù)的速度接近實時,獲取與計算成本無限趨近于零,我們就會接近認知的奇點,幾乎一切社會效率都會因此提升,成本隨之下降。算法探索新假設,海量數(shù)據(jù)反饋實時檢驗,演化周期無限縮短。
1.1? 認知加速的奇點? / 004
1.2? 數(shù)據(jù)經濟新體系? / 023
第2章? 反饋效率決定進化速度
不同的世界基于不同的反饋機制運轉,就有了不同的進化速度。當人類本能的內部世界還停滯在石器時代,外部世界則在數(shù)字化反饋驅動下不斷加速,進化差距會被無限放大為首要挑戰(zhàn)。
2.1? 連接網絡如何在反饋中持續(xù)演化? / 036
2.2? 計算智能的局限和方向? / 083
2.3? 周期疊加新個人計算中心、元宇宙、Web3.0? / 117
2.4? 基本矛盾原始本能的慢反饋? / 141
第3章? 在新反饋系統(tǒng)中加速
突破原始生存模式下碳基自然形態(tài)的局限,帶來增加的進化系統(tǒng)各自遵循不同的反饋規(guī)則,但同樣可以幫助人們贏得優(yōu)勢,并充滿新機會。
3.1? 滿足新消費如何實現(xiàn)不可逆升級? / 165
3.2? 創(chuàng)造隨機的超級個體,確定的To i生態(tài)? / 183
3.3? 組織反饋效率邊界與再組織? / 198
3.4? 科技混合進化優(yōu)勢? / 227
第4章? 反饋效應和可持續(xù)商業(yè)
新商業(yè)成功的本質在于,充分利用數(shù)字化反饋流和自主學習的智能技術所代表的新生產力,這也是這個時代慷慨的紅利,并建立適當?shù)姆答佇獊沓掷m(xù)驅動。
4.1? 不確定性的化解之道? / 242
4.2? 反饋流和新商業(yè)? / 246
4.3? 適應修復市場不連續(xù)性的負反饋? / 268
4.4? 增長正反饋的非線性強化? / 288
4.5? 創(chuàng)新跨周期遷移? / 299
4.6? 智能商業(yè)的定義性模式? / 329
4.7? 復雜性螺旋? / 360
第5章? 運行在底層的反饋系統(tǒng)
更加普適的假設 - 反饋機制中,假設的創(chuàng)造性和反饋的數(shù)字化是兩個第一性的驅動因素,而數(shù)字化仿真環(huán)境中的模擬技術會根本性地加速反饋。
5.1? 創(chuàng)造性假設? / 371
5.2? 反饋驅動智能體? / 387
5.3? 反饋、模擬和計算的未來? / 410
第6章? 來自未知的反饋
一切在我們假設預期之外的反饋往往被我們視為噪聲,而正是這些信號,卻連接著未來;诩僭O - 反饋的框架,借助數(shù)字化反饋和智能技術,融合多學科的進展并回歸共性基礎,更加通用的數(shù)據(jù)驅動的認知科學正在形成。
6.1? 認知的極限? / 429
6.2? 新認知科學? / 436
附錄:關鍵課題快捷索引