辛頓、周伯文對話實(shí)錄:涉及大模型、如何訓(xùn)練善良的超級智能以及給年輕科學(xué)家的建議
7月26日下午,人工智能教父 杰弗里·辛頓(Geoffrey Hinton )與上海人工智能實(shí)驗(yàn)室主任、首席科學(xué)家周伯文開展了一場尖峰對話。在17分鐘的對話中,兩位科學(xué)家談及AI多模態(tài)大模型前沿、“主觀體驗(yàn)”和“意識”、如何訓(xùn)練“善良”的超級智能、AI與科學(xué)發(fā)現(xiàn),以及給年輕科學(xué)家的建議。
當(dāng)78歲的辛頓步入會場時(shí),全場起立鼓掌,觀眾們高舉手機(jī)長達(dá)數(shù)分鐘,直播畫面中一度無法看到臺上的嘉賓。以下為對話全文實(shí)錄。

周伯文:Jeff,您能親臨現(xiàn)場對我們所有人來說都是莫大的榮幸。我想請教一個您本周早些時(shí)候提到過,但今天上午沒有時(shí)間在臺上討論的問題——關(guān)于多模態(tài)模型的主觀體驗(yàn)。您認(rèn)為可以證明即使是當(dāng)今的多模態(tài)和語言模型也能發(fā)展出自己的主觀體驗(yàn)。您能詳細(xì)闡述一下嗎?
Hinton:我認(rèn)為關(guān)于它們是否具有意識或主觀體驗(yàn)的問題,嚴(yán)格來說不是一個科學(xué)問題,而是取決于您如何定義“主觀體驗(yàn)”或“意識”。我們大多數(shù)人對這些概念的理解模型都是完全錯誤的。就像人們可以正確使用詞語,卻對詞語如何運(yùn)作持有完全錯誤的理論。
讓我用一個日常詞匯的例子來說明。想想“水平”和“垂直”這兩個詞。大多數(shù)人都認(rèn)為自己理解它們的含義,但實(shí)際上他們的理解是錯誤的。我來證明一下:假設(shè)我手里有很多小鋁棒,它們朝向各個方向。我把它們拋向空中,它們翻滾、碰撞,然后我突然讓時(shí)間靜止。
這時(shí)空中有很多鋁棒。問題是:在垂直方向1度范圍內(nèi)的鋁棒更多,還是水平方向1度范圍內(nèi)的鋁棒更多?或者數(shù)量差不多?幾乎所有人都說“差不多”,因?yàn)樗麄儗υ~語運(yùn)作方式的理解是錯誤的。實(shí)際上,水平方向1度范圍內(nèi)的鋁棒數(shù)量是垂直方向的約114倍。這是因?yàn)椤按怪薄笔欠浅L厥獾姆较颍八健眲t很普通。但人們不知道這一點(diǎn)。
這個例子看似與意識問題無關(guān),但它說明:我們對詞語運(yùn)作方式的理解可能是完全錯誤的。同樣,幾乎每個人都對“主觀體驗(yàn)”這類術(shù)語有著強(qiáng)烈但完全錯誤的理論。這不是真正的科學(xué)問題,而是源于我們對心理狀態(tài)的錯誤模型。我們有這些用來描述心理狀態(tài)如何運(yùn)作的術(shù)語。并且有了錯誤的模型,我認(rèn)為你會做出錯誤的預(yù)測。所以,我的觀點(diǎn)是,當(dāng)今的多模態(tài)聊天機(jī)器人已經(jīng)具有意識。
周伯文:所以,這聽起來讓在場的許多研究者感到震驚,但讓我告訴你,我剛才從另一位加拿大科學(xué)家那里聽到的,就在這次會議上,Richard Sutton 就在你之前做了一個演講,題目是《歡迎來到體驗(yàn)時(shí)代》。我認(rèn)為他的意思是,當(dāng)我們現(xiàn)在已經(jīng)耗盡人類數(shù)據(jù)時(shí),模型可以從自己的體驗(yàn)中學(xué)習(xí)很多。您從另一個角度闡明了,Agent或多模態(tài)LLM,不僅從經(jīng)驗(yàn)中學(xué)習(xí),它們還可以發(fā)展出自己的主觀體驗(yàn)。所以我認(rèn)為理查德今天沒有過多觸及這種從主觀體驗(yàn)中學(xué)習(xí)潛在風(fēng)險(xiǎn)。您想多說說這個嗎?事實(shí),或者說您的理論、您的假設(shè),即到目前為止,Agent可以學(xué)習(xí)主觀體驗(yàn),這是否會在未來帶來任何潛在風(fēng)險(xiǎn)?
Hinton:確實(shí),目前的情況是,例如,大語言模型從我們提供給它們的文檔中學(xué)習(xí)。它們學(xué)會了預(yù)測一個人會說的下一個詞。但是,一旦你有像機(jī)器人這樣的在世界中的Agent,它們就可以從自己的經(jīng)驗(yàn)中學(xué)習(xí),而且我認(rèn)為它們最終會學(xué)到比我們多得多。我認(rèn)為它們會有經(jīng)驗(yàn),但經(jīng)驗(yàn)不是事物。而且經(jīng)驗(yàn)不像照片,經(jīng)驗(yàn)是你和一個物體之間的關(guān)系。
周伯文:所以,幾天前當(dāng)我們在IDAIS討論前沿風(fēng)險(xiǎn)時(shí),您提到了一種減少未來AI風(fēng)險(xiǎn)的可能解決方案,就是找到一種方法來訓(xùn)練AI的分離目標(biāo)。例如,一個善良的AI,一個聰明的AI。您有一個理論……
Hinton:我不是那個意思。我的意思是,你會有既聰明又善良的AI,但如何訓(xùn)練它變得聰明和如何訓(xùn)練它變得善良是不同的問題。你可以有讓它善良的技術(shù)和讓它聰明的技術(shù)。它將是同一個AI,但會有不同的技術(shù)。所以,國家可以分享讓它善良的技術(shù),即使它們不愿意分享讓它聰明的技術(shù)。
周伯文:我真的很喜歡那個想法。但是,我對我們能在這方面走多遠(yuǎn)有些疑問。你認(rèn)為會有某種通用的AI訓(xùn)練來使AI變得善良嗎?這些方法可以應(yīng)用于任何AI模型、任何智能水平?
Hinton:那是我的希望。它可能不是真的。但這是一種可能性。我認(rèn)為我們應(yīng)該研究這種可能性。
周伯文:是的,確實(shí)如此。我提出這個問題并不是因?yàn)槲也幌矚g這個想法,而是因?yàn)槲蚁胩岣呷藗兊囊庾R,讓更多人能在您提到的方向上進(jìn)行更多研究。而且我想在這里做一個類比,來向您展示為什么我有這個疑問。以物理學(xué)為例,當(dāng)物體以低得多的速度運(yùn)動時(shí),牛頓定律是有效的。但是當(dāng)這個物體運(yùn)動到更高的速度,接近光速時(shí),牛頓定律就不再適用了,所以我們必須求助于愛因斯坦來獲得更好的解決方案。順便說一下,這有點(diǎn)好笑,因?yàn)槲艺谙蛞晃恢Z貝爾物理學(xué)獎得主講解物理學(xué)101(大學(xué)物理入門課)。
Hinton:但這是一個錯誤。
周伯文:哦不,這不是錯誤。你絕對值得獲得諾貝爾獎。
Hinton:他們真的很想在人工智能領(lǐng)域頒發(fā)諾貝爾獎,但他們沒有這個獎項(xiàng)。所以他們拿了一個物理學(xué)的獎頒給人工智能(的科學(xué)家)。
周伯文:但我想用這個類比來說明一個觀點(diǎn),我認(rèn)為對于不同層次的智能系統(tǒng),善意約束可能需要改變。我不知道這是否正確,但我確實(shí)希望在這個房間里或在網(wǎng)上的那些聰明的年輕人,他們可以想出辦法來實(shí)現(xiàn)這一點(diǎn)。
Hinton:是的,很有可能,隨著系統(tǒng)變得更加智能,讓它變得善良的技術(shù)也會發(fā)生變化。我們不知道。這就是我們現(xiàn)在需要對其進(jìn)行大量研究的原因之一。
周伯文:很多人對Jeff印象深刻,作為一位成就卓著的人,你經(jīng)常說,“我不知道”。我覺得這非常誠實(shí)和開明。我們都要向你學(xué)習(xí)。
除了AI問題,我們現(xiàn)場還有一半來自不同科學(xué)領(lǐng)域的頂尖學(xué)者——量子物理、生物學(xué)等。今天我們齊聚一堂,正是因?yàn)橄嘈臕I與科學(xué)的交叉融合將帶來突破。您如何看待用AI推動科學(xué)進(jìn)步,或者反過來用科學(xué)促進(jìn)AI發(fā)展?
Hinton:我認(rèn)為人工智能對科學(xué)的幫助是顯而易見的。顯然,迄今為止最令人印象深刻的例子是蛋白質(zhì)折疊,Demis Hassabis和John Jumper等人通過合理使用人工智能并付出大量努力,證明了這一點(diǎn)。他們花了五年時(shí)間。他們都是非常聰明的人。在預(yù)測蛋白質(zhì)如何折疊方面,我們(借助AI)可以做得更好。我認(rèn)為這是一個早期的標(biāo)志,表明在現(xiàn)在的許多領(lǐng)域,人工智能都將改善科學(xué)。我聽說了上海AI實(shí)驗(yàn)室的例子,在預(yù)測臺風(fēng)登陸地點(diǎn)和天氣預(yù)報(bào)方面,人工智能可以做得更好一些。
周伯文:對,我們用AI模型做出來的結(jié)果,比基于PDE(偏微分方程系統(tǒng))的傳統(tǒng)物理模型表現(xiàn)更優(yōu)。
在您卓越的學(xué)術(shù)生涯中,您不僅拓展了AI技術(shù)的疆界,更深刻影響了下一代科研工作者。我曾與許多比您更年輕的學(xué)者交流,他們都對您充滿敬仰。在上海人工智能實(shí)驗(yàn)室,我們的研究人員平均年齡只有30歲——這清晰地表明,AI的未來屬于年輕一代。
(看向在場年輕研究者)您的智慧之光正照耀著這些年輕的面孔。不知您是否愿意分享:對于AGI的下一代發(fā)展,您有何見解?或者,您能否愿意給這些年輕人一些加速成長的建議,一些他們能帶回家、能自豪告訴父母的智慧箴言——畢竟今天與您相遇是一段珍貴的經(jīng)歷,他們將來也許還會告訴自己的子女。
您最想傳遞給他們什么?
Hinton:我想最核心的建議是:若想做出真正原創(chuàng)的研究,就要尋找那些“所有人都可能做錯”的領(lǐng)域。通常當(dāng)你認(rèn)為“眾人皆錯”時(shí),經(jīng)過探索最終會發(fā)現(xiàn)傳統(tǒng)方法的合理性——但這恰恰說明:你永遠(yuǎn)不該輕易放棄新思路,除非自己真正理解它為何行不通。即便導(dǎo)師否定你的方法,也要保持質(zhì)疑。
堅(jiān)持你所相信的,直到你自己明白為何它是錯的。只是偶爾,你會繼續(xù)堅(jiān)持你的信仰——而它最終被證明是正確的。重大突破正是由此而來,它們從不屬于輕易放棄之人。你必須堅(jiān)持己見,即使他人并不認(rèn)同。
有一個邏輯支撐這一觀點(diǎn):你要么擁有好的直覺,要么擁有壞的直覺。
若你的直覺是好的,那你顯然應(yīng)該堅(jiān)持它;
若你的直覺是壞的,你做什么其實(shí)都無關(guān)緊要——所以你依然應(yīng)該堅(jiān)持自己的直覺。
周伯文:我想我們可以就此暢談一整天,但我知道您已疲憊。最后,請?jiān)趫鏊腥穗S我一同感謝杰夫?yàn)槲覀儍A注的時(shí)間。非常感謝您!
轉(zhuǎn)載請注明來自山西智睿祥新能源有限公司,本文標(biāo)題:《辛頓、周伯文對話實(shí)錄:涉及大模型、如何訓(xùn)練善良的超級智能以及給年輕科學(xué)家的建議》
