辛頓、周伯文對話實(shí)錄：涉及大模型、如何訓(xùn)練善良的超級智能以及給年輕科學(xué)家的建議

zdgjhnb666 2025-07-27 生活常識 3 次瀏覽 0個評論

7月26日下午，人工智能教父杰弗里·辛頓（Geoffrey Hinton ）與上海人工智能實(shí)驗(yàn)室主任、首席科學(xué)家周伯文開展了一場尖峰對話。在17分鐘的對話中，兩位科學(xué)家談及AI多模態(tài)大模型前沿、“主觀體驗(yàn)”和“意識”、如何訓(xùn)練“善良”的超級智能、AI與科學(xué)發(fā)現(xiàn)，以及給年輕科學(xué)家的建議。

當(dāng)78歲的辛頓步入會場時(shí)，全場起立鼓掌，觀眾們高舉手機(jī)長達(dá)數(shù)分鐘，直播畫面中一度無法看到臺上的嘉賓。以下為對話全文實(shí)錄。

周伯文：Jeff，您能親臨現(xiàn)場對我們所有人來說都是莫大的榮幸。我想請教一個您本周早些時(shí)候提到過，但今天上午沒有時(shí)間在臺上討論的問題——關(guān)于多模態(tài)模型的主觀體驗(yàn)。您認(rèn)為可以證明即使是當(dāng)今的多模態(tài)和語言模型也能發(fā)展出自己的主觀體驗(yàn)。您能詳細(xì)闡述一下嗎？

Hinton：我認(rèn)為關(guān)于它們是否具有意識或主觀體驗(yàn)的問題，嚴(yán)格來說不是一個科學(xué)問題，而是取決于您如何定義“主觀體驗(yàn)”或“意識”。我們大多數(shù)人對這些概念的理解模型都是完全錯誤的。就像人們可以正確使用詞語，卻對詞語如何運(yùn)作持有完全錯誤的理論。

讓我用一個日常詞匯的例子來說明。想想“水平”和“垂直”這兩個詞。大多數(shù)人都認(rèn)為自己理解它們的含義，但實(shí)際上他們的理解是錯誤的。我來證明一下：假設(shè)我手里有很多小鋁棒，它們朝向各個方向。我把它們拋向空中，它們翻滾、碰撞，然后我突然讓時(shí)間靜止。

這時(shí)空中有很多鋁棒。問題是：在垂直方向1度范圍內(nèi)的鋁棒更多，還是水平方向1度范圍內(nèi)的鋁棒更多？或者數(shù)量差不多？幾乎所有人都說“差不多”，因?yàn)樗麄儗υ~語運(yùn)作方式的理解是錯誤的。實(shí)際上，水平方向1度范圍內(nèi)的鋁棒數(shù)量是垂直方向的約114倍。這是因?yàn)椤按怪薄笔欠浅Ｌ厥獾姆较颍八健眲t很普通。但人們不知道這一點(diǎn)。

這個例子看似與意識問題無關(guān)，但它說明：我們對詞語運(yùn)作方式的理解可能是完全錯誤的。同樣，幾乎每個人都對“主觀體驗(yàn)”這類術(shù)語有著強(qiáng)烈但完全錯誤的理論。這不是真正的科學(xué)問題，而是源于我們對心理狀態(tài)的錯誤模型。我們有這些用來描述心理狀態(tài)如何運(yùn)作的術(shù)語。并且有了錯誤的模型，我認(rèn)為你會做出錯誤的預(yù)測。所以，我的觀點(diǎn)是，當(dāng)今的多模態(tài)聊天機(jī)器人已經(jīng)具有意識。

周伯文：所以，這聽起來讓在場的許多研究者感到震驚，但讓我告訴你，我剛才從另一位加拿大科學(xué)家那里聽到的，就在這次會議上，Richard Sutton 就在你之前做了一個演講，題目是《歡迎來到體驗(yàn)時(shí)代》。我認(rèn)為他的意思是，當(dāng)我們現(xiàn)在已經(jīng)耗盡人類數(shù)據(jù)時(shí)，模型可以從自己的體驗(yàn)中學(xué)習(xí)很多。您從另一個角度闡明了，Agent或多模態(tài)LLM，不僅從經(jīng)驗(yàn)中學(xué)習(xí)，它們還可以發(fā)展出自己的主觀體驗(yàn)。所以我認(rèn)為理查德今天沒有過多觸及這種從主觀體驗(yàn)中學(xué)習(xí)潛在風(fēng)險(xiǎn)。您想多說說這個嗎？事實(shí)，或者說您的理論、您的假設(shè)，即到目前為止，Agent可以學(xué)習(xí)主觀體驗(yàn)，這是否會在未來帶來任何潛在風(fēng)險(xiǎn)？

Hinton：確實(shí)，目前的情況是，例如，大語言模型從我們提供給它們的文檔中學(xué)習(xí)。它們學(xué)會了預(yù)測一個人會說的下一個詞。但是，一旦你有像機(jī)器人這樣的在世界中的Agent，它們就可以從自己的經(jīng)驗(yàn)中學(xué)習(xí)，而且我認(rèn)為它們最終會學(xué)到比我們多得多。我認(rèn)為它們會有經(jīng)驗(yàn)，但經(jīng)驗(yàn)不是事物。而且經(jīng)驗(yàn)不像照片，經(jīng)驗(yàn)是你和一個物體之間的關(guān)系。

周伯文：所以，幾天前當(dāng)我們在IDAIS討論前沿風(fēng)險(xiǎn)時(shí)，您提到了一種減少未來AI風(fēng)險(xiǎn)的可能解決方案，就是找到一種方法來訓(xùn)練AI的分離目標(biāo)。例如，一個善良的AI，一個聰明的AI。您有一個理論……

Hinton：我不是那個意思。我的意思是，你會有既聰明又善良的AI，但如何訓(xùn)練它變得聰明和如何訓(xùn)練它變得善良是不同的問題。你可以有讓它善良的技術(shù)和讓它聰明的技術(shù)。它將是同一個AI，但會有不同的技術(shù)。所以，國家可以分享讓它善良的技術(shù)，即使它們不愿意分享讓它聰明的技術(shù)。

周伯文：我真的很喜歡那個想法。但是，我對我們能在這方面走多遠(yuǎn)有些疑問。你認(rèn)為會有某種通用的AI訓(xùn)練來使AI變得善良嗎？這些方法可以應(yīng)用于任何AI模型、任何智能水平？

Hinton：那是我的希望。它可能不是真的。但這是一種可能性。我認(rèn)為我們應(yīng)該研究這種可能性。

周伯文：是的，確實(shí)如此。我提出這個問題并不是因?yàn)槲也幌矚g這個想法，而是因?yàn)槲蚁胩岣呷藗兊囊庾R，讓更多人能在您提到的方向上進(jìn)行更多研究。而且我想在這里做一個類比，來向您展示為什么我有這個疑問。以物理學(xué)為例，當(dāng)物體以低得多的速度運(yùn)動時(shí)，牛頓定律是有效的。但是當(dāng)這個物體運(yùn)動到更高的速度，接近光速時(shí)，牛頓定律就不再適用了，所以我們必須求助于愛因斯坦來獲得更好的解決方案。順便說一下，這有點(diǎn)好笑，因?yàn)槲艺谙蛞晃恢Z貝爾物理學(xué)獎得主講解物理學(xué)101（大學(xué)物理入門課）。

Hinton：但這是一個錯誤。

周伯文：哦不，這不是錯誤。你絕對值得獲得諾貝爾獎。

Hinton：他們真的很想在人工智能領(lǐng)域頒發(fā)諾貝爾獎，但他們沒有這個獎項(xiàng)。所以他們拿了一個物理學(xué)的獎頒給人工智能（的科學(xué)家）。

周伯文：但我想用這個類比來說明一個觀點(diǎn)，我認(rèn)為對于不同層次的智能系統(tǒng)，善意約束可能需要改變。我不知道這是否正確，但我確實(shí)希望在這個房間里或在網(wǎng)上的那些聰明的年輕人，他們可以想出辦法來實(shí)現(xiàn)這一點(diǎn)。

Hinton：是的，很有可能，隨著系統(tǒng)變得更加智能，讓它變得善良的技術(shù)也會發(fā)生變化。我們不知道。這就是我們現(xiàn)在需要對其進(jìn)行大量研究的原因之一。

周伯文：很多人對Jeff印象深刻，作為一位成就卓著的人，你經(jīng)常說，“我不知道”。我覺得這非常誠實(shí)和開明。我們都要向你學(xué)習(xí)。

除了AI問題，我們現(xiàn)場還有一半來自不同科學(xué)領(lǐng)域的頂尖學(xué)者——量子物理、生物學(xué)等。今天我們齊聚一堂，正是因?yàn)橄嘈臕I與科學(xué)的交叉融合將帶來突破。您如何看待用AI推動科學(xué)進(jìn)步，或者反過來用科學(xué)促進(jìn)AI發(fā)展？

Hinton：我認(rèn)為人工智能對科學(xué)的幫助是顯而易見的。顯然，迄今為止最令人印象深刻的例子是蛋白質(zhì)折疊，Demis Hassabis和John Jumper等人通過合理使用人工智能并付出大量努力，證明了這一點(diǎn)。他們花了五年時(shí)間。他們都是非常聰明的人。在預(yù)測蛋白質(zhì)如何折疊方面，我們（借助AI）可以做得更好。我認(rèn)為這是一個早期的標(biāo)志，表明在現(xiàn)在的許多領(lǐng)域，人工智能都將改善科學(xué)。我聽說了上海AI實(shí)驗(yàn)室的例子，在預(yù)測臺風(fēng)登陸地點(diǎn)和天氣預(yù)報(bào)方面，人工智能可以做得更好一些。

周伯文：對，我們用AI模型做出來的結(jié)果，比基于PDE（偏微分方程系統(tǒng)）的傳統(tǒng)物理模型表現(xiàn)更優(yōu)。

在您卓越的學(xué)術(shù)生涯中，您不僅拓展了AI技術(shù)的疆界，更深刻影響了下一代科研工作者。我曾與許多比您更年輕的學(xué)者交流，他們都對您充滿敬仰。在上海人工智能實(shí)驗(yàn)室，我們的研究人員平均年齡只有30歲——這清晰地表明，AI的未來屬于年輕一代。

（看向在場年輕研究者）您的智慧之光正照耀著這些年輕的面孔。不知您是否愿意分享：對于AGI的下一代發(fā)展，您有何見解？或者，您能否愿意給這些年輕人一些加速成長的建議，一些他們能帶回家、能自豪告訴父母的智慧箴言——畢竟今天與您相遇是一段珍貴的經(jīng)歷，他們將來也許還會告訴自己的子女。

您最想傳遞給他們什么？

Hinton：我想最核心的建議是：若想做出真正原創(chuàng)的研究，就要尋找那些“所有人都可能做錯”的領(lǐng)域。通常當(dāng)你認(rèn)為“眾人皆錯”時(shí)，經(jīng)過探索最終會發(fā)現(xiàn)傳統(tǒng)方法的合理性——但這恰恰說明：你永遠(yuǎn)不該輕易放棄新思路，除非自己真正理解它為何行不通。即便導(dǎo)師否定你的方法，也要保持質(zhì)疑。

堅(jiān)持你所相信的，直到你自己明白為何它是錯的。只是偶爾，你會繼續(xù)堅(jiān)持你的信仰——而它最終被證明是正確的。重大突破正是由此而來，它們從不屬于輕易放棄之人。你必須堅(jiān)持己見，即使他人并不認(rèn)同。

有一個邏輯支撐這一觀點(diǎn)：你要么擁有好的直覺，要么擁有壞的直覺。

若你的直覺是好的，那你顯然應(yīng)該堅(jiān)持它；

若你的直覺是壞的，你做什么其實(shí)都無關(guān)緊要——所以你依然應(yīng)該堅(jiān)持自己的直覺。

周伯文：我想我們可以就此暢談一整天，但我知道您已疲憊。最后，請?jiān)趫鏊腥穗S我一同感謝杰夫?yàn)槲覀儍A注的時(shí)間。非常感謝您！

轉(zhuǎn)載請注明來自山西智睿祥新能源有限公司，本文標(biāo)題：《辛頓、周伯文對話實(shí)錄：涉及大模型、如何訓(xùn)練善良的超級智能以及給年輕科學(xué)家的建議》

zdgjhnb666 9464篇文章站點(diǎn) 微博

每一天，每一秒，你所做的決定都會改變你的人生！