圖靈獎(jiǎng)得主約書亞?本吉奧:欺騙和自我保護(hù)行為在強(qiáng)模型中更加明顯
2025世界人工智能大會(huì)(WAIC 2025)于7月26-28日在上海舉辦。圖靈獎(jiǎng)得主約書亞?本吉奧表示,人工智能的規(guī)劃推理能力有望在10年內(nèi)達(dá)到人類水平。
他提醒,若缺乏堅(jiān)實(shí)防護(hù)措施,強(qiáng)大的人工智能系統(tǒng)可能放大現(xiàn)有風(fēng)險(xiǎn),如虛假信息、網(wǎng)絡(luò)攻擊和生物威脅等。更令人擔(dān)憂的是,人類可能失去對自我保護(hù)型智能體的控制,這些智能體認(rèn)知能力或?qū)⒑芸斐饺祟悺<幢泔L(fēng)險(xiǎn)很小,超級智能與人類競爭也可能帶來災(zāi)難性后果,甚至導(dǎo)致人類滅絕。
他強(qiáng)調(diào),只要科學(xué)界仍有相當(dāng)比例認(rèn)為這種情況可能發(fā)生,就必須保持最高警惕。目前尚無科學(xué)驗(yàn)證方法確保人工智能可信且始終遵從人類意圖。更糟糕的是,欺騙和自我保護(hù)行為在最強(qiáng)模型中似乎更加明顯。

新浪聲明:所有會(huì)議實(shí)錄均為現(xiàn)場速記整理,未經(jīng)演講者審閱,新浪網(wǎng)登載此文出于傳遞更多信息之目的,并不意味著贊同其觀點(diǎn)或證實(shí)其描述。
轉(zhuǎn)載請注明來自山西智睿祥新能源有限公司,本文標(biāo)題:《圖靈獎(jiǎng)得主約書亞?本吉奧:欺騙和自我保護(hù)行為在強(qiáng)模型中更加明顯》

每一天,每一秒,你所做的決定都會(huì)改變你的人生!