直擊WAIC丨騰訊吳運聲:AI技術正從圖文問答向全方位多模態(tài)交互演進
新浪科技訊 7月27日上午消息,在近日開幕的2025世界人工智能大會上,“Tencent AI Talk智能涌現(xiàn)”論壇舉行。
論壇上,騰訊云副總裁、騰訊云智能負責人、優(yōu)圖實驗室負責人吳運聲透露了其對AI技術演進的觀察,他認為主要有三個趨勢:
第一,現(xiàn)在的AI是從到短期記憶到長期記憶的演進,在很長一段時間里面,大模型只能記住比較短的上下文,或者說把用戶一段時間里面的對話記錄給記住,但這個情況下對于支持一些超長的復雜任務是不夠的。
另外,在很多模型在執(zhí)行一些復雜任務的時候,它需要去調(diào)用工具,往往需要記住更多信息,這對長期記憶提出了更高要求。
第二,AI技術正在從圖文問答向全方位的多模態(tài)交互演進。用戶的交互輸入輸出不僅僅是圖片或者文字,會有各種各樣的形態(tài)的輸入輸出,因此
需要對這樣的感知去做多層次多方位的理解,甚至需要對空間去進行全面的感知。所以在這種情況下,需要一種全模態(tài)的無縫的交互。
第三,過去的智能體發(fā)展里面,很多時候是依賴于單智能體的能力。單智能體借助于模型和對工具的自動思考和調(diào)度去完成任務。但是對于一些很復雜的任務,單智能體是不夠的。如果有不同的智能體負責不同的專業(yè),去讓各種各樣智能體做協(xié)同,才能去完成更加復雜的任務。

轉(zhuǎn)載請注明來自山西智睿祥新能源有限公司,本文標題:《直擊WAIC丨騰訊吳運聲:AI技術正從圖文問答向全方位多模態(tài)交互演進》

每一天,每一秒,你所做的決定都會改變你的人生!