倍漾量化創(chuàng)始人馮霽:大模型重構(gòu)量化投研整條生產(chǎn)線(xiàn)
7月12日,第四屆·中國(guó)量化投資白皮書(shū)研討會(huì)暨園游會(huì)舉辦,倍漾量化創(chuàng)始人馮霽出席會(huì)議,并發(fā)表“大模型時(shí)代的量化投資”主題演講。

他表示,今天面向同行就說(shuō)點(diǎn)“干貨”。倍漾量化主打高換手,成立第一天就用“AI 原生”思路做資管——像搭 AI 科技公司那樣搭投研系統(tǒng)。當(dāng)年大家質(zhì)疑“機(jī)器學(xué)習(xí)能炒股嗎?”現(xiàn)在已無(wú)人再問(wèn)。
先補(bǔ)一點(diǎn)理論,機(jī)器學(xué)習(xí)的核心只有一句話(huà):在訓(xùn)練集上學(xué)到的函數(shù),如何在沒(méi)見(jiàn)過(guò)的數(shù)據(jù)上依舊有效?這就是泛化。80 年代圖靈獎(jiǎng)得主 Valiant 給出的 PAC 學(xué)習(xí)框架把它形式化:只要算法能以大概率保證誤差有界,我們就敢把模型搬到實(shí)盤(pán)。
那金融市場(chǎng)能不能學(xué)? 市場(chǎng)非有效,除當(dāng)前價(jià)格外還有信息可被利用; 時(shí)序分布會(huì)漂移,但高頻數(shù)據(jù)漂移最慢——分鐘級(jí)、tick 級(jí)幾乎滿(mǎn)足獨(dú)立同分布;樣本量極大:滬深交易所一天 3 億筆,千日就是 3,000 億點(diǎn)。馮霽指出:在高頻領(lǐng)域,機(jī)器學(xué)習(xí)不僅可學(xué),而且只會(huì)“欠擬合”,不會(huì)“過(guò)擬合”。
再說(shuō)“黑盒不可交易”的誤解。可解釋有兩條路:用白盒逼近黑盒,再把可解釋部分全部扣掉,剩下的才是真 Alpha——Barra 框架早就在做,我們把它搬到高頻維度;不解釋模型,只監(jiān)控統(tǒng)計(jì)量。就像你敢坐高鐵是因?yàn)槭鹿矢怕蕵O低,而不是司機(jī)隨時(shí)向你解釋操作。只要監(jiān)控指標(biāo)穩(wěn)定,就能上實(shí)盤(pán)。
大模型來(lái)了,游戲規(guī)則重寫(xiě)。NLP 以前是分詞→詞性→特征→模型→評(píng)估的流水線(xiàn),現(xiàn)在三步完成:預(yù)訓(xùn)練→監(jiān)督微調(diào)→強(qiáng)化學(xué)習(xí)。量化投研也會(huì)走同一條路——不是修修補(bǔ)補(bǔ),而是整條生產(chǎn)線(xiàn)重構(gòu)。
倍漾已經(jīng)把團(tuán)隊(duì)拆成兩塊:機(jī)器學(xué)習(xí)組——負(fù)責(zé)“準(zhǔn)”;高性能計(jì)算組——負(fù)責(zé)“快”。沒(méi)有“因子崗”,所有人圍繞一個(gè)統(tǒng)一底座迭代。
為什么短周期最先被 AI 攻下? 無(wú)效性多,信號(hào)足;分布穩(wěn),可學(xué)習(xí);非線(xiàn)性模式豐富,人工難刻畫(huà)。周期越短,AI 壟斷性越強(qiáng);周期越長(zhǎng),難度指數(shù)級(jí)上升。
AI 投研系統(tǒng)還有一大優(yōu)勢(shì):升級(jí)可規(guī)劃。傳統(tǒng)投研靠靈感,我們像軟件工程一樣排期:GPT-2 出來(lái)就能預(yù)見(jiàn) GPT-4 長(zhǎng)什么樣。倍漾內(nèi)部研發(fā)排期已排到三個(gè)月后,國(guó)慶前哪些能力會(huì)提升多少,現(xiàn)在就能寫(xiě)下 OKR。
備注:本文由AI輔助,根據(jù)直播速記整理而來(lái),未經(jīng)本人確認(rèn),基金有風(fēng)險(xiǎn),投資需謹(jǐn)慎!
轉(zhuǎn)載請(qǐng)注明來(lái)自山西智睿祥新能源有限公司,本文標(biāo)題:《倍漾量化創(chuàng)始人馮霽:大模型重構(gòu)量化投研整條生產(chǎn)線(xiàn)》
