90后華人副教授突破30年數(shù)學(xué)猜想!結(jié)論與生成式AI直接相關(guān)
魚(yú)羊
2025-11-2612:45:19 來(lái)源:量子位
證明了布爾超立方體上的塔拉格蘭卷積猜想,結(jié)果精確到一個(gè)log log η因子
魚(yú)羊 發(fā)自 凹非寺
量子位 | 公眾號(hào) QbitAI
困擾數(shù)學(xué)界30多年的塔拉格蘭卷積猜想,被90后華人數(shù)學(xué)家攻破了!
蘇黎世聯(lián)邦理工學(xué)院Yuansi Chen,剛剛在arXiv上發(fā)布了自己的最新研究成果:
論文證明了布爾超立方體上的塔拉格蘭卷積猜想(Talagrand’s convolution conjecture),結(jié)果精確到一個(gè)log log η因子。
這個(gè)結(jié)果引發(fā)了大量關(guān)注,簡(jiǎn)單來(lái)說(shuō),是因?yàn)檫@為理解高維離散空間中的平滑化提供了數(shù)學(xué)論證。
另外,這項(xiàng)研究也與機(jī)器學(xué)習(xí)息息相關(guān):
- 從理論上支撐了機(jī)器學(xué)習(xí)中的正則化概念;
- 為開(kāi)發(fā)處理離散數(shù)據(jù)的生成式AI模型提供了直接的數(shù)學(xué)工具和物理直覺(jué)。
破解30年數(shù)學(xué)難題
塔拉格蘭卷積猜想由“數(shù)學(xué)界諾獎(jiǎng)”——阿貝爾獎(jiǎng)得主Michel Talagrand在1989年提出。
我們先來(lái)了解兩個(gè)概念,其一,是“加熱平滑”:
想象一個(gè)非常高維的空間,比如一個(gè)巨大的多維棋盤(pán),其中每個(gè)方格的狀態(tài)都是二元選擇。其中有一個(gè)函數(shù),這個(gè)函數(shù)可能非?!凹怃J”,有的地方數(shù)值特別大,有的地方數(shù)值特別小。
數(shù)學(xué)上的“卷積”或“熱半群”操作,就像是對(duì)這個(gè)函數(shù)進(jìn)行“加熱”,使得熱量擴(kuò)散,高數(shù)值向周?chē)蛿?shù)值的地方流動(dòng)。結(jié)果就是函數(shù)變得平滑,尖峰被削平了 。
其二,是馬爾可夫不等式:
馬爾可夫不等式告訴我們,一個(gè)非負(fù)隨機(jī)變量取到極大值的概率是很小的。比如平均值是1,那么數(shù)值超過(guò)100(η)的概率最多只有1%(即1/η)。
Talagrand的猜想是,在高斯空間或布爾超立方體等概率空間上對(duì)函數(shù)進(jìn)行“加熱平滑”(卷積)操作后,這個(gè)函數(shù)取到極大值的概率應(yīng)該比馬爾可夫不等式預(yù)測(cè)的還要低得多。
他認(rèn)為這個(gè)概率不僅受1/η控制,還應(yīng)該額外除以一個(gè)跟
有關(guān)的因子。
就是說(shuō),塔拉格蘭卷積猜想認(rèn)為,經(jīng)過(guò)平滑處理的數(shù)據(jù),出現(xiàn)極端異常值的可能性比一般理論預(yù)測(cè)的要低一個(gè)特定的量級(jí)。
△AI生成
此前,這一猜想的高斯形式(連續(xù)空間)已經(jīng)被數(shù)學(xué)家們攻克。但將其推廣到布爾超立方體這樣的離散空間,依然是一個(gè)巨大的挑戰(zhàn)。
因?yàn)楦咚剐问奖唤鉀Q的基礎(chǔ)是連續(xù)空間中微積分和隨機(jī)微分方程提供的平滑性和工具完備性,這些特性都無(wú)法直接被遷移到離散空間中。
對(duì)此,Yuansi Chen的解決思路是,借鑒高斯空間隨機(jī)分析的框架,利用反向熱過(guò)程的特性來(lái)設(shè)計(jì)微擾,以適應(yīng)布爾超立方體的離散特性。
具體來(lái)說(shuō),新的耦合構(gòu)造利用了沿隨機(jī)過(guò)程的擾動(dòng)。其擾動(dòng)項(xiàng)δ不是常數(shù),而依賴于狀態(tài)和坐標(biāo)。
論文最終證明:
表明塔拉格蘭卷積猜想的核心思想是正確的。
這一結(jié)果將原始猜想解決到了僅相差一個(gè)log log η因子的精度。由于log log η的增長(zhǎng)極其緩慢,可以認(rèn)為其接近完整解決了塔拉格蘭卷積猜想。
值得關(guān)注的是,該論文是一篇關(guān)于概率論的純數(shù)學(xué)研究,但其結(jié)果與機(jī)器學(xué)習(xí),乃至生成式AI技術(shù)有直接的關(guān)聯(lián)。
首先,論文中使用的“反向熱過(guò)程”,是擴(kuò)散模型在布爾超立方體上的對(duì)應(yīng),兩者具有很高的相似性。
這意味著這項(xiàng)研究可能有助于理解或開(kāi)發(fā)針對(duì)離散數(shù)據(jù)的擴(kuò)散生成模型。
其次,塔拉格蘭卷積猜想的核心,是量化卷積操作帶來(lái)的正則化效應(yīng)。而在機(jī)器學(xué)習(xí)中,正則化是防止模型過(guò)擬合、提高泛化能力的關(guān)鍵手段。
這一結(jié)果為“為什么平滑化處理或添加噪聲,能讓模型在復(fù)雜高維空間中表現(xiàn)更穩(wěn)定”提供了理論支持。
此外,在機(jī)器學(xué)習(xí)中,很多數(shù)據(jù)本質(zhì)上都是離散和高維的。該研究有助于理解高維離散空間的幾何性質(zhì),對(duì)于發(fā)展關(guān)于二值數(shù)據(jù)或邏輯函數(shù)的學(xué)習(xí)理論很有價(jià)值。
90后華人數(shù)學(xué)家
論文作者Yuansi Chen出生于1990年7月,是浙江寧波人。
他的主要研究方向是統(tǒng)計(jì)機(jī)器學(xué)習(xí)、馬爾可夫鏈蒙特卡羅方法、應(yīng)用概率、高維幾何等。
2019年,他博士畢業(yè)于加州大學(xué)伯克利分校,師從華人統(tǒng)計(jì)學(xué)家郁彬。
在蘇黎世聯(lián)邦理工學(xué)院從事2年博士后研究之后,他在2021年至2024年加盟杜克大學(xué),任統(tǒng)計(jì)科學(xué)系助理教授。2024年初轉(zhuǎn)入蘇黎世聯(lián)邦理工學(xué)院,任副教授。
Google Scholar顯示,他的論文被引數(shù)為1623,h-index為13。
他還是2023年斯隆研究獎(jiǎng)的獲得者。
此前,他在KLS猜想上的工作也受到了不少關(guān)注:困擾數(shù)學(xué)家25年的“切蘋(píng)果”難題,被一位華人統(tǒng)計(jì)學(xué)博士解決了
論文鏈接:
https://arxiv.org/abs/2511.19374
— 完 —
版權(quán)所有,未經(jīng)授權(quán)不得以任何形式轉(zhuǎn)載及使用,違者必究。