訂閱
糾錯(cuò)
加入自媒體

NeurIPS`25 | 感嘆歲月神偷!南開&三星開源Cradle2Cane:完美破解“年齡-身份”兩難困境!

作者:Tao Liu, Dafeng Zhang等

解讀:AI生成未來

亮點(diǎn)直擊

直擊痛點(diǎn),提出“Age-ID Trade-off”: 深入分析了人臉老化任務(wù)中“年齡準(zhǔn)確性”與“身份保持”之間的內(nèi)在矛盾。現(xiàn)有方法往往顧此失彼,而本文提出的框架旨在打破這一零和博弈 。

首創(chuàng)兩階段(Two-Pass)解耦架構(gòu): 提出 Cradle2Cane 框架。第一階段利用自適應(yīng)噪聲注入(AdaNI)專注于“變老”,第二階段利用身份感知Embedding(IDEmb)專注于“找回身份”。這種分而治之的策略實(shí)現(xiàn)了1+1>2的效果 。

巧妙的特征解耦設(shè)計(jì): 引入了 SVR-ArcFace 和 Rotate-CLIP 模塊。通過奇異值重加權(quán)(SVR)剔除ArcFace特征中的年齡干擾,利用球面線性插值(Slerp)在CLIP空間平滑遷移年齡屬性,實(shí)現(xiàn)了身份與年齡特征的精準(zhǔn)剝離與控制 。

基于SDXL-Turbo的高效推理:利用少步(Few-step)擴(kuò)散模型的優(yōu)勢,僅需0.56秒即可生成高質(zhì)量圖像,在保持極高保真度的同時(shí),完美支持從“幼年到老年(Cradle to Cane)”的全年齡段平滑變換 。

解決的問題

長期以來,人臉老化(Face Aging)任務(wù)都面臨一個(gè)核心挑戰(zhàn):如何在大幅度改變年齡特征的同時(shí),完美保留原本的身份信息? 作者將這一挑戰(zhàn)定義為 “Age-ID Trade-off”(年齡-身份權(quán)衡)。

傳統(tǒng)GAN方法(如Lifespan, CUSP):在身份保持上表現(xiàn)尚可,但在處理大跨度年齡變化(如從幼年到老年)時(shí),往往生成模糊,且難以模擬真實(shí)的皮膚紋理和骨骼變化 。

現(xiàn)有Diffusion方法(如FADING):雖然生成畫質(zhì)高,但往往伴隨著嚴(yán)重的身份漂移(Identity Drift),生成的“老年版”看起來像是另一個(gè)人 。 如圖1所示,現(xiàn)有方法的性能曲線往往呈現(xiàn)“trade-off”的趨勢——年齡遷移準(zhǔn)確性越高,身份相似度就越低。反之,身份相似度越高,年齡遷移準(zhǔn)確性就越低。如何打破這一現(xiàn)狀,實(shí)現(xiàn)全生命周期的高保真老化,是本文解決的核心問題。

提出的方案

本文提出了一種基于 SDXL-Turbo 的兩階段(Two-Pass)擴(kuò)散框架 —— Cradle2Cane。該方案的核心思想是“解耦”:將年齡變換和身份保持拆解為兩個(gè)獨(dú)立的子任務(wù)進(jìn)行優(yōu)化。

第一階段(1st Pass):自適應(yīng)噪聲注入 (AdaNI)

這一階段的目標(biāo)是“精準(zhǔn)變老”。 作者發(fā)現(xiàn),年齡跨度越大,所需的圖像結(jié)構(gòu)變化越劇烈。因此,AdaNI 機(jī)制會根據(jù)目標(biāo)年齡與源年齡的差距,動態(tài)調(diào)整注入潛空間(Latent Space)的噪聲水平 。

小跨度: 注入低噪聲,微調(diào)紋理。

大跨度: 注入高噪聲,允許模型對臉型、皺紋、發(fā)際線進(jìn)行大刀闊斧的修改。 雖然這一步會犧牲部分身份信息,但它為生成逼真的老化特征奠定了基礎(chǔ)。

第二階段(2nd Pass):身份感知Embedding (IDEmb)

這一階段的目標(biāo)是“找回身份”。 在第一階段生成的圖像基礎(chǔ)上,模型通過引入 IDEmb 進(jìn)行去噪引導(dǎo)。IDEmb 由兩個(gè)創(chuàng)新模塊組成:

SVR-ArcFace: 傳統(tǒng)ArcFace特征中混雜了年齡信息。作者利用奇異值重加權(quán)(Singular Value Reweighting, SVR)技術(shù),抑制特征中隨年齡變化的成分,提取出更純粹的“身份核心” 。

Rotate-CLIP: 既然CLIP文本特征具有方向性,作者提出在CLIP空間中進(jìn)行“旋轉(zhuǎn)”(Rotate)。通過球面插值(Slerp)而非簡單的向量相減,平滑地將特征導(dǎo)向目標(biāo)年齡,同時(shí)保留語義一致性 。

達(dá)到的效果

平衡的性能

在 CelebA-HQ 和 CelebA-HQ (in-the-wild) 數(shù)據(jù)集上的實(shí)驗(yàn)表明,Cradle2Cane 在 Face++ 和 Qwen-VL 多模態(tài)大模型兩種評估協(xié)議下,均取得了 SOTA 的成績。 特別是在 HCS (Harmonic Consistency Score) 這一綜合指標(biāo)上,本文方法大幅領(lǐng)先于 SAM, CUSP, FADING 等基線模型 。

自然的視覺效果

無論是皺紋的加深、皮膚的松弛,還是發(fā)色的改變(如變白),Cradle2Cane 都能生成極其自然的細(xì)節(jié)。 更重要的是,即使是處理 In-the-wild 的圖片,在面對遮擋、側(cè)臉、復(fù)雜光照時(shí),該模型仍舊能夠展現(xiàn)不錯(cuò)的效果。

靈活的應(yīng)用擴(kuò)展

得益于兩階段編輯的靈活性,除了單獨(dú)改變年齡,該方法還能同步進(jìn)行人臉屬性編輯。比如該方法可以無縫地應(yīng)用各種屬性,例如,戴眼鏡、綠色的頭發(fā)、戴帽子,同時(shí)持續(xù)地進(jìn)行年齡增長,顯著提高了生成圖像的多樣性和可控性。

更多結(jié)果

總結(jié)

Cradle2Cane 的成功證明了在生成式AI時(shí)代,針對特定任務(wù)的結(jié)構(gòu)化解耦設(shè)計(jì)依然具有巨大的潛力。通過放棄“一步到位”的傳統(tǒng)思路,采用由粗到精、先年齡遷移再ID增強(qiáng)的策略,南開大學(xué)與三星的研究團(tuán)隊(duì)為基于Diffusion的人臉年齡編輯任務(wù)提供了一個(gè)新的框架,來解決長久存在的“Age-ID trade-off“問題。 這不僅是一次算法的創(chuàng)新,更讓我們看到了AI在數(shù)字娛樂、影視特效甚至尋找走失人口等社會公益領(lǐng)域的廣闊應(yīng)用前景。

參考文獻(xiàn)

[1] From Cradle to Cane: A Two-Pass Framework for High-Fidelity Lifespan Face Aging

       原文標(biāo)題 : NeurIPS`25 | 感嘆歲月神偷!南開&三星開源Cradle2Cane:完美破解“年齡-身份”兩難困境!

聲明: 本文由入駐維科號的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報(bào)。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個(gè)字

您提交的評論過于頻繁,請輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無評論

暫無評論

    人工智能 獵頭職位 更多
    掃碼關(guān)注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號