Voost:一個(gè)虛擬試穿和試脫工具
Voost 是由 Seungyong Lee 和 Jeong-gi Kwak 提出的ai虛擬試穿試脫工具,核心是通過一個(gè)擴(kuò)散變換器(DiT)同時(shí)搞定試穿和試脫兩件事。它的特點(diǎn)是不用單獨(dú)搞任務(wù)網(wǎng)絡(luò)、不用額外加標(biāo)簽,還能讓每套衣服和人的搭配雙向“監(jiān)督”學(xué)習(xí)——既看試穿效果,也看試脫效果,這樣能更準(zhǔn)地理解衣服和身體的關(guān)系,比如衣服怎么貼皮膚、褶皺怎么堆。另外還加了兩個(gè)實(shí)用技術(shù):注意力溫度縮放(讓模型在不同分辨率下更穩(wěn))和自校正采樣(通過試穿/試脫互相驗(yàn)證來減少錯(cuò)誤),實(shí)測(cè)在試穿和試脫測(cè)試?yán)镄Ч际琼敿獾?,衣服?xì)節(jié)(像紋理、褶皺)、和人體姿勢(shì)的貼合度都不錯(cuò),而且能適應(yīng)各種衣服類型、材質(zhì),還有不同人的姿勢(shì)。

??功能特點(diǎn)
雙向?qū)W習(xí)還原細(xì)節(jié):試穿和試脫一起學(xué),通過雙向監(jiān)督更懂衣服和身體的互動(dòng),像衣服的褶皺、面料紋理這些細(xì)節(jié)都能還原得更真。
生成效果接近真實(shí):能從多個(gè)角度展示試穿效果,不管胖瘦、站坐蹲,衣服穿在身上的樣子都更貼近實(shí)際。
適應(yīng)性強(qiáng)少依賴:不用專門為某種衣服或場(chǎng)景單獨(dú)調(diào)模型,也不用大量人工打標(biāo)簽,普通照片或攝像頭拍的圖就能用。
??技術(shù)原理
核心方法:用擴(kuò)散變換器(DiT)作為“大腦”,通過交叉注意力把衣服的特征和人體的模型“揉”在一起,連衣服上一根線、一個(gè)褶子都能精細(xì)合成。
優(yōu)化技巧:
注意力溫度縮放:像調(diào)節(jié)“敏感度開關(guān)”,讓模型在不同清晰度或遮擋情況下(比如手擋住部分衣服)也能穩(wěn)定輸出。
自校正采樣:試穿和試脫互相“檢查”——比如試穿時(shí)看試脫的反向邏輯對(duì)不對(duì),減少生成錯(cuò)誤。
操作流程:用戶上傳清晰的正臉/側(cè)臉照片,或者直接用攝像頭拍,系統(tǒng)自動(dòng)把人“建?!背鰜?,再把衣服“穿”上去。
??Voost能用在哪里?
網(wǎng)購衣服:不用試穿,直接在APP里看看衣服上身啥樣,避免買回來尺碼不對(duì)或版型不合。
服裝設(shè)計(jì):設(shè)計(jì)師改版型或搭配時(shí),先虛擬試試效果,不用反復(fù)做樣衣。
社交分享:在社交平臺(tái)里用Voost“試穿”衣服,發(fā)穿搭圖更有意思。
線下門店:結(jié)合AR技術(shù)搞個(gè)虛擬試衣鏡,顧客站在鏡子前就能換裝,科技感拉滿。
??Voost怎么用步驟?
Hugging Face 公開DEMO即將發(fā)布。
選擇試穿或試脫模式;
選擇所需服裝類型(試穿包含上裝、下裝、全套);
上傳模特圖像(可選:使用繪圖工具創(chuàng)建掩碼);
上傳服裝圖像;
點(diǎn)擊按鈕運(yùn)行模型。

??常見問題
?:Voost 和其他試穿工具比,最厲害的地方是什么?
A:它用一個(gè)擴(kuò)散變換器同時(shí)學(xué)試穿和試脫,不用單獨(dú)搞任務(wù)網(wǎng)絡(luò)或額外標(biāo)簽,還能雙向監(jiān)督學(xué)習(xí);加上注意力溫度縮放和自校正采樣這兩個(gè)技術(shù),效果更穩(wěn)更真。
?:Voost 在哪些測(cè)試?yán)矧?yàn)證過效果?
A:在VITON-HD、DressCode這些常用數(shù)據(jù)集,還有真實(shí)場(chǎng)景的照片里都測(cè)過,試穿和試脫的效果都是目前最好的,比StableVITON、IDM-VTON等工具更準(zhǔn)、更像真的。
?:注意力溫度縮放和自校正采樣有啥用?
A:溫度縮放是讓模型在不同清晰度或遮擋時(shí)(比如手擋住衣服)也能穩(wěn)得??;自校正采樣是通過試穿和試脫互相驗(yàn)證,減少生成錯(cuò)誤,讓衣服穿得更自然。
??Github:https://github.com/nxnai/Voost
提交您的產(chǎn)品
Ai應(yīng)用
Ai資訊
AI生圖
AI生視頻
開源AI應(yīng)用平臺(tái)










