亚洲成人一区在线_久久综合九色综合欧美98_久久精品一区二区三区不卡牛牛 _亚洲成人在线网站

CNTXJ.NET | 通信界-中國通信門戶 | 通信圈 | 通信家 | 下載吧 | 說吧 | 人物 | 前瞻 | 智慧(區(qū)塊鏈 | AI
 國際新聞 | 國內(nèi)新聞 | 運(yùn)營動(dòng)態(tài) | 市場動(dòng)態(tài) | 信息安全 | 通信電源 | 網(wǎng)絡(luò)融合 | 通信測(cè)試 | 通信終端 | 通信政策
 專網(wǎng)通信 | 交換技術(shù) | 視頻通信 | 接入技術(shù) | 無線通信 | 通信線纜 | 互聯(lián)網(wǎng)絡(luò) | 數(shù)據(jù)通信 | 通信視界 | 通信前沿
 智能電網(wǎng) | 虛擬現(xiàn)實(shí) | 人工智能 | 自動(dòng)化 | 光通信 | IT | 6G | 烽火 | FTTH | IPTV | NGN | 知本院 | 通信會(huì)展
您現(xiàn)在的位置: 通信界 >> AI >> 新聞?wù)?/span>
 
阿里公開文生圖研究新進(jìn)展,提出組合式的多概念定制生成方法
[ 通信界 | 靜姝 | www.sese521.com | 2023/8/3 7:23:14 ]
 

通信界 文生圖在最近一年取得了顯著的進(jìn)步,DreamBooth 定制化生成工作,進(jìn)一步證明了文生圖的潛力,并且廣泛引起了社區(qū)關(guān)注,相比于單概念生成,在一張圖內(nèi)定制多個(gè)概念是更加有趣且具有廣泛應(yīng)用場景(AI 影樓,AI 漫畫生成....)。

相比于單概念定制生成取得的成功,阿里提出的 Cones 和 Adobe 提出的 Custom Diffusion 作為現(xiàn)有的多定制概念生成方法仍存在兩個(gè)挑戰(zhàn):

  • 首先,他們需要為每一種多個(gè)概念的組合都學(xué)習(xí)單獨(dú)的模型,這可能會(huì)受到以下影響:1)無法利用已有的模型,比如一個(gè)新的需要定制的多概念組包含三種概念 {A,B,C},無法從已有的 {A,B} 的定制模型中獲得知識(shí),只能重新訓(xùn)練。2)當(dāng)需要定制的概念數(shù)量增加時(shí),計(jì)算資源的消耗指數(shù)上升。

  • 不同的定制概念可能會(huì)互相干擾,導(dǎo)致最終生成時(shí)有些概念無法顯示,或者概念間的屬性存在混淆。當(dāng)概念之間的語義相似度較高時(shí),這種現(xiàn)象尤其明顯(例如,同時(shí)定制一只貓和一只狗,可能生成的圖片中,定制的貓混淆了狗的某些特征。)

基于此,阿里巴巴和螞蟻集團(tuán)的研究團(tuán)隊(duì)提出了組合式的多概念定制生成方法:Cones 2,能同時(shí)定制更多物體,且生成圖片質(zhì)量顯著提升。

論文主頁:Cone 2

https://arxiv.org/abs/2305.19327

項(xiàng)目主頁:Cones-page

https://cones-page.github.io

該團(tuán)隊(duì)的前作 Cones 獲得了 ICML 2023 的 oral,并且在推特獲得了廣泛關(guān)注。

Cones 2 優(yōu)勢(shì)主要體現(xiàn)在 3 個(gè)方面。(1)使用簡單而有效的方法來表示概念,可以任意組合,復(fù)用各種訓(xùn)練好單概念,從而進(jìn)行多定制概念生成,而無需為多概念進(jìn)行任何重新訓(xùn)練。(2)使用空間布局作為指導(dǎo),這在實(shí)踐中非常容易獲得,用戶只需要提供一個(gè) bounding box,即可以控制每個(gè)概念的特定位置,并同時(shí)減輕概念之間的屬性混淆。(3)在一些具有挑戰(zhàn)性的場景下也能取得令人滿意的性能:進(jìn)行語義相似的多定制概念的生成,如定制兩只狗,并且可以交換眼鏡;在概念數(shù)量上,也可以合成六個(gè)概念。

方法

1. 基于擴(kuò)散模型的文本引導(dǎo)圖像生成

擴(kuò)散模型學(xué)習(xí)從正態(tài)分布噪聲中逐步去噪來恢復(fù)真實(shí)的視覺內(nèi)容,該過程實(shí)際上是在模擬可逆的長度為 T=1000 的馬爾可夫鏈。在文本到圖像任務(wù)中,條件擴(kuò)散模型 的訓(xùn)練目標(biāo)可以簡化為重建損失:

文本嵌入 通過交叉注意力機(jī)制注入到模型 中。在推理時(shí),網(wǎng)絡(luò)通過迭代去噪 進(jìn)行采樣。

2. 殘差文本嵌入表示概念

為了可以定制化生成用戶需要的特定概念,模型首先需要“記住”這些概念的特征。由于改變預(yù)訓(xùn)練模型參數(shù)往往會(huì)導(dǎo)致模型的泛化性下降,Cones 2 選擇針對(duì)每個(gè)特定概念學(xué)習(xí)一個(gè)合適的編輯方向。將這個(gè)方向作用于概念對(duì)應(yīng)的基類的特征編碼上,就可以得到定制化的結(jié)果,這個(gè)方向稱為 residual token embedding。

舉個(gè)例子,在使用 Stable Diffusion 生成圖像“一只狗坐在海灘上”時(shí),整個(gè)生成過程由文本經(jīng)過文本編碼模型得到的文本編碼控制,那么只需要將“狗”對(duì)應(yīng)的文本編碼做合適的偏移,就可以讓模型生成出定制化的“狗”。為了得到 residual token embedding,首先需要用給定的數(shù)據(jù)微調(diào)文本編碼模型,在訓(xùn)練過程中 Cones 2 通過引入文本編碼保持損失,限制微調(diào)后的文本編碼器的輸出和原始預(yù)訓(xùn)練的文本編碼器的輸出盡可能接近。

同樣參考上面的例子,給定“一只狗坐在海灘上”作為輸入,這兩個(gè)文本編碼器輸出的文本編碼,只在定制化概念對(duì)應(yīng)的類別詞(狗)這里差別較大,在其他詞(海灘等。。。)的部分盡可能保持輸出一致。結(jié)合原本的生成模型,微調(diào)后的文本編碼器具有定制特定概念的能力,由于微調(diào)過程采用了文本編碼保持損失的約束,這種能力可以通過計(jì)算微調(diào)過的文本編碼器和原始文本編碼器在類別詞部分的平均差異,來得到需要的 residual token embedding:

基于上述方法得到殘差表示,是可以重復(fù)使用并且即插即用的。在做多概念定制化生成的時(shí)候,只需要將每個(gè)定制概念所對(duì)應(yīng)類別詞的文本編碼加上對(duì)應(yīng)的殘差項(xiàng)即可。

3. 通過空間布局引導(dǎo)多概念組合生成

交叉注意力層之間的注意力圖如下 ,交叉注意力圖直接影響最終生成的空間布局,多概念定制生成的圖片中的一個(gè)問題是某些概念可能無法顯示。為了避免這種情況,Cones 2 在希望其出現(xiàn)即用戶通過 bounding box 指定的區(qū)域中增強(qiáng)目標(biāo)概念的激活值。另一個(gè)問題是概念間的屬性存在混淆,即生成圖像中的概念可能包含其他概念的特征。

為了避免這種情況,則希望削弱每個(gè)對(duì)象出現(xiàn)在用戶指定區(qū)域外的激活值。結(jié)合上述兩種想法,Cones 2 提出了一種根據(jù)預(yù)定義布局 指導(dǎo)生成過程的方法。在實(shí)踐中,將布局 定義為一組概念邊界框,由每個(gè)概念的的指導(dǎo)布局 組成。在希望概念 出現(xiàn)的區(qū)域中將 的值設(shè)置為正值,并在與該概念無關(guān)區(qū)域中將 的值設(shè)置為負(fù)。對(duì)注意力圖進(jìn)行編輯。

實(shí)驗(yàn)

將生成結(jié)果與現(xiàn)有方法進(jìn)行對(duì)比,從訓(xùn)練的計(jì)算復(fù)雜度,以及生成效果,均有顯著提升。

并且在處理更多概念的生成,以及處理語義相似物體的場景下,都有著優(yōu)越表現(xiàn)。

應(yīng)用前景

多定制概念生成除了能夠生成更加高質(zhì)量,內(nèi)容豐富的圖片外,同時(shí)具有廣泛的應(yīng)用前景,現(xiàn)在大火的 ControlNet 更多是控制生成圖片中的結(jié)構(gòu),多概念定制生成可以對(duì)生成的內(nèi)容進(jìn)行控制,使文本到圖像的生成更加可控,進(jìn)一步提高了文生圖模型的應(yīng)用價(jià)值。比如,創(chuàng)作者通過輸入文本,通過幾個(gè)定制好的角色概念,進(jìn)行多格漫畫生成;通過組合用戶定制的自身角色概念和商家提供的多個(gè)試戴試穿的定制概念(衣服,首飾,鞋帽等等),實(shí)現(xiàn)多款服裝的試穿體驗(yàn)。

 

1作者:靜姝 來源:科技游樂園 編輯:顧北

 

聲明:①凡本網(wǎng)注明“來源:通信界”的內(nèi)容,版權(quán)均屬于通信界,未經(jīng)允許禁止轉(zhuǎn)載、摘編,違者必究。經(jīng)授權(quán)可轉(zhuǎn)載,須保持轉(zhuǎn)載文章、圖像、音視頻的完整性,并完整標(biāo)注作者信息并注明“來源:通信界”。②凡本網(wǎng)注明“來源:XXX(非通信界)”的內(nèi)容,均轉(zhuǎn)載自其它媒體,轉(zhuǎn)載目的在于傳遞更多行業(yè)信息,僅代表作者本人觀點(diǎn),與本網(wǎng)無關(guān)。本網(wǎng)對(duì)文中陳述、觀點(diǎn)判斷保持中立,不對(duì)所包含內(nèi)容的準(zhǔn)確性、可靠性或完整性提供任何明示或暗示的保證。請(qǐng)讀者僅作參考,并請(qǐng)自行承擔(dān)全部責(zé)任。③如因內(nèi)容涉及版權(quán)和其它問題,請(qǐng)自發(fā)布之日起30日內(nèi)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除內(nèi)容。 
熱點(diǎn)動(dòng)態(tài)
普通新聞 中信科智聯(lián)亮相2023中國移動(dòng)全球合作伙伴大會(huì)
普通新聞 全球首個(gè)基于Data Channel的新通話商用網(wǎng)絡(luò)呼叫成功撥通
普通新聞 中國聯(lián)通:以優(yōu)質(zhì)通信服務(wù) 助力“一帶一路”共建繁華
普通新聞 楊杰:未來五年,智算規(guī)模復(fù)合增長率將超過50%
普通新聞 長沙電信大樓火災(zāi)調(diào)查報(bào)告發(fā)布:系未熄滅煙頭引燃,20余人被問責(zé)
普通新聞 鄔賀銓:生態(tài)短板掣肘5G潛能發(fā)揮,AI有望成“破局之劍”
普通新聞 工信部:加大對(duì)民營企業(yè)參與移動(dòng)通信轉(zhuǎn)售等業(yè)務(wù)和服務(wù)創(chuàng)新的支持力
普通新聞 摩爾線程亮相2023中國移動(dòng)全球合作伙伴大會(huì),全功能GPU加速云電腦體
普通新聞 看齊微軟!谷歌表示將保護(hù)用戶免受人工智能版權(quán)訴訟
普通新聞 聯(lián)想王傳東:AI能力已成為推動(dòng)產(chǎn)業(yè)升級(jí)和生產(chǎn)力躍遷的利刃
普通新聞 APUS李濤:中國的AI應(yīng)用 只能生長在中國的大模型之上
普通新聞 外媒:在電池競賽中,中國如何將世界遠(yuǎn)遠(yuǎn)甩在后面
普通新聞 三星電子預(yù)計(jì)其盈利能力將再次下降
普通新聞 報(bào)告稱華為5G專利全球第1 蘋果排名第12
普通新聞 黨中央、國務(wù)院批準(zhǔn),工信部職責(zé)、機(jī)構(gòu)、編制調(diào)整
普通新聞 榮耀Magic Vs2系列正式發(fā)布,刷新橫向大內(nèi)折手機(jī)輕薄紀(jì)錄
普通新聞 GSMA首席技術(shù)官:全球連接數(shù)超15億,5G推動(dòng)全行業(yè)數(shù)字化轉(zhuǎn)型
普通新聞 北京聯(lián)通完成全球首個(gè)F5G-A“單纖百T”現(xiàn)網(wǎng)驗(yàn)證,助力北京邁向萬兆
普通新聞 中科曙光亮相2023中國移動(dòng)全球合作伙伴大會(huì)
普通新聞 最高補(bǔ)貼500萬元!哈爾濱市制定工業(yè)互聯(lián)網(wǎng)專項(xiàng)資金使用細(xì)則
通信視界
鄔賀銓:移動(dòng)通信開啟5G-A新周期,云網(wǎng)融合/算
普通對(duì)話 中興通訊徐子陽:強(qiáng)基慧智,共建數(shù)智熱帶雨
普通對(duì)話 鄔賀銓:移動(dòng)通信開啟5G-A新周期,云網(wǎng)融合
普通對(duì)話 華為輪值董事長胡厚崑:我們正努力將5G-A帶
普通對(duì)話 高通中國區(qū)董事長孟樸:5G與AI結(jié)合,助力提
普通對(duì)話 雷軍發(fā)布小米年度演講:堅(jiān)持做高端,擁抱大
普通對(duì)話 聞庫:算網(wǎng)融合正值挑戰(zhàn)與機(jī)遇并存的關(guān)鍵階
普通對(duì)話 工信部副部長張?jiān)泼鳎何覈懔傄?guī)模已居世
普通對(duì)話 鄔賀銓:我國互聯(lián)網(wǎng)平臺(tái)企業(yè)發(fā)展的新一輪機(jī)
普通對(duì)話 張志成:繼續(xù)加強(qiáng)海外知識(shí)產(chǎn)權(quán)保護(hù)工作 為助
普通對(duì)話 吳春波:華為如何突破美國6次打壓的逆境?
通信前瞻
亨通光電實(shí)踐數(shù)字化工廠,“5G+光纖”助力新一
普通對(duì)話 亨通光電實(shí)踐數(shù)字化工廠,“5G+光纖”助力新
普通對(duì)話 中科院錢德沛:計(jì)算與網(wǎng)絡(luò)基礎(chǔ)設(shè)施的全面部
普通對(duì)話 工信部趙志國:我國算力總規(guī)模居全球第二 保
普通對(duì)話 鄔賀銓院士解讀ChatGPT等數(shù)字技術(shù)熱點(diǎn)
普通對(duì)話 我國北方海區(qū)運(yùn)用北斗三號(hào)短報(bào)文通信服務(wù)開
普通對(duì)話 華為云Stack智能進(jìn)化,三大舉措賦能政企深度
普通對(duì)話 孟晚舟:“三大聚力”迎接數(shù)字化、智能化、
普通對(duì)話 物聯(lián)網(wǎng)設(shè)備在智能工作場所技術(shù)中的作用
普通對(duì)話 軟銀研發(fā)出以無人機(jī)探測(cè)災(zāi)害被埋者手機(jī)信號(hào)
普通對(duì)話 AI材料可自我學(xué)習(xí)并形成“肌肉記憶”
普通對(duì)話 北斗三號(hào)衛(wèi)星低能離子能譜儀載荷研制成功
普通對(duì)話 為什么Wi-Fi6將成為未來物聯(lián)網(wǎng)的關(guān)鍵?
普通對(duì)話 馬斯克出現(xiàn)在推特總部 收購應(yīng)該沒有懸念了
普通對(duì)話 臺(tái)積電澄清:未強(qiáng)迫員工休假或有任何無薪假
普通對(duì)話 新一代載人運(yùn)載火箭發(fā)動(dòng)機(jī)研制獲重大突破
推薦閱讀
Copyright @ Cntxj.Net All Right Reserved 通信界 版權(quán)所有
未經(jīng)書面許可,禁止轉(zhuǎn)載、摘編、復(fù)制、鏡像
主站蜘蛛池模板: 国产自偷自偷免费一区| 亚洲精品电影在线一区| 精品免费国产| 国产精品久久久久久久av电影 | 日韩经典在线视频| 色妞一区二区三区| 国产在线视频不卡| 国产精品一区二区3区| 色播亚洲婷婷| 国产日韩欧美在线视频观看| 色综合久久天天综线观看| 国产精品美女久久| 久久超碰亚洲| 欧美激情国产精品日韩| 天天成人综合网| 日韩中文视频免费在线观看| 亚洲综合国产精品| julia一区二区中文久久94| 国产精品久久久久久av福利| 欧美一级片久久久久久久| 91久久久精品| 99热在线国产| 久久精品男人天堂| 亚洲福利av| 精品免费国产| 午夜免费电影一区在线观看| 精品视频在线观看| 日韩中文字幕三区| 国产精品亚洲аv天堂网| 亚洲精品在线视频观看| 91精品国产综合久久香蕉922| 国产一区免费视频| 国产不卡精品视男人的天堂| 久久最新免费视频| 99久久99久久| 成人中文字幕av| 国产精品美女在线| 欧美激情亚洲综合一区| 国产日韩欧美在线观看| 欧美中文在线视频| 久久夜色精品国产亚洲aⅴ|