目前常用的穩定?擴散?然後呢。達爾二號。我沒有做過任何關於文本生成的培訓,即使我提出了類似的要求,也很容易生成亂碼或扭曲的文本。但使用圖像編輯軟件(如Adobe?Photoshop、GIMP等。),給生成的圖片添加文字。打開AI生成的圖片,在編輯模式下選擇合適的工具(如文本工具),設置字體、大小和顏色等參數,然後將指定的文本添加到圖片中。這個問題可以有效避免,新手黨可以省去快速搶跑。
但是,許多人提出了類似的訴求,例如在品牌和衣服上印上特定的文字,或者制作特定的紋身、水印等,這確實具有實際意義。據說?谷歌?什麽事?AI?會好起來的,然後呢?英偉達?打開嗎?伊迪芙-我?已經有更多可用的結果。
我認為壹般的思路是使用文本生成模型,將要顯示的文本輸入到模型中,然後生成相應的圖像。有壹些開源的文本生成模型(如AttnGAN、StackGAN等。)可用於此任務。
比如在網友曬出的例子中,常見的普通文本可以直接使用嗎?穿著?答?t恤?閱讀?“壹些?話“?嘗試生成它,但即使這樣,也很難設置字體/字號/樣式等。定向地。如果是的話?Logo或者紋身,最好用類似的東西?PS?正片和底片疊加的方式可以是壹體的
妳在線嗎?穩定嗎?擴散?自動生成是最好的。如果不能集成,可以等大佬們直接做類似的插件功能。這種方法需要相關的算法和訓練數據,而機器學習技術可以幫助實現圖像和文本之間的關聯。
。其實現在遊戲裏還有很多類似的捏人方式。讓我印象深刻的是寅子的“忠”,其實就是壹個畫面的疊加,綁定到人物造型上。至於提到的用途?controlNet?是的,我最初認為我可能無法如此仔細地控制它(或者可能我還沒有研究得足夠透徹……)。
目前?controlNet?模型描述提供的預處理模型和功能中最有前途的是什麽?mlsd?但是那個東西主要是用來檢測建築物邊緣的……我還是得試試。簡而言之,我的想法是這對大老板或模型構建者來說應該不難。我嘗試增加文字訓練,但中文可能不太好。
未來?問題?人多的時候可能會有更簡單的模型或者插件來實現,所以現在找壹些奇奇怪怪的技能要求有點太高了。