NVIDIA和MIT联合发布的高效文生图模型Sana开源了
目前,Sana的模型和代码已经开源:代码:https://github.com/NVlabs/Sana
模型:https://huggingface.co/Efficient-Large-Model/Sana_1600M_1024px
开源的模型只有更大的Sana-1.6B,还没最小的模型Sana-0.6B。
Sana-1.6B比Sana-0.6B推理速度更慢一些(1.2s vs 0.9s),但是生图效果要更好一些。
而Flux dev是12B,所有Sana速度很快,生成1024x1024的图像比Flux dev要快20倍以上
NVIDIA和MIT联合发布了一个高效的文生图模型Sana,Sana也是DiT模型。其中参数量只有0.6B的Sana-0.6B与12B的Flux效果相当,但是它的参数量小20倍,生图速度快40倍。而且,Sana-0.6B可以部署在16GB的笔记本电脑GPU上,在不到1秒的时间内生成1024×1024分辨率的图像。