SANSUI'S BLOG

系统外观
分类标签
RSS
Sansui 2023
All rights reserved
人活着就是为了卡卡西

图像超分辨率工具推荐

8 月 23 日, 2023

推特,现在叫 X.com,是我的桌面壁纸来源,但是推特的图压缩得非常糊,喜欢的动画人基本也只传 1080p 图,导致壁纸糊上加糊。因此需要使用 AI 放大模型进行图像处理。

  • 放大效果外链预览:Comparison
  • 细节对比:

文章分为三个部分:

  • 图像处理工具
  • AI 图像放大模型
  • 如何使用

图像处理工具

1. chaiNNer

一个无代码的图像处理自动化工具,可以实现批量改大小、调色、压缩、拼接等等等。同时也支持用 AI 对图像放大,也能接入 Stable Diffusion 的工作节点,上限非常高。缺点没有内置模板,即便是很小的功能(比如文件批量重命名)都需要自己创建。

应用内置使用文档,不过不看文档也能一眼知道怎么用。

只有英文,没有中文。

2. imagestool

对于单张图和 gif 的常见处理小工具合集,网页打开即用,完全本地运行无隐私问题。特点是非常易用,支持小批量处理,支持 pipline,也就是说如果想在调整大小后转换格式再压缩,不需要每一步都上传下载图片,可以处理完每一步直接选下一步,只下载最终的处理结果。

AI 图像放大模型

超分辨率成像(Super-Resolution,简称 SR) 是一种提高图像分辨率的技术,通俗的叫法就是图像放大。如果你曾经使用过 Photoshop 对小图进行放大,会发现放大后的边缘总是非常模糊,并且用锐化等操作无法弥补,这是传统方法的在图像放大上的缺陷。

但是神经网络(Neural Networks,简称NN)的出现对图像放大的效果带来了极大的提升,几年前就已经有不少 AI 图像放大的应用,但最近两年的模型效果尤其好。下面介绍几个现阶段应用上比较火的模型。

1. SwinIR

2021年基于 Transformer 的图像超分辨率模型,放大任何图片的效果都非常好。风格偏锐利且干净,且参数少,处理速度快。此模型分为 3 类,经典图像超分辨率(Classical image SR)、轻量级图像超分辨率(Lightweight image SR)、真实世界图像超分辨率(Real-world image SR)。

可下载的版本很多,不知道选哪个的就选 001_classicalSR_DIV2K_s48w8_SwinIR-M_x4.pth ,这个为4倍放大的模型,也是 Stable Diffusion 的 SwinIR 预置模型。

2. Real-ESRGAN

2021年的经典图像超分辨率模型,这论文出来后大家疯狂在它基础上卷,基于 ESRGAN 改进的模型和论文非常非常多。不过最初的版本也已经足够好用。

下载链接:Releases · xinntao/Real-ESRGAN

依旧版本很多,不知道下哪个的下载 RealESRNet_x4plus.pth 即可。

3. 4x-AnimeSharp

基于 ESRGAN 架构的动漫类放大,可能由于训练集选得好,在众多动漫类放大中它可以很好地处理景深,其他的Anime模型多少在景深部分会有一些清晰过度的问题,包括著名的 RealESRGAN 动漫模型

OpenModelDB.info 上有更多的微调模型,可以试试。总体来说,AI 放大的图像质量目前来说还是乍一看可以,涉及商用美术的话质量仍然不过关。如果商用美术能过关,岂不是能画糊图然后丢AI出高精图了。 作为壁纸放大非常合适,即便是补充的细节不能推敲,但把像素精度补齐到屏幕分辨率带来的视觉提升也是非常大的。4k 壁纸就是比 1080p 看起来舒服。

如何使用

使用 chaiNNer 时可照抄下图结构,使用 4x-AnimeSharp 模型放大原图、重命名图片并保存。

如果使用的是 stable-diffusion-webui ,Extra Network 选项卡中也有预置模型,可以使用 SwinIR 和 ESRGAN。


可能有用的资料:


PS:强烈建议无代码应用都开发个 template market……不要做一堆功能摆那里就自由发挥了啊诶!当发现要什么工作流很难做时就会感知到这些无代码 App 的问题所在了……在实际应用场景中很烂!很难做!说的就是comfyui……

更新于 2023-08-23 06:20