DeOldify：为黑白影像注入色彩的开源工具

2023-01-18 人工智能图像处理开源工具深度学习

你是否曾翻看家里的老照片，想象它们原本的色彩？DeOldify 就是这样一个项目，它利用人工智能技术，尝试为黑白照片和视频自动上色。它完全开源且免费，让普通人也有机会体验这项技术。我的理解是，它并非简单地涂抹颜色，而是通过学习海量图像数据来“猜测”并还原可能的色彩。

项目简介与核心目标

简单来说，DeOldify 的核心任务是为老旧的黑白图像和电影片段进行着色与修复。它是一个基于深度学习的开源项目，开发者持续改进，旨在让处理效果看起来更自然、更好。项目展示了大量处理前后的对比案例，例如1936年的《移民母亲》照片、20世纪初的无声电影片段等，让我们直观感受到技术带来的变化。不过，开发者自己也提醒，历史色彩的准确性仍然是一个巨大的挑战。

三种模型的不同用途

为了应对不同的需求，DeOldify 目前提供了三种主要的模型，各有侧重。

艺术模型：这个模型能产生最具活力和细节丰富的着色效果，色彩往往更鲜明、更有趣。但它的缺点是需要手动调整参数来获得最佳效果，并且在处理某些常见场景（如自然风光和人像）时可能不太稳定。
稳定模型：如其名，这个模型追求稳定的输出。它在风景和人像上表现更可靠，能有效减少面部或肢体着色失败导致的“僵尸感”。虽然整体色彩可能不如艺术模型鲜艳，但着色错误更少。
视频模型：这个模型专门为视频着色优化，核心目标是确保视频帧与帧之间的着色稳定、一致，避免闪烁。它是三个模型中色彩最不鲜艳的，但能提供最流畅的动态着色体验。

关键技术：NoGAN 训练

DeOldify 取得良好效果，特别是视频稳定着色的关键，在于一项名为“NoGAN”的创新训练技术。传统的生成对抗网络（GAN）训练耗时且容易产生瑕疵。而 NoGAN 的精髓在于，它用最短的直接GAN训练时间，获得了GAN训练的好处。开发者形容，这就像先用更可靠的传统方法分别训练好“画家”（生成器）和“评委”（评论家），再让他们进行极短时间的协作磨合，从而快速达到理想效果，并几乎消除了画面瑕疵和闪烁。这项技术是项目实现高质量、稳定着色，尤其是视频着色的重要基础。

如何开始使用

对于只是想尝试效果的普通用户，有几种相对便捷的入门方式。

在线尝试：最快捷的方法是访问一些集成了DeOldify的在线演示平台，例如Huggingface Spaces上的Gradio演示，或者DeepAI提供的在线着色服务，可以直接上传图片体验效果。
使用Colab笔记本：对于有一定技术背景的用户，可以通过Google Colab平台运行项目提供的Jupyter笔记本。这不需要配置本地环境，可以直接在浏览器中运行代码，对图像甚至视频进行着色处理。社区还提供了相关的视频教程。
本地安装：如果你想在本地电脑上运行，过程会复杂一些。项目主要支持Linux系统，需要安装Python、Anaconda环境，并按照指引克隆代码库、配置环境。开发者明确表示，Windows系统不受官方支持。此外，你还需要下载预训练好的模型文件。

结语

DeOldify 作为一个活跃的开源项目，展示了AI在图像修复和色彩还原领域的潜力。它让原本需要专业知识的黑白影像上色技术，变得对公众更加可及。虽然目前还存在色彩历史准确性、多模型选择等挑战，但它的持续迭代和开放特性，吸引了众多开发者和爱好者共同参与。如果你对老照片充满感情，不妨用它来开启一段跨越时空的色彩对话。