大谷
100年前的老影像,用人工智能上色后是怎么样的?
5月9日,大谷通过自己的个人微博“大谷Spitzer”上传了一段100多年前老北京的纪录片,有意思的是,这段原本黑白色的影片被大谷用人工智能的方式添加了色彩,100多年前的北京和城内的人们就这样灵动了起来,天桥上热闹的集市、寺庙里的人们、巷子口独特的礼仪……有网友称,视频中原本色彩单调、轮廓模糊的人影,经过修复后,变得面目清晰、动作流畅,好像穿越了一般。这段视频在发出24小时后,有近50万点赞,10多万次转发和接近3万条留言,播放量在微博上达到近2000万次。
制作者大谷,一名北京90后,现旅居美国纽约。在其个人微博介绍中,他称自己是程序员里最会画画的作曲家。在接受成都商报-红星新闻独家采访时,大谷说,看到成片之后,自己还是蛮震撼的。
给这段视频上色
前后花了7天时间
成都商报-红星新闻:怎么想到要给这段影片上色?
大谷:我本身就是做科普的,在B站经常做科普相关的视频,差不多有七年了,主要是一些绘画和作曲教程。最近一两年我开始接触人工智能这方面的知识。之前看到有这种旧电影的恢复技术,就想尝试一下,学会之后再做一个教程视频来教大家怎么去做。
成都商报-红星新闻:选取老北京的这段视频有什么特别的原因吗?
大谷:我本身就是北京人,对北京的文化比较了解。大概2016年的时候看到《人民日报》的微博发过这段视频,当时就挺吸引我的,因为里面有很多对视的片段,让人有一种古今交流的感觉,就好像通过屏幕和一个个100年前的人在对视,感觉非常奇妙。
成都商报-红星新闻:上色的具体步骤是什么?大概花了多长时间?
大谷:整个流程走下来差不多七天左右,修复过程主要用了三种AI工具,分别用来补帧、上色和分辨率扩增。原版纪录片每秒只有6到10帧,看起来非常卡顿。我用DAIN(AI工具名称)来补充中间的画面,让视频变成每秒播放60帧左右。最后对颜色做了整体修改,让它再鲜艳一点。
已得到一些合作邀约
但目前还在商量阶段
成都商报-红星新闻:自己看到成片后是什么感觉?
大谷:看到成片之后我还是蛮震撼的,真的是有回到了老北京的那种感觉。
成都商报-红星新闻:是否还有一些遗憾的地方?
大谷:我觉得比较遗憾的地方就是它的历史准确性肯定还是打折扣的,毕竟它是一个人工智能,还在学习阶段,很多数据库是来自欧美的,对中国文化的掌握并不是非常熟练,很难说完美地还原了当时的服饰颜色。但是确实帧数提高了,画面整体的质量也上升了,给人的感受也大不相同,好像真的穿越回那个年代了一样。
成都商报-红星新闻:接下来是否还会有为老纪录片上色的计划?
大谷:是的,目前还在收集资料的阶段,因为如果是北京以外的地区,我还要找当地人去了解当地的民俗,再去做进一步完善,像北京我比较熟悉,所以配乐什么的就比较容易。
人工智能会淘汰一些旧岗位
但也会增加一些新职业
成都商报-红星新闻:你的微博个人介绍说自己是程序员里最会画画的作曲家,这有什么故事吗?
大谷:我是北京人,从小在北京读书,后来考上了中国人民大学徐悲鸿艺术学院美术专业。2014年本科毕业后,就到纽约视觉艺术学院进修研究生的计算机艺术专业,2016年毕业之后就暂时旅居在这边,做一些艺术、游戏开发、音乐作曲相关的工作。
其实我定义自己是独立艺术家、独立游戏开发者,就是做我自己喜欢的事情,并且把我的一些感受分享给大家,就跟我做科普视频的教程一样,就是给大家分享一些我感兴趣的东西,然后让大家一起来创作更多的作品。
成都商报-红星新闻:你在B站也上传了很多AI相关的视频,是如何萌生对AI的兴趣的?
大谷:我是想通过这些作品,给大家展示一下,人工智能不是一个高不可攀的东西,大家都可以学习、运用这些技术。
成都商报-红星新闻:谈到AI的时候,很多人会持否定态度,觉得会让人类失业等。你怎么看?
大谷:我觉得凡事都有两面性。一个新技术的出现,可能会淘汰一些工作岗位,但它也会增加更多的工作岗位。像人工智能其实是可以解放艺术家的双手,让他们有时间来做更多的创作,比如人工智能作曲,其实并不是说我把曲子扔进去,让人工智能帮我做音乐,我是要进行一定的指导,需要把我的曲子倒进去,然后去选择哪个年代的作曲家来完成。所以我觉得未来也许艺术家会越来越多,包括编程的岗位也会很多,会有更有意思的新职业出现,人工智能的未来还是比较积极的。