造就第397位讲者周乐西交利物浦大学(xjtlu)大家好,我叫周乐。我是一个新媒体艺术家,也是一个技术创造者。
今天我带来的演讲,标题是“达达山水――ai可以赋能我们的创造力吗?”
我认为,这是一个太难回答的问题。当然这里我也不是简单地扔出这个问题,我没有一个yes或no的武断论断。但是我选择以一个,我新近完成的基于人工智能的交互媒体艺术装置――达达山水,来和大家探讨一下这个问题的可能性。
首先我想先谈一下山水。
关于山水,我觉得它是发源于中国,盛行于东方的一种用笔刷和水墨去创造的艺术。在我们古代它另外一个名字叫做文人画。是文人四艺,琴棋书画的一部分。
换言就是说,在原来所有受过高等教育的士大夫、文人,他们都具备使用水墨山水这样一种非常有东方特色的艺术形式,去进行表达的能力。
对于我们东方人而言,当我们谈到山水,不用去强调大家都会知道,有一个概念叫做山水的写意精神。
而在写意精神的另外一侧,叫做山水的技法。
咱们的山水画是分流派的,这些流派不以写意精神区分,不存在哪一个流派说我们这一派没有写意精神。
写意精神是大家共享的,但山水画的技法是多样的。
有一个比较有意思的事情,我是不会画山水画的,我不知道在座有多少人会画。
但是我发现你可能会指着某一幅画,觉得这一幅非常山水,指着另外一幅觉得那不是很山水,我想在座的大家都可以很自信地对一幅山水画做出这样的论断。
而我对这一现象的解读是:不管我们会不会画山水画,山水的写意精神都流淌在我们的血液当中。
那,我们缺的是什么?
我们缺的是半年、一年、甚至三年五年的,关于山水技法的训练。
但是,比如我,你让我现在去花三年的时间学习山水技法,我觉得对我来说太难了。
我有一个观点,如果一个事情非常难,你又非常想让它完成,怎么办?找ai帮忙!
这里有一个很简短的演示,就是我的交互艺术装置。先给大家看一下它究竟能干什么?
好的,现在我们可以来具体谈谈,我到底做了些什么?
有一天下午,我发现了一个非常成功的人工智能模型的一个小bug。
它具体是什么呢?就是它本来应该尝试着将一张图片里的野马识别出来,并且将它转换成一匹斑马。
然后好玩的事情是什么?这个人工智能会错误地将我认成一匹马,并且转换成一匹斑马。
当我在测试这个模型的时候,在我们那个楼里面,有一个李开复博士的演讲。这两件事情是同一时间,同一地点发生的。我非常想去听一下李开复博士的演讲,但当我测试这个模型的时候,忘记了时间,他的演讲已经结束了。
为什么我会把这两个事情放在一起来说?
因为李开复这个演讲的标题是“aisuperpowers”,ai的超级霸权。
他认为,ai是超级霸权,ai将改变世界格局,甚至将取代人类。
这个我相对不怎么关心,我关心的是,ai能不能做一点有温度的事情、好玩的事情,ai能不能和我们一起做点什么事情?
那么刚才我提到的那个,我玩了半天以至于错过演讲的人工智能模型究竟是什么呢?
首先它是一个神经网络。更具体地来讲,它是深层对抗网络,我给它取了一个名字叫做“自感生成网络”。
在去年的7月份,uc伯克利的一个实验室里,一帮非常厉害的科学家、ai研究者,发布了这样一个模型。
他们用这个模型干什么呢?
将一张莫奈的画,变成一张真实的图片;
将一张斑马的照片,转移成野马的照片;
将一个地方冬天的风景,转移成春天的风景;
把一个a画家的画,转换成b画家的风格。
诸如此类。简单来讲,就是做一个风格的转换。
而我用它干了什么事情呢?
我让它把我们的山水手绘线稿,变成水墨山水画。因为我刚才说了:复杂的事情咱们让ai来做。
我说我们有水墨精神、有写意精神。但是我不会山水技法,没有关系。我用简笔画的方式
我总能勾勒出我心中的山水吧。而技法的部分,让ai来帮我实现。
这就是我的项目――达达山水(dada:drawanddesignwithai)。我最终把它做成了一个交互式的装置,参与者在ipad上去勾勒心中的水墨山水,然后人工智能会帮他完成。
具体我是怎么做出来的?
首先我从台北故宫博物院的网站上,扒取了108张高清的历代山水画大师的作品。
在这里我特意选择模糊掉技法,不专门找某一个风格,或者某一个大师的作品。而是选择历代所有杰出大师的作品,作为一个山水画的代表。
然后我进行了一系列的计算机视觉手段的处理。简单来讲就是要完成一个事情,要把山水画的画芯给抽取出来。因为这部分才是真正的山水画。
在这里,我遇到了一个问题。
咱们知道山水画有横的长轴,还有竖的条幅。但是我如果要训练人工智能的话,它还没有智能到那个程度,可以随便我输入什么尺寸都可以。它需要我输入一个固定的尺寸。
那么问题就来了,那些大师作品已经在那里了,我改变不了它。所以我想了一个办法,我把这些图都给切成一个一个正方形的框。把一张大师的作品变成多张的。
本来这是一个技术妥协。但好处是,虽然我只找到了108张大师山水作品,但经过这么一处理之后,我有了1230张大师山水作品。
训练ai,数据总归是越多越好的。
再进一步,我通过一些计算机视觉的手段,以大师的山水画作为起点,反向生成边界,
这些是我前面提到的风格a,也就是我们的手绘数据,然后进行训练。
ai只是一段乱码,他可以帮我做这个事情,不代表我立马说:嘿,ai帮我做这个。
所以接下来,我写了一个前后端软件,前端就是在ipad上,后端在服务器上。并且将ipad连接到一块大屏上,组成这样一个交互艺术装置。
这个就是你可以看到的ipad界面。
点击reload,就可以开始画你心中的山水画的线稿。
点击dada,就可以呼叫“达达山水”这个人工智能的帮助,帮你完成一幅水墨山水。
我观察到,ai大概可以画出这样六种不同风格的山水。
在我和别人交流过程中,经常会被问到两个问题。第一个问题就是:在这里,ai到底学了什么?
简单来讲,这里面有两个东西。一个叫generator,生成器。另一个叫discriminator,姑且称之为辨别器。
生成器始终不断地在尝试生成一张山水画,鉴别器则更像一个鉴别画作的人员。他始终在尝试着去看这幅画到底是生成的还是真的。
这里面就有一种对抗关系。生成器永远尝试着去生成一张更加逼真的山水,鉴别器永远不断地在提升自己,希望去鉴别出这幅画到底是生成的还是真实的?
这两者就是一个对抗关系,在对抗中成长,永远是最容易的。
所以,我就不停地让生成器去生成新的山水,让辨别器去甄别这幅画是真是假。
经过20多个小时的学习,他们彼此对抗,彼此提升自我。然后就到了某一个点,生成器就可以生成,足够逼真或者真实的山水画。
这个时候我就抛弃掉了辨别器,我把生成器单独地拿出来,作为这个交互艺术装置的生成内核。
这就是,ai所学到的东西,以及他在帮我生成的东西。
另外一个我经常会被问到的问题是:达达山水要从手绘的数据转移成水墨山水,可在训练他的时候,用的是这种生成的边界数据,和我手画得一点都不像,怎么解决?
这是我还没有接触的一部分,ai要数据,可要数据是很难的。
我如何才能得到人的数据呢?那我只能花钱请很多人来画,对不对?
但是我没有很多钱请人,所以我就想了一个办法。当我第一轮,姑且称之为达达山水1.0训练完成的时候,我把它带到了上海创客嘉年华,在那布置了三天,邀请所有来上海创客嘉年华现场的人,和达达山水一起去创作。
最后大约有780人次和达达山水一起完成过水墨山水,相当于我就有了780张真人的手绘数据。然后我重新用真人手绘数据的样本,去训练人工智能模型。
我手上即将和大家演示的就是达达山水2.0。你们现在看到的,就是和我一样的画面,这个是实时的演示。
比如说我想勾勒一下山水,我有山,我有水,然后我觉得ok差不多,这就是我心中想象的山水,现在我应该做什么,找达达帮忙。我没有三年或者五年的时间去学习画山水画,所以这是我的方式。
好了,这个就是刚才,我和人工智能“达达山水”,合作完成的一幅水墨山水。
我来梳理一下,这个项目,整个的一个进程,具体都发生了什么。
首先,我使用大师山水,并且用计算机生成的线稿,去训练出达达山水。它已经具备帮我们画山水画的能力了。
之后,我把它带到了上海创客嘉年华的现场,达达山水在那里帮助了很多人,很多不会画山水的人,完成了或许是他们人生中的第一幅水墨山水。
然后我将我们人类的手绘数据,再一次地使用到训练人工智能达达上,然后达达再一次地从我们的数据,学到了一个更好的版本,去创造水墨山水。
在上台演示的两个月前,我不断地在尝试着使用达达山水去进行创作。我不断地去理解达达山水是怎么样帮我创造的。
每当我们有一个新伙伴、有一个新工具,我们需要磨合才能达到最佳的效果。所以这个过程中,我是在学习如何和它一起创造。
那在这个过程中,是我训练的它?还是它训练了我?
更进一步的说,到底谁在帮助谁?
有时候我会觉得,我肯定是帮到达达山水的,我要是不帮它,它肯定不能自己冒出来?
但我更多的时候,我觉得他在帮助我。
所以在最后希望再一次把这个问题,抛给大家:
人工智能可以赋能我们的创造力吗?
编辑:张默
审校:其奇
造就:剧院式演讲,发现创造力