距离新版博客搭好也已经有两个星期了。这期间,其实一直在思考第一篇杂谈该以什么样的题目开场:有想过谈一谈对病毒的看法、大众的科学素养与风险承受能力的关系;也有想过谈一谈对社交媒体的依赖,即微博、朋友圈、空间、个人贴吧。。与自我需求、价值实现的问题,但最终都碍于思维的碎片化而难以成型,难以下笔。直到今天,在和开发组的美工进行了深切友好(并不)的讨论之后,我终于对第一篇杂谈的内容有了些许把握,因此选择在此记录下来。观前提示:本文只代表本人一些浅薄且片面的看法,不能保证准确,更不可能做到预测未来的发展趋势,如有不同看法请在评论区友善讨论;如在阅读本文后感觉有利可图,进行任何投资行为,还请各位盈亏自付,本人对此不负任何责任。


  谈起AI绘画,似乎互联网行业中最大的两类工人群体——码农和美工 (虽然同为贬义词,但莫名其妙还挺对仗)——之间的意见就从来没有统一过,而且天然对立:码农们认为AI绘画终于可以让他们的想法直接化作现实,而不用经过恼人的美工之手,因此“是科技的巨大进步”;而广大美工们则通常痛斥其“没有灵魂”,并且认为其在某种程度上侵犯了自己作品的著作权。虽然看起来颇有分歧,但鉴于在一般的公司里码农和美工之间的分歧也都非常严重,因此也还算(强行)合理。


虽然杂谈里不应该加梗图但这张真的好好笑

  作为准码农群体的一员,我也曾经理所当然地像其他码农一样,把AI绘画视为技术的巨大进步。虽然尚未成为社会人并且和美工群体产生激烈矛盾,但我仍然先入为主地将这些整天把“没有灵魂”挂在嘴边的美工们斥为“噬魂怪”,并且将美工们反对AI画图的原因盲目归结于AI画图的出现导致他们工资下降(这当然也是事实)。然而由于本人的本职工作毕竟还是炼丹,虽然在具体方向上和专门搞图像的CV人有些差异,但随着对各种模型的了解逐渐深入,我也确实逐渐感到上面的说法似乎有一丝不对劲。。不过,要想明白我所说的不对劲究竟在哪里,一些基础的炼丹知识还是必要的。如果对这方面知识的了解不是很多的话,下面一段内容可以选择性观看,或者至少跳过不懂的部分。

  在我的印象中,“AI画图”中的“AI”,或者说Artificial Intelligence人工智能,其实既不人工也不智能。从“人工”角度看,人工智能的本质是深度学习模型,而在CV或者说图像领域的深度学习的实现,则往往依赖于大量的卷积层,目前AI画图最常用的扩散模型当然也不例外,其U-Net部分通常是一个巨大的卷积网络。然而相比传统图像处理中往往需要人工指定卷积核(例如Sobel核,Guassian核,Laplacian核等),卷积层中的卷积核则是网络通过训练自己学出来的,人工成分占比很少;而从“智能”角度看,这些生成式学习模型所干的事则是学习输入数据的某种分布,然后通过左右互搏的方式提升自己从分布中采样的能力。因此,与其说是“智能”,这些模型所干的事更像是某种意义上的“缝合”。因此一直以来我都非常讨厌“人工智能”这个说法,反而更倾向于用“Machine Learning机器学习”甚至“炼丹”一类的词去形容我的专业。

  这样一来其实问题就变得有些微妙起来了:AI绘画并不能将一个人的想法化作现实,它更类似于一个巨大的检索库,通过一个随机数发生器,去从现有的资源中强行拼接出一个接近目标输出的缝合怪出来,而不是真的去“创造”什么。因此,它的工作严重依赖于现有的数据,至少不能像其他领域的某些模型——比如AlphaZero那样——可以仅从一个规则开始,从0开始自我训练。

  然而即便已经想到了这一层,长久以来作为一个程序员的惯性思维仍然限制了我的思考方式,让我无法得出进一步的结论,直到今天——

  在Fate系列的世界观中,每个魔术师都有其固有的魔术特性(不是魔术属性),比如远坂家的“转换”和间桐家的“吸收”。在我看来,其实现实中的工作也有类似的属性:在本例中,美工的特性是“创造”,而码农的特性则是“拼接”。尽管码农偶尔也会“创造”出新的轮子,美工偶尔也会“拼接”一些旧的作品,但仍然不会影响到这些职业的整体基调。


虽然杂谈里不应该加梗图但这张真的好好笑*2

  这当然不是说码农每天的工作就是在抄袭,但想象一下这样的例子:假如一个炼丹师给现有的模型进行了一些小小的改进,比如说通过更换神经网络的某一层 (而且更换的层很有可能也是从别处抄来的),提高了模型的准确率,这当然是相当有意义的工作,并且也许能水出一篇相当不错的论文;但假如一个画师想要以现有的画作为基础进行改进,尽管改进后可能画面确实变得更好看了,但该画师仍然大概率会被冠以“描图”,“抄袭”的恶名,除非他是一个刚刚开始学习画画的新手。

  所以我们不妨从更本质的角度出发:码农的职业特性之所以是“拼接”,是因为码农们的工作本来就是要通过各种现有工具的组合去解决实际的问题,只有在现有轮子实在完成不了任务的时候才会去造新轮子,即所谓“如无必要,勿造轮子”。在各种工具周而复始的组合试验过程中,每种工具的缺点会逐渐被发现、被补足,工具之间的配合也会越来越完美,这也正是一个成熟社区生态对软件的反馈过程。而美工的职业特性之所以是“创造”,是因为美工们的工作是要把自己的心象世界投影到现实世界当中。这期间当然可以使用成熟的技法,但直接挪用别人世界的部分则显然是不可取的。画面之间的来回抄袭,只会让画风的丰富性减少,不利于绘画的发展。AI绘画刚出现时,人们当然会觉得新鲜,但是当大批量重复生产的AI垃圾充满网络的时候,那些有个人风格但是曝光量小的画师和画风就会永远消失了。

  那么现在只剩下最后一个问题了:我是如何看待AI画图的?其实这并不重要,毕竟仅仅作为时代大潮中微不足道的一员,我一个人的想法其实并没有人关心,也不太可能改变什么;但如果一定要说的话,我的看法仍然是:无所谓。正如上文所说,作为一个工具,如果AI画图足够实用的话,那么随着不断的传播、交流,它自然会逐渐变得完善,并且在实际应用中找到适合它的位置;相反,如果AI画图并不像它看起来那么实用的话,它也只会随着传播的逐渐减少而逐渐湮灭在历史的尘埃中。至于它究竟会走向何方?这个问题只能交给时间去回答了。