前不久,一幅由AI软件创造出来的画作《空间歌剧院》在网络上引起争议。网络上有两派声音,一派认为这画是AI创作的,没有灵魂,不能和人创作的画作一起评比;另一派认为,这是AI已经能创作出符合人类审美的创意作品了,是技术的一大进步。本文作者对此进行了分析,与你分享。
一、AI画画做得有多好了?最近一个新闻非常出圈,并且成功登上微博热搜,一个来自美国的39岁的游戏设计师用AI画画工具-midjourney创作的一张作品,获得了科罗拉多州博览会的艺术比赛第一名。
作品名称叫做《空间歌剧院》,作品本身非常漂亮,作为一个艺术圈外行的我,都觉得这张画作抛开本身创作来源不讲,都是一个配得上大奖的作品。AI至少比我画的好多了,甚至赢了很多其他参赛的人类艺术家。
事情一出,评论呈两极化分布,对于“老艺术家”派们当然对于这件事情十分抵制,认为这画是AI创作的,完全没有意义,没有灵魂,作者根本就是亵渎艺术,他不配做一个画家。
而另外一派,当然是像我一样的AI从业者或者是技术拥趸,我们看到这样的作品是非常激动的,AI创作得也太美了,惊为天人,前途无量,于是第一时间上网把所有的热门AI画画软件都试了一遍。
作为吃瓜群众的你们,怎么看待这张AI创作获得大奖的事情呢?
无独有偶,另一个主打“免费开源”AI画画的公司stablediffusion,目前已经估值超过10亿美金,这离他们发布才过去了1个月,与上文提到的获奖的midjourney(新注册免费送25次)和Dall.E不同的是,这个工具完全免费,不限次数、任何人都可以使用。
而且亲测,stablediffusion是几个AI画画工具中交互最为简单的。比起Google的另一款竞品discodiffusion,需要注册谷歌机器学习平台,甚至要手动调整一些参数,对于一些非技术从业者要友好多了,基本上就是有手联网就可以用。
谷歌的discodiffusion
stability.ai的stablediffusion
除了交互更加友好外,stablediffusion的创作风格更加写实(更加符合主流大众审美),比如我在midjourney上创作的作品有点后现代抽象画的感觉。
文字prompt:一只绿色海豚在紫色海上飞跃远方有一艘巨轮(版权归大仙河所有)
而OpenAI的DallEmini是“梗图风”,百度的“文心.一格”风格偏向于二次元/国画风,字节的tiktokAI偏向油画风。
除了绘画风格外,商业模式或者是版权也是stablediffusion为什么仅仅上线一个月就乱拳打死老师傅的另一个原因。
因为版权或者是所有权是决定一个内容创作产品的商业模式的主要因素,比如百度一格的作品所有权就归百度所有,你就不太可能拿这个AI平台创作的作品去进行销售,或者是放在各种商业宣传的文案里作为插图(参考视觉中国的故事)。百度的商业模式就是卖版权。
另外的玩法,比如midjourney,类似软件使用付费,除了刚开始的一些免费试用,后面创作都是要付费的。当然这产生的作品版权就是归用户所有了。
Stablediffusion很颠覆的地方就在于,版权归用户外,平台还免费不限次数使用,交互方式还比其他竞品更好用,是不是有点像互联网刚开始冲入传统行业的打法?此外其还在官网上写着“bythepeople,forthepeople”,意思是民治和民享,是不是有点天下为公的意味。
所以stablediffusion做到了真正的出圈,很多其他行业的从业者,比如我们产品经理经常用来画原型交互的figma,就准备引入stablediffusion的创作能力,一句话生成用户界面元素。
看到这里,我突然明白了为什么看到了ai60“一句话”画画的「超能力」后,很多插画师陷入了深深的焦虑,说实话,作为产品经理的我也很焦虑。
二、AI画画是如何做到符合人类的创意和审美的?焦虑归焦虑,我们即使要被取代,最好也要明白自己是如何被AI一步步取代的。
网上写diffusion的文章很多,但是大部分都是讲如何使用,或者评论diffusion的作品如何惊为天人。要么就是特别专业的角度,给大家拆解模型。
作为一个AI产品经理,我尝试用大众能听懂的话为大家解释下AI是如何创作出来如此及美轮美奂的作品的。