OpenAI新算法生成的图像,这些图像未曾在现实中出现。这个算法的名字叫DALL-E2(达利),据说是为了致敬2008年的动画电影《机器人瓦力》和超现实主义画家萨尔瓦多·达利而取的。这就意味着,算法可能具备了一些超出人类想像的能力。
简单来说,它是一个可以将文本描述转换为图像的系统——只要写下你想看到的东西,达利就会为你绘制出来,非常像一个二维版的3D打印机。举个例子,当你在达利搜索栏里,输入“长得像牛油果的茶壶”,它会在大约5秒时间内,生成多达10张与“牛油果茶壶”词义相符的图片。
结果显然100%扣题。而且因为分辨率很高,所以这些图像看起来更像是真实的照片。但这个例子其实非常“现实主义”,因为牛油果形状的茶壶,我们极有可能在创意商店中买到。但是“会下棋的猫”呢?OpenAI工程师Alex Nichol在输入“会下棋的猫”后,生成了这样一张图片:
还有难度更高的文字描述词,譬如“一个雨夜,一个超级英雄栖息在城市上空,风格就像一本漫画书”,输出结果没有一处不符合词义