首页 > 数字 > 正文

每日观点:5个你现在就可以使用的“AI作图”工具,体验一下吧

2022-11-10 15:45:08来源:36氪  

神译局是36氪旗下编译团队,关注科技、商业、职场、生活等领域,重点介绍国外的新技术、新观点、新风向。


(资料图片仅供参考)

编者按:AI 作图工具最近大火,但在哪里能够体验这种新奇的工具呢?本文提供了五种选择。本文来自编译,希望对您有所启发。

DALL-E 2 的首页展示了一些 AI 模型的最佳作品。图片来源:OPEN AI

2022 年可能会作为“人工智能艺术成为主流的一年”而载入史册。

随着多个高质量 AI 作图工具的爆炸式增长,任何拥有智能手机和互联网连接的人都可以接触到 AI 艺术。这些工具使用人工智能模型将文本输入(即“提示”)转换为图像。

“提示”是关键,添加或删除单个单词会导致截然不同的结果。人工智能驱动的社交媒体市场 GenerAI 的首席技术官普冉奈·韦迪雅那桑(Pranav Vaidhyanathan)表示:“‘提示工程’正迅速成为一种有价值的技能,在相同的数据上训练的模型,加上正确的提示,应该会产生相同的结果。”甚至还有一个不断增长的“提示”市场,可以创造特定的结果。

这里有五个AI做图工具可以帮助你开始。为了进行比较,我给它们输入了同样的提示:“一个人类和一个机器人站在山上的一棵大橡树旁,天空中飘着云。”

1. DALL-E 2

“一个人类和一个机器人站在山上的一棵大橡树旁,天空中飘着云。”的图像,由 DALL-E2 人工智能模型创建。马修·史密斯(MATTHEW S. SMITH)/ IEEE SPECTRUM

成立于 2015 年的 OpenAI 在 2020 年发布了自然语言模型 GPT-3,成为头条新闻。2021 年 1 月又推出了 DALL-E 数字图像模型,之后演变为 DALL-E 2。OpenAI 的模型提供了各种风格的优秀图像。特定的提示可以导致特定的结果,或者你可以输入一个模糊的提示,然后欣赏几个截然不同的结果。

DALL-E 2 现在通过 OpenAI 的网站向所有人开放,对于那些好奇炒作的人来说是最好的工具。DALL-E 2 速度很快,明显超过了我尝试过的其他工具,网站也很容易浏览。它一次提供四个结果,通常风格迥异,这减少了你需要重新运行提示的频率。DALL-E 2 的结果也很好,它是唯一一个同时描绘了人和机器人的人工智能模型。

这是一个商业工具,注册后可获得 50 个免费点数,每月可额外获得 15 个免费点数。再额外的点数可以以 15 美元的价格购买 115 个点数。

2.Stable Diffusion / Dream Studio

“一个人类和一个机器人站在山上的一棵大橡树旁,天空中飘着云。”的图像,由 Stable Diffusion 人工智能模型创建。马修·史密斯(MATTHEW S. SMITH)/ IEEE SPECTRUM

来自 Stability AI 的 Stable Diffusion 工具受欢迎的原因与 DALL-E 2 相同:它快速、有效,并且可以从各种各样的提示中生成可用的图像。

任何人都可以通过 Stable Diffusion 的演示页面免费使用这款 AI 作图工具。它虽然没有 DALL-E 2 那么快,但通常在 30 秒或更短的时间内也能得到结果。它也像 DALL-E 2 一样,一次提供四种图像。

Stable Diffusion 的模型是开源的,所以想要钻研的用户可以彻底调整它的工作方式。这大大增加了它的受欢迎程度,爱好者们纷纷涌向这款工具。范德安腾(Vaidhyanathan)说:“我们确实看到了一种趋势,艺术家和其他用户被 Stable Diffusion 等开源模型所吸引了,而不是像 OpenAI 的 DALL-E 2 这样的闭源和受控模型。”

Stability AI 有一个建立在 Stable Diffusion 基础上的商业工具 Dream Studio。它提供了一个试用版,之后出售积分来生成新图像。

3. Midjourney

“一个人类和一个机器人站在山上的一棵大橡树旁,天空中飘着云。”的图像,由 Midjourney 人工智能模型创建。马修·史密斯(MATTHEW S. SMITH)/ IEEE SPECTRUM

在一位参赛者用它赢得科罗拉多州博览会的数字艺术奖后,Midjourney 在质量上赢得了声誉,并引起了争议,因为它没有披露图像的创作方法。Midjourney 擅长生成生动、空灵、超现实的图像,而且用户群已经接受了它的风格。

该工具只能通过流行的即时通讯平台 Discord 访问。“提示”可以直接输入到聊天中,聊天是公开的,所以频道中的每个人都可以查看你输入的提示和结果。这肯定会让不了解 Discord 工作原理的读者感到困惑,这可能被认为是一个功能,而不是一个 bug。

Midjourney 是一款商业产品,并像其他商业 AI 艺术生成工具一样能够盈利。每个用户一开始都有 25 个积分,但要想获得更多积分,必须按月支付会员费。

4. Craiyon

“一个人类和一个机器人站在山上的一棵大橡树旁,天空中飘着云。”的图像,由 Craiyon 人工智能模型创建。马修·史密斯(MATTHEW S. SMITH)/ IEEE SPECTRUM

Craiyon 最初被称为 DALL-E Mini,但它与 OpenAI 的模型没有直接联系,而且其创造者免费提供该工具。结果生成可能需要 2 分钟的时间,而且分辨率低,但可以同时显示 9 个结果。

Craiyon 的不同之处在于,它使用的是未经过滤的数据,并且没有特别努力去改进、训练或更正结果。与其他工具相比,Craiyon 的结果通常是乏善可陈的,而且它难以处理精细的细节。例如,有时候人脸看起来简直不忍直视。

这个工具有其新奇之处。原始地提供结果暴露了人工智能图像生成的一般优势和弱点,以及创造可用结果的困难程度。这也突出了伦理问题,因为 Craiyon 并不过滤提示,所以如果输入一个带有攻击性的提示,那么人工智能图像可能会被恶意利用。

5. VQGAN+CLIP

“一个人类和一个机器人站在山上的一棵大橡树旁,天空中飘着云。”的图像,由 VQGAN+CLIP 人工智能模型创建。马修·史密斯(MATTHEW S. SMITH)/ IEEE SPECTRUM

人工智能图像生成器近期的流行激发了数以百计的工具,这些工具将先进的人工智能模型与光秃秃的界面结合起来。VQGAN+CLIP 就是这样一个工具,它完全在 Google Colaboratory 笔记本中运行。

VQGAN+CLIP 之所以被提及,是因为它(在某种程度上)很容易使用,且提供了一个窥视模型内部工作原理的机会。你可以看到该工具实时地迭代新的变化。虽然是在 Colaboratory 笔记本中访问,但该模型在你的本地机器上运行。每个提示开始时都是一个斑点,但慢慢地会演变成一个可用的图像。

不过,VQGAN+CLIP 的生成结果通常并不好。它速度很慢,一次只提供一个图像,并且会消耗大量的视频内存。不过,从好的方面来说,它是完全免费的,没有广告,所以如果你有时间的话,它是一个不错的选择。

译者:Jane

标签: 人工智能 提供了一个 截然不同

相关阅读

相关词

推荐阅读