2012年,计算机科学家吴恩达和Jeff Dean进行了一场试验。
他们用1.6万个CPU、1000万张猫咪图片以及当时全球最大的深度学习网络,训练了3天,生成了世界上第一张AI猫脸图像。这是人们基于深度学习模型自动生成图片的开端,受限于当时的技术能力,图片中的小猫称得上是“面目全非”。
12年后,当网友第一次看到背着白色翅膀的黑猫图片时,几乎所有人都以为,那是一张真实的照片。
毕竟,宠物博主用翅膀饰品装扮自家猫咪后,再用胶片机拍照记录,不算是什么稀奇事。直到看见帖子下方的“AIGC”标签,人们才惊奇地发现:“这竟然是AI生成的?”
怀揣着巨大的好奇心,越来越多网友顺着网线,前往一个名为“Recraft AI”的应用,尝试生成自己心目中的理想小猫。
情况一发不可收拾。
最近几天,各式各样的“小猫胶片照”填满了小红书、抖音等社交平台的信息流。无论是举着红酒杯的小猫、在键盘上打字的小猫,还是举着魔棒正在施法的小猫,全是Recraft AI的杰作。
近年来,AI领域的所有进展中,离普通用户最近的非AI生图莫属。
自2021年年初,OpenAI发布DALL-E大模型,AI得以通过文字生图起,三年内诞生的AI生图工具已经进化、迭代了一波又一波。专攻技术能力突破的有Stable Diffusion、Midjourney、FLUX等等,专攻C端应用的也有妙鸭相机、Remini等等。
从最初追求极致的“像”,到如今逐渐厌倦AI味儿,开始追求风格与审美,这届网友正在将Recraft AI捧上新的“神坛”。
没有AI味的“造梦AI”
这次火起来的,其实是Recraft AI内置的一种预设风格“Hard Flash”。
该模式可以模拟胶片摄影时,开启闪光灯之后的拍摄效果,生成的图片主体突出,对比度高,彩色饱满浓郁。目前,该AI网站支持免费用户每天获得50个积分,生成50张图片,虽然中文提示词的生成效果仍不如英文,但Recraft支持中文口令直接输入。
如果说,ChatGPT的出现让作者焦虑,Midjourney的出现让画家忧愁,这一次,慌的是摄影师。
小红书,是Recraft最初被国内用户关注到的地方,目前相关话题下已经有超过1万条笔记。
其中不乏有摄影爱好者哀嚎“我宣布,摄影不存在了”;也有专业的胶片摄影博主在看完Recraft生成的图片后,认为该AI的构图和色彩、审美极佳,开始思索还有什么是人类摄影师能够抓住的东西;甚至有人开始研究Recraft的调色与构图,试图进行“反向学习”。
尽管其他AI工具的画风更加细腻,生成的图片更为精美,但看久了难免会有一种“AI味儿”。
无论是不和谐的色彩过渡、结构上的不自然;还是过度平滑、整齐的勾线,毫无瑕疵的质感,总之,早期“一眼假”的是AI味儿,如今过于逼真无瑕的,也是一种AI味儿。
在一众追求细节、力争真实的AI绘画工具面前,强烈、鲜明的视觉风格是Recraft出圈的关键。
刺猬公社(ID:ciweigongshe)尝试用几个不同的模型,输入相同的口令“many animals”。从最终生成的结果来看,Recraft内置的Hard Flash模式,一眼望去的确有种不一样的feel。
Recraft并没有像FLUX或是DALL·E 3那样进行常规构图,而是将不同的动物一字排开,画面中土地与天空的大面积留白,似乎给图像增添了别样的情绪:这是一头孤独的狮子。
当AI生成的画面能够传达情绪,Recraft AI也被贴上了“梦核”“怪诞”的标签,越来越多网友的创作欲开始被激发。
有人将自己喜欢的电影台词或是歌词当做口令输入Recraft,期待着会生成什么画面。
在一条有着1.6万点赞的小红书笔记中,博主“帆”将《宇宙探索编辑部》的台词输入了Recraft,生成的图片虽然并不能百分百复刻台词内容,但整体的画面风格简直“比宇宙探索编辑部还宇宙探索”。
也有人试图用Recraft记录自己的梦境,或是表达难以言喻的情绪,有热心网友专门整理出了,能让Recraft生成更空灵、更梦幻感图片的常用提示词。甚至也有网友从中发现了新商机,帮助无法使用Recraft的用户,生成他们心目的梦核图片,一张几块钱。
网友们的热情参与下,继妙鸭相机、Remini黏土特效之后,又一场AI狂欢的浪潮掀起。大家似乎都想亲自试一试,给AI输入“咒语”,生成一张天马行空的图片,实现一种“魔法成真”的奇妙感受。
于是,近期的小红书、抖音等社交媒体似乎被“魔法”包围了:HelloKitty站在窗边看烟花、小狗在雪地里吃蛋糕、金鱼在蓝色天空中飞过……
11月25日,小红书官方科技薯还专门发起了一项活动,用户使用Recraft生图,带相关话题发布笔记,将有机会被推流。
在社媒的推动下,据点点数据显示,过去一周Recraft在国内App Store的下载量已经跃升至“图形和设计榜单”第二。
AI黑马,什么来头?
尽管Recraft AI已经俘获了国内大量网友的芳心,但实际上,该模式既不能体现、也不能代表Recraft AI的技术实力。
在很多经常使用AI生图工具的用户看来,此前已有的许多AI绘画大模型均能通过口令输入,实现类似的胶片效果。
真正能够证明Recraft AI实力的,是其今年发布的Recraft V3模型。
正式官宣Recraft V3模型前,Recraft AI曾用“red-panda”的化名参与Artificial Analysis网站中AI图像竞技场的投票,并一举超过FLUX、Midjourney、Ideogram、Stable Diffusion 3.5排名第一,成为AI生成图像赛道的一匹黑马。
因为“red-panda”(小熊猫)这个名字,最初还有很多人猜测该模型背后站着的是不是一家中国公司,直到今年10月,Recraft AI在推特上认领该模型,人们才开始关注这家已经成立了两年的AI企业。
Recraft AI成立于2022年,是一家总部位于英国的初创公司。
创始人兼首席执行官安娜•维罗尼卡•多罗古什(Anna Veronika Dorogush),此前曾在谷歌和微软从事软件工程相关工作,后来加入了俄罗斯最大的搜索引擎平台Yandex,是CatBoost开源梯度提升库的创造者。
今年1月,Recraft AI获得了一笔由美国风投机构Khosla Ventures领投的1100万美元A轮融资,GitHub 前首席执行官纳特•弗里德曼(Nat Friedman)也参与其中,该笔融资主要用于加速技术研发以及市场拓展。
由于国内大多用户是通过社交媒体上传播的“Hard Flash”模式,了解到的Recraft AI,所以人们通常会误以为这是一家像Midjourney那样的AI图像生成公司。
但了解之后便会发现,Recraft AI成立的初衷一直是“专注于为平面设计师提供AI辅助工具”。因此,比起Midjourney,它其实更像是AI版的Cavan或者Photoshop。
就连排名第一的Recraft V3模型,某种程度上也是Recraft AI为了方便设计师生成海报而训练的。
在Recraft V3模型官方介绍的博客中,该公司声称此模型是“图像生成领域里,唯一可以生成带有长文本内容的AI图像模型”。
举个例子,如果一名设计师需要在海报上展现大量文字内容,以往的AI生图模型很容易在文字内容上出现拼写错误,所以设计师的常规做法可能是先借助AI生图生成海报背景图,再用其他工具将文字内容P上去。
而Recraft V3模型的逻辑则是,通过提升AI直接在图像中渲染文字内容的准确性,精简设计师利用AI生成海报的流程。AI媒体“新智元”曾在文章中解释该模型的运作机制:
在构建文本信息的过程中,Recraft团队采用的是TextDiffuser-2的表征方式,每一行文本首先记录了文本的内容,随后通过坐标来指明文本的具体区域。但是与TextDiffuser-2不同的是,Recraft用了三个坐标点表示文本,使得模型能够支持渲染倾斜的文本。
总之,结果就是借助Recraft V3,设计师对于海报中文字内容的生成效果与把控力,大大提升了。
除了AI生成漫画风、写实风、胶片风,矢量图、插图、图标和3D图像外,Recraft还提供套索、局部重绘、抠图、mockup等设计工具。
体验过后,最令刺猬公社的设计同事惊艳的是其中的mockup功能。借助AI能力,Recraft AI能够实现图样或图标自动贴合产品图片,直接生成产品样图,省去了设计师手动调整参数的麻烦。此外,Recraft还引入了实时协作功能,同一项目的设计师可在无限画布上对生成的内容进行评论,并及时修改。
懂模型不够,还要懂内容
虽然似乎有80%的国内用户,并没有像Recraft AI创始人设想的那样,把它当成AI设计工具使用,但凭借Hard Flash走红对其而言也并非坏事。
从AI生成图像领域的历史来看,最近3年绝对是赛道内各大玩家竞争最激烈的时期,大家都在争先恐后地更新大模型,生怕一不小心就被甩在身后。
2021年年初,OpenAI发布了DALL-E大模型,AI得以通过文字生图;
2022年3月,Midjourney上线,能根据用户输入的文字快速生成高质量图像;
2022年8月,Stable Diffusion正式开源,通过将随机噪点转化为高保真图像,实现从文本到图像的生成;
2024年8月,Black Forest Labs推出FLUX模型,其图像质量、文本理解和细节表现均超越了Stable Diffusion 3以及Midjourney,成为了该领域新的领头羊……
而到了10月,人们讨论的主角又迅速变成了Recraft。
根据Recraft AI的官方数据显示,在Recraft V3模型发布20天后,该应用在全球的累计注册用户已经超过了200万。每次注册登录时,Recraft都会询问用户“通过什么途径得知的该应用”,据创始人多罗古什透露:“几乎所有的增长都来自于社交媒体,以及用户之间的口口相传。”
这背后暗含的变化是,随着AI生成图像工具逐渐走进普罗大众的生活,AI企业们要想出圈,仅凭模型实力也许还不够。就像多罗古什在采访时说的那样:“仅仅靠生成高质量的AI图像是不够的,(产品)还需要建立一些能够吸引人们注意力的东西。”
以往一些主要面向C端的AI产品,其实早已证明了这点。
比如去年火爆网络的妙鸭相机和今年上半年火了一阵的Remini,这两款产品一个瞄准了“AI写真”,一个创建了“黏土特效”,两者都是凭借极具代表性的产品功能,才在用户心中留下了不可替代的产品标签。
对于Recraft AI来说,Hard Flash所带来的胶片感,就是它在社媒出圈、在更多用户心中形成认知的“抓手”。
在一众力争画面细节与真实感的AI模型中,Recraft出人意料地切入了允许不合常理的“想象力”赛道。
一方面,风格统一的滤镜画风,加深了普通用户对于该应用的记忆,让Recraft的名字在人们脑海中扎下了根。另一方面,这也十分巧妙了掩盖了AI模型在部分能力上的欠缺,就算是生成的人物充满塑料感、画面总是以彩色幕布作为背景,但在“梦核”“怪诞”的风格标签下,一切都变得合理。
AI企业不断追求技术能力的层层突破,自然仍是当下AI发展阶段的重中之重。但若想带领更多的普通用户走进AI时代,也许除了突破性的AI技术,同样也需要进一步降低使用门槛、选择适宜的产品定位以及营销策略,唯有如此,才能有越来越多的AI产品“飞入寻常百姓家”。
参考文章
1、新智元:深度解析Recraft V3 突破文本渲染限制,「文生图」黑马是怎样炼成的?
2、Web3天空之城:AI 绘画何以突飞猛进? 从历史到技术突破, 一文读懂火爆的 AI 绘画发展史
头图|社交网络
本文来自刺猬公社,作者:啊游,编辑:陈梅希,36氪出海经授权转载。
近期活动
36氪出海将于12月19日下午2:00在北京举办主题交流活动。我们邀请到来自商米科技的重磅嘉宾,为出海企业分享其成长为出海独角兽、业务覆盖200+国家和地区的的进阶之路,以及国际化业务中诸多挑战的应对之策。如果您希望深入了解企业出海的实践经验和应对国际市场挑战的方法,欢迎您扫描下方二维码填写表单,报名参加本次活动。活动报名将于12月18日中午12:00截止。
加入36氪出海学习交流群
目前,36氪出海学习交流群已经吸引超过15000位来自国内外初创企业、行业巨头、投资机构等出海人加入。在出海社群里,我们面向群成员挑选整理每日全球跨境资讯,帮助出海人把握最新动态;定期组织出海交流活动,链接出海生态圈,寻找潜在合作伙伴!欢迎添加36氪出海小助手微信(ID:wow36krchuhai-xzs2)申请入群,一同出海!