最近两周,“手办化”蓦地就火了。
事情是这么的,约莫在两周之前,大模子竞技场LMArena上架了一个只闻其名,不见其身的遍及模子——“nano banana”,按照官方说法,这是一个顶尖的图像生成与裁剪模子,能终了前所未有的创作欺压力。
收尾呢?总共这个词互联网的AIGC玩家,齐在用它变身“手办民众”。
不开打趣,小雷是真被这玩意给刷屏了,这两天一绽放群聊,就能看到天高皇帝远的群友们在拿这玩意荒诞整活,有把我方头像作念成限量版GK模子的,有把自家猫狗“手办化”的,致使还有给刚发布的《黑据说:钟馗》弄雕像和游戏盒的,推特上的国际网友玩得更是乐此不疲,看得我齐有点心痒痒的。
亏得,此次咱们无用眼巴巴地难得了。
(图源:LMArena)
跟着Google的负责发布,如今Gemini 2.5 Flash Image如故通过Gemini API和Google AI Studio向公众开放预览,用户只需探访官网,就能胜利体验到下一代图像模子的威力。
伸开剩余89%最弥留的是,这玩意在AI Studio里进行测试是透顶免费的,关于咱们这种青睐尝鲜的玩家来说,险些是把探索改日的门槛给胜利铲去了。
话不说多,咱们这边胜利开整!
Gemini 2.5 Flash Image让东谈主东谈主成手办民众
想体验这个功能的话,其实还蛮浅陋的即是了。
绽放Google AI Studio网页版,在Generate media选项卡下就能找到Gemini 2.5 Flash Image。界面尽头直不雅,一个教唆词输入框,一个上传图片的区域,这即是通往新寰宇的大门。
要作念的事情很浅陋,上传一张图片,然后用当然讲话告诉它咱们想要生成的施行就像。
(图源:Gemini)
话未几说,先来看图。
最初,咱们准备一张我方想要进行“手办化”的图片,可以是动漫,也可以是真东谈主,致使不必是全身照,比如这张来自漫画《捉摸不透的刑警织子桑》里的有阿谷織子的单东谈主图就很可以。
接下来,输入教唆词:
Please turn this screenshot of the character into a kotobukiya figure. Behind it, place a toy box printed with the character's image. Next to it, add a computer with its screen displaying the design, complete with the the character. In front of the box, add a round plastic base for the figure and have it stand on it. The PVC material of the base should have a crystal-clear, translucent texture, and set the entire scene indoors.最终制品如下:
(图源:雷科技克己)
不得不说,Gemini对“手办质感”的知道如故超出了我的预期。
这张图的生成成果达到了以伪乱竟然水准,不管是手办本人的材质(蕾丝、皮革、肌肤)、包装盒上的翰墨和品牌Logo,照旧布景电脑屏幕上复杂的建模界面齐很可以,只好高度婉曲的布景能看出些头绪。
再来些热点的,比如说《黑据说:钟馗》:
(图源:雷科技克己)
接着试一下寰球齐热心的名东谈主,比如说马斯克:
(图源:雷科技克己)
从收尾来看,退换成果可以说是几无失手,尽头练习。
要是你想玩点更高档的,咱们把这张生成的图片,扔进雷同是豆包视频生成中,用教唆词“画面外的东谈主从双方伸出亚洲东谈主的双手,提起手办把玩并展示桌上手办的视频”,生成一段把玩手办的视频。
(图源:雷科技克己)
要是用教唆词“360度慢慢旋转这个手办,转台拍摄”,就能生成一段平滑的环绕展示视频。
(图源:雷科技克己)
临了还可以用Meshy或者腾讯混元3D,将手办3D建模化,咱们就能得回一个可以解放旋转、缩放的3D模子。
(图源:雷科技克己)
虽说后两步借助了其他器用,但由Gemini 2.5 Flash Image产出的高质地运行素材,是总共这个词职责流奏效的基石。这种突破次元壁的作念法,让每个东谈主齐能低本钱地终了从一个目的到3D居品的完整进程,在昔日是很难遐想的。
修图才智更强了,其实是终极版PS?
不外,东谈主东谈主齐在玩手办化,是不是有点大材小用了?
咱们不妨退换一下念念路,把它当成终极版的PS来用?
举个例子吧,比如说那些迥殊的、但因年代久远而婉曲碎裂的老像片,它能不可开荒呢?
我上传了一张黑白老像片,像片上有划痕和噪点,暴露度也很低。
(图源:X)
接下来,输入教唆词:
Restore this old photo, remove scratches and noise, increase the resolution, and colorize it realistically.(图源:Gemini)
谜底是,“透顶可以,何况成果惊东谈主”。
可以看到,Gemini 2.5 Flash Image不仅废除了物理损害,还通过算法补全了缺失的细节,面部的纹理和目光光齐得回了妥当逻辑的重现。上色的成果也偏近当然,莫得出现早期AI上色那种“塑料感”,充满了和煦的时期气味。
再试试蓄意行业里滚滚而至的梗,“把白昼改成暮夜”这种条款,它能不可终了呢?
(图源:雷科技)
教唆词:
Change the scene to night time, turn on the streetlights and the lights inside the buildings, make it look like it's raining slightly.
Change the scene to night time, turn on the streetlights and the lights inside the buildings, make it look like it's raining slightly.
(图源:Gemini)
只可说,Gemini 2.5 Flash Image在语义知道和光影重构这块,如故达到了很出彩的水平。它不单是是浅陋地调暗画面,而是着实知道了“夜晚”、“灯光”、“下雨”这些认识,并妥当物理逻辑地对总共这个词画面进行了再行渲染。
临了,我也试了一下它的立场切换才智。此次就拿《Panty&Stocking》里的画面作念例子:
(图源:X)
教唆词:
Convert this scene into a photorealistic movie still from a 1990s live-action film, directed by Wong Kar-wai.(图源:Gemini)
很有道理,它不仅作念到了“三次元化”,还高明地捕捉到了王家卫电影那种专有的色调、光影和氛围感。
这种超过绪论和导演立场的无缝切换,为艺术创作提供了更多可能。
不算完满,却号称图片AIGC新标杆
不可否定,Gemini 2.5 Flash Image的发布,秀雅着AI在图像生成限度终赫然要紧突破。
就像我展示的那样,也曾需要专科东谈主士破耗数小时在PS里用蒙版、图层、笔刷惜墨如金的职责,如今只需一句当然讲话就能蓦地完成,致使修图成果比我这种半吊子还要好上不少,属实有点羞涩。
当今该模子在预览阶段,并非完满无瑕。
在措置极其复杂的、包含大齐东谈主物的场景时,Gemini偶尔照旧会出现轻细的逻辑异常或细节失真。关于一些过于概述或违背物理知识的指示,它的知道才智也还有进步空间。
不管若何说,Gemini 2.5 Flash Image算是为AI图片生成哄骗耕种了一个新的标杆。
可以预见的是,跟着时刻的不停练习和本钱的裁减,改日手机、电脑的相册和裁剪器齐可能会原生集成这项功能,就像AI摒除、AI扩图那样走进寻常匹夫家。不管是专科蓄意师照旧平淡用户,每个东谈主齐有契机夸口上手,将我方脑海中的创意和对好意思的知道,更直不雅、更高效地展现出来。
修图有手就行?大概竟然不是梦凯发·k8国际app娱乐。
发布于:重庆市