摄影师危险了!AI公测,带来相片级真实细节

12月21日,Midjourney在Discord上宣布其最新版本v6的测试版本发布。该模型经过了9个月的训练,虽然缺乏明确的基准比较,就目前网友测试实验出来的能力来看,它可以被堪称当今最先进的文生图模型。这次发布的模型水平不光卷翻了设计圈,也直接卷倒了摄影圈。

摄影师危险了!AI公测,带来相片级真实细节

(先来点真实感震撼)

中途历代全家福:

摄影师危险了!AI公测,带来相片级真实细节

从官方Discord介绍上看,这一次Midjourney的模型提升主要在以下几个方面:

1)更准确的提示遵循以及更长的提示词上下文长度。

据已参与测试的用户通过实测后表示v6现在支持的提示词长度超过350个字符;当前版本在提示里可以指定多个主题/颜色和其他细节。

在准确的遵循提示这一点上,从网友测试来看的提升也很明显。

比如当用法兰克福测试时,v6模型生成的图像明显更符合提示词的具体一点:有拳击手套,面带微笑。

摄影师危险了!AI公测,带来相片级真实细节

下面这个例子更明显,v5.2数不到1000。

摄影师危险了!AI公测,带来相片级真实细节

动作理解的提升:v5.2理解不了趴着,想再爬起来卷。v6就彻底趴平了。

摄影师危险了!AI公测,带来相片级真实细节

2)改进的连贯性和模型知识

在公告中,Midjourney表示

●v6对提示现在更敏感。别再用“令人印象深刻的,简洁的,4k,8k”这样的无用词汇了。

● 明确表达你想要的。虽然它可能没有那么响,但当你明确表达时,它就能在明白你的意思这方面做得更好。

根据用户测试,v6甚至能够理解标点和语法的分数差。升级其实对整个用户体验这产生更大的影响。过去偏向于炼丹式的提示词可能会被更矫正的描述取代。这到底是提高还是降低了新手人口,还真不好说。

针对这一改变,一位设计师给出了当前最适合中途旅行的新提示技巧:核心就是一个清晰的技巧,格式化表达。

摄影师危险了!AI公测,带来相片级真实细节

在模型知识方面v6的演变有一个小细节非常有代表性。下面例子里的提示词是日本女性。v6能分清颇为微妙的不同亚洲族裔之间的相貌区别。林v5.2,图像中女子的造型确实多了日本特征。这种欧洲人根本无法理解的亚洲长相差异也被人工智能拿捏了。

摄影师危险了!AI公测,带来相片级真实细节

(左v5.2,右v6)

3)改进的图像提示和混合

在这里,改进的图像提示其实更多是指按提升生成图像能力的提升,即能够根据文本提示创建更精细和更新的图像。而改善的图像混合是指v6能够使得不同元素和风格的结合更多和谐自然。

从网友的测试来看,v6的图片生成能力确实有明显的提升。最近于v5.2,v6的图片确实更加偏向于丰富和精致。v5.2其实从细节度上来说已经可以到“乱真”的程度了,但v6的感觉是“真”,而不是“仿真”。提示词对的话,结果甚至有一个相机直出的真实增益。

比如说这盘土豆炖牛肉,明显右边v6版本的会更让人有美容。

摄影师危险了!AI公测,带来相片级真实细节

(左:v5.2右v6)

环境还原能力上看,差异也非常明显:v6版本的罗马帝国市场,不说你会以为是《罗马》剧组的场景。而v5.2就略显平面,房子也略有些奇怪。

摄影师危险了!AI公测,带来相片级真实细节

(上v6,下v5.2)

这顿图的对比差异就更加明显了。提示词都是纪录片风格,上面真的很记录,而下面那组细看问题还是很多,缺乏真实的光影和细节深度。

摄影师危险了!AI公测,带来相片级真实细节
摄影师危险了!AI公测,带来相片级真实细节

上为v6,下为v5.2

人像方面,其实v5已经做到相当还原了。但在v6中,脸部的小疙瘩,帽檐上的皱痕与污痕,鼻子上紧贴弧线充满变化的光影让v5.2的照片看起来更相当于美颜过的,太平面了。就算同样是雀,v6的表现也更让人信服,充满了符合人体图案的浓缩性,而非平铺感。

摄影师危险了!AI公测,带来相片级真实细节

v5.2

摄影师危险了!AI公测,带来相片级真实细节

v6

摄影师危险了!AI公测,带来相片级真实细节

v5.2

摄影师危险了!AI公测,带来相片级真实细节

v6

4)文本能力提升

简单地说,v6现在可以在图像中更明确地较差的文本,甚至可以规定其风格。为了获得最佳效果,文本应该用引号标出。这样可以帮助模型区分哪些是描述性的提示,哪些是实际上要在图像中呈现的文本。例如,如果用户想要生成一张图像,上面写着用马克笔在方便贴上写的“HelloWorld!”,他们可以使用类似以下的提示:“imagineaphotoofthetext’HelloWorld!” ‘用amarkeronastickynote编写–ar16:9–v6”

这一点在测试中也非常清晰的显示出来了。现在v6对文字的处理率大幅提高,而且嵌入感也更好。

摄影师危险了!AI公测,带来相片级真实细节

然而可惜的是英文是境外还是鬼画符。但v6已经能够完全进行符合画面的风格化文字创作了。

摄影师危险了!AI公测,带来相片级真实细节

另一个例子中,可口可乐的字体被完美还原。

摄影师危险了!AI公测,带来相片级真实细节

再来一张标志设计图——文字完美贴合画面风格。设计师最后的阵地有点守不住了。

摄影师危险了!AI公测,带来相片级真实细节

中途v6表演出的强大能力看起来对摄影师和设计团队产生了更加的威胁——目前它表演出的审美、和谐的动力能力已经直追顶级摄影师。最可怕的还不是它表演出的力量,不过它进化的速度——在中途的公告中,他们还表示:v6的速度、图像质量、连贯性、提示遵循和文本准确性在未来几周内应该会。而v6beta在发布半个小时提高之后宣布了第一次更新,生成速度提升了2.7倍。

随着Midjourneyv6的发布,新的激动人心的图像生成模型的军备竞赛又要开始了。

上一篇 2023/12/22 02:21
下一篇 2023/12/22 07:00

相关推荐

  • 美国右翼对伊朗认识反转:从’邪恶轴心’到’强硬务实的伙伴’

    短短几个月内,川普对德黑兰的态度经历了戏剧性的转折。曾被其定性为”充满敌意的力量”的伊朗,如今被刻画为一个具备理性决策能力的国家,值得美国认真对话 长期以来…

    2026/06/25
    00
  • 委内瑞拉遭强震侵袭 华人同胞生命危急

    南美国家委内瑞拉于当地时间6月24日遭受两次强烈地震袭击,震级分别为7.2级和7.5级。这次灾难导致首都加拉加斯内众多建筑物出现严重损毁。 根据委内瑞拉全国华侨华人联合总会主席何正…

    2026/06/25 新闻
    00
  • 美加墨世界杯K组小组赛:葡萄牙队战胜乌兹别克斯坦队

    6月23日,葡萄牙队门将迪奥戈·科斯塔(前左一)在比赛中扑救。 当地时间6月23日,在美国休斯敦决赛进行的2026美加墨世界杯足球赛K组小组赛中,葡萄牙队5比0战胜乌兹别克斯坦队。…

    2026/06/23 文娱
    00
  • 海湾地区人道援助进展:国际机构启动撤离计划

    美国政府与伊朗政府就波斯湾地区一项人道主义问题达成了协议。根据该协议,长期滞留在该地区的船员将获得撤离救助。负责执行撤离任务的国际海事组织已获得必要的许可和授权。 滞留船员的处境因…

    2026/06/23
    00
  • 德国资安研究机构因中国合作引发政府调查

    德国一家政府资助的资安研究机构遭曝与中国学术界保持深度合作后,联邦当局决定启动正式调查程序。这所名为Cispa的研究中心位于萨兰州,其主任巴克斯(Michael Backes)目前…

    2026/06/23
    00