Gemini 2.5图像(纳米香蕉)的表现优于所有照片编辑器!

我在使用人工智能创建图像方面并不是很活跃。大多数情况下,到目前为止,任何人工智能的工具都能够在照片中提供我想要的质量。因此,产生我的Madati图片的负担主要是在我的队友和杰出的图形设计师身上。尽管有一个特殊的博客,但阿玛还是休息了。一切都可以追溯到新的Google“ Nano-Banana”,也称为Gemini 2.5 Flash Image。

这就是所谓的最新模型来生成双子座的图像。 Gemini 2.5或Nano-Panana Flash图像不仅仅是照片编辑模型。为什么?现在,此更新使您可以在一张图片中混合多张照片。至少这是您声称要做的,如Google Blog中提到的那样,它介绍了新的双子座双子座模型。

如果他做他说的事情并做得很好,我个人认识十个人工智能爱好者,他们会很高兴尝试他。如果您是生成人工智能图像的中心之一,那么这是您需要了解的有关新的Gemini 2.5 Flash Image所需的一切,并且尝试了我尝试的过程。

Gueini 2.5 Flash是什么?

简而言之,Gemini 2.5 Flash Image是一种用于使用Google生成和编辑图像的新型号。这是Gemini 2.0 Flash图像生成模型的更新,它具有照片编辑功能,使其更快,更好。

在上下文中,新的Gemini 2.5闪存图像可以在一个图像中混合多个图像,保持字母的一致性,并以形式进行目标转移。用Google的话来说,模型“ Gueeni的全局知识用于创建和编辑图像。

让我们在更多细节中探讨这些功能。

双子座2.5闪存图像功能

保持角色的一致性

只有任何使用人工智能创建图像的人都会与此相关联。单个图像通常为您服务。但是,一旦您想要在一组图像上显示的特定元素,就几乎知道了所有人工智能的模型。

Google声称使用了新的Gimini 2.5 Flash Image进行了研究。这是您对纳米香蕉在这方面的能力的看法:

“现在,您可以在不同的环境中放置相同的手工艺品,在新环境中显示一个具有多个角度的产品,或者在主题上创建一致的商业资产。”

是车道吗?在我对模型的实践经验中很​​快发现。

根据主张编辑照片

这与图像内部/外部的“ Photoshop”非常相似,但通过简单的主张。 Gemini 2.5 Flash图像“模糊图像壁纸,删除t衬衫的污渍,从图像中删除一个完整的人”等等,如它所声称的Google。

自然语言主张的微观调整是大赦国际的强大模型,只要它做得很好即可。不用担心。我们将尽快在实践培训中尝试。

多个照片合并

这似乎是Gemini 2.5 Flash的新更新。根据Google的说法,Nano-Panana可以“理解和集成多个输入映像”,这意味着您现在可以将图像与一个主张结合在一起。将错过活动的人放在集体图像中,将对象放在场景中或您可以考虑的任何其他用途。所有这些都简单地波浪。

实用下载。留下来者!

对原始世界的了解

正如我在文章中所指出的那样 – 为什么人工智能缺乏合理的本能,人工智能模型缺乏对现实世界的深刻和证据。他们产生的所有美学图像都是他们训练数据的结果。 Google声称她已经超出了这一点,因为新的纳米 – 巴纳纳模型“从Gueini的全球知识中受益”。

Google表示,在没有分享有关如何实现此目标的任何其他信息的情况下,这种功能将开启Gemini 2.5 Flash Image模型的新使用。不用担心,我们将尽快为其每个价值进行测试。

但是在此之前,这是如何访问新的双子座闪光灯2.5图像

Gemini Flash 2.5访问图像的能力

Google Nano-Pana或Gemini Flash 2.5现在可通过双子座或网站提供单个用户的网站。

适用于个人用户

您只需在手机上下载该应用程序,或访问gemini.google.com,并通过在顶部选择2.5闪存并在工具部分中单击“创建照片”来访问表单。

对于开发人员

开发人员可以通过Gemini API和Google AI工作室达到同一件事,而Enterprises客户可以通过Vertex AI访问该工具。

要达到API,请按照以下步骤:

1。安装所需的库

使用PIP安装最新的Google常规AI SDK,请确保安装了PIL(枕头)用于处理图像:

pip install google-generativeai pillow

这将导入文本程序开头的所有必需库,以平稳实现。

2。批准您的申请编程界面

通过将API密钥(如有必要)导出为环境变量或通过云身份提供商的身份验证来准备身份验证,以便Genai SDK可以从Google:

import os
os.environ["GOOGLE_API_KEY"] = ""

确保您的API帐户处于活动状态并有足够的请求。

3。培训并致电模型

客户准备,在“ Gemini-2.5-Flash-Flash-image-preiview”上设置表格,并使用SDK内容生成方法通过相关声明:

from google import genai
client = genai.Client()
prompt = "Create a picture of a nano banana dish in a fancy restaurant with a Gemini theme"
response = client.models.generate_content(
model="gemini-2.5-flash-image-preview",
contents=[prompt],
)

4。创建图像的分析和记忆

通过响应验证文本和图像的输出来重复重复,然后使用PIL保存创建的图像:

from PIL import Image
from io import BytesIO
for part in response.candidates.content.parts:
if part.text is not None:
print(part.text)
elif part.inline_data is not None:
image = Image.open(BytesIO(part.inline_data.data))
image.save("generated_image.png")

要到达Google AI Studio,只需在此处使用Google AI Studio上的“构建模式”。到达平台后,您可以根据所需的Gueini 2.5闪存图像输入照片生成应用程序/照片编辑应用程序的设计。想想脸部或衣服的脸。

Gemini Flash 2.5实用图像

由于使用索赔的人工智能图像的产生是清晰而直接的,因此我决定通过USPS尝试新的Gemini Flash 2.5图像,当然,与生成基本图像不同。亲自检查结果:

1。创建新照片

这是您使用Gemini 2.5 Pro Flash创建的两张照片。来自喜马al尔邦山的25岁男孩之一,另一个来自一只认真的狗。这是主张:

复杂1: 给我一张大约25岁的印度男孩的照片,从喜马al尔邦下降。这个男孩的黑发和浅绿色的眼睛,穿着非常凉爽的白色衬衫

指导2: 给我一张Paadi Gaddi的照片,黑色,皮毛厚,尺寸更大,与普通的街头狗相比

导演:

  • Gemini 2.5图像(纳米香蕉)的表现优于所有照片编辑器!

尽管结果显然显然产生了人工智能,但我将向Nano-Banana提供10/10,以获得结果。这仅仅是由于图像的质量非常高,对需求的仔细摄影以及我从未提及使图片非常现实的事实。

2。合并图片

为了保持一致性,我在其余的测试中使用了这两张图片。因此,我要求模特在背景中合并男孩和狗,欣赏壮丽的景色。这是导师:

称呼: 男孩和狗在一个巨大的开放式田野里,在河谷中流动的河流的背景,在河的另一侧覆盖着雪

导演:

双子座2.5闪存图像 - 合并图像

它花了一些时间才能找到人工智能模型,以达到正确的输出。在我找到所需的内容之前,有了短维的初步结果,索赔和结果的结果。但是,一旦我做到了,男孩就很钦佩!正如我提到的,一切都取决于最后的细节,并尽我所能。

3。编辑照片

生成图像并合并后,编辑部分就到了。为了在外面进行测试,我首先要求一张Gemini Flash 2.5的照片,以在风景秀丽的场景中添加一个小型小屋。这是导师:

称呼: 在这张照片中,在远处显示河边的一个小棚子

导演:

Gemini 2.5 Flash图像编辑

在第一次尝试中获悉实施。很明显,Google在纳米式粉碎机上工作了大量工作,尤其是在突出它以取得卓越的领域。

4。保持角色的一致性

在大多数人工智能模型中最困难的部分。坦白说,我对这项USP完全持怀疑态度。当然,我也很高兴尝试一下。我要求表格将图片中的整个设置更改为海滩图像。这是导师:

称呼: 那个男孩和那只拥抱的狗,就像海滩那样,而不是当前的准备工作。这个男孩现在穿着短裤和夹克,左臂上有纹身

导演:

双子座2.5闪光图像 - 图像雕刻

Gemini 2.5 Flash Image没有什么令人印象深刻的,能够做到非常体面的工作。尽管重复尝试达到美学结果,但新图像模型能够以几乎完全准确地重复男孩和狗的细节。如果您仔细观察,您会注意到的轻微差异就是在男孩的发型中。与以前的准备一样,放松与我相似的一切。我什至尝试了“一只手臂纹身”的想法,以了解双子座如何实现它。我只能说这是模型的荣耀!

5。Gemini2.5 Flash Flash驱动图像

为了在应用程序上测试Gemini 2.5 Flash图像以生成频繁和编辑图像,我们在Google AI Studio上使用了以下主张

称呼: 在应用程序上创建一个应用程序,用户可以下载照片并尝试许多衣服以查看他们的外观。

Google Nano Banana

导演: 您可以看到我们在这里创建的尝试应用程序。

结论

通过在新的Gueini 2.5上遇到图片和编辑的一系列图片,我很清楚更新和改进功能。我特别高兴的是能够整合模型的新图像。我可以预测对我个人有用的方案。至于那里的大多数其他内容创建者,编辑图像和新的Gemini 2.5 Flash图像上字母的一致性将被证明是不断变化的游戏。

我们经常尝试使用这些新的人工智能模型来测试其功能的极限。因此,请务必继续调整此空间,以通过人工智能世界中的最新信息进行更新。

技术内容和沟通的战略具有十年的经验,可以通过国家媒体,印度政府和私人平台创建和分发内容

登录以继续阅读并享受专家内容。

Source link

Similar Posts