我在使用人工智能创建图像方面并不是很活跃。大多数情况下,到目前为止,任何人工智能的工具都能够在照片中提供我想要的质量。因此,产生我的Madati图片的负担主要是在我的队友和杰出的图形设计师身上。尽管有一个特殊的博客,但阿玛还是休息了。一切都可以追溯到新的Google“ Nano-Banana”,也称为Gemini 2.5 Flash Image。
这就是所谓的最新模型来生成双子座的图像。 Gemini 2.5或Nano-Panana Flash图像不仅仅是照片编辑模型。为什么?现在,此更新使您可以在一张图片中混合多张照片。至少这是您声称要做的,如Google Blog中提到的那样,它介绍了新的双子座双子座模型。
如果他做他说的事情并做得很好,我个人认识十个人工智能爱好者,他们会很高兴尝试他。如果您是生成人工智能图像的中心之一,那么这是您需要了解的有关新的Gemini 2.5 Flash Image所需的一切,并且尝试了我尝试的过程。
Gueini 2.5 Flash是什么?
简而言之,Gemini 2.5 Flash Image是一种用于使用Google生成和编辑图像的新型号。这是Gemini 2.0 Flash图像生成模型的更新,它具有照片编辑功能,使其更快,更好。
在上下文中,新的Gemini 2.5闪存图像可以在一个图像中混合多个图像,保持字母的一致性,并以形式进行目标转移。用Google的话来说,模型“ Gueeni的全局知识用于创建和编辑图像。
让我们在更多细节中探讨这些功能。
双子座2.5闪存图像功能
保持角色的一致性
只有任何使用人工智能创建图像的人都会与此相关联。单个图像通常为您服务。但是,一旦您想要在一组图像上显示的特定元素,就几乎知道了所有人工智能的模型。
Google声称使用了新的Gimini 2.5 Flash Image进行了研究。这是您对纳米香蕉在这方面的能力的看法:
“现在,您可以在不同的环境中放置相同的手工艺品,在新环境中显示一个具有多个角度的产品,或者在主题上创建一致的商业资产。”
是车道吗?在我对模型的实践经验中很快发现。
根据主张编辑照片
这与图像内部/外部的“ Photoshop”非常相似,但通过简单的主张。 Gemini 2.5 Flash图像“模糊图像壁纸,删除t衬衫的污渍,从图像中删除一个完整的人”等等,如它所声称的Google。
自然语言主张的微观调整是大赦国际的强大模型,只要它做得很好即可。不用担心。我们将尽快在实践培训中尝试。
多个照片合并
这似乎是Gemini 2.5 Flash的新更新。根据Google的说法,Nano-Panana可以“理解和集成多个输入映像”,这意味着您现在可以将图像与一个主张结合在一起。将错过活动的人放在集体图像中,将对象放在场景中或您可以考虑的任何其他用途。所有这些都简单地波浪。
实用下载。留下来者!
对原始世界的了解
正如我在文章中所指出的那样 – 为什么人工智能缺乏合理的本能,人工智能模型缺乏对现实世界的深刻和证据。他们产生的所有美学图像都是他们训练数据的结果。 Google声称她已经超出了这一点,因为新的纳米 – 巴纳纳模型“从Gueini的全球知识中受益”。
Google表示,在没有分享有关如何实现此目标的任何其他信息的情况下,这种功能将开启Gemini 2.5 Flash Image模型的新使用。不用担心,我们将尽快为其每个价值进行测试。
但是在此之前,这是如何访问新的双子座闪光灯2.5图像
Gemini Flash 2.5访问图像的能力
Google Nano-Pana或Gemini Flash 2.5现在可通过双子座或网站提供单个用户的网站。
适用于个人用户
您只需在手机上下载该应用程序,或访问gemini.google.com,并通过在顶部选择2.5闪存并在工具部分中单击“创建照片”来访问表单。
对于开发人员
开发人员可以通过Gemini API和Google AI工作室达到同一件事,而Enterprises客户可以通过Vertex AI访问该工具。
要达到API,请按照以下步骤:
1。安装所需的库
使用PIP安装最新的Google常规AI SDK,请确保安装了PIL(枕头)用于处理图像:
pip install google-generativeai pillow
这将导入文本程序开头的所有必需库,以平稳实现。
2。批准您的申请编程界面
通过将API密钥(如有必要)导出为环境变量或通过云身份提供商的身份验证来准备身份验证,以便Genai SDK可以从Google:
import os
os.environ["GOOGLE_API_KEY"] = ""
确保您的API帐户处于活动状态并有足够的请求。
3。培训并致电模型
客户准备,在“ Gemini-2.5-Flash-Flash-image-preiview”上设置表格,并使用SDK内容生成方法通过相关声明:
from google import genai
client = genai.Client()
prompt = "Create a picture of a nano banana dish in a fancy restaurant with a Gemini theme"
response = client.models.generate_content(
model="gemini-2.5-flash-image-preview",
contents=[prompt],
)
4。创建图像的分析和记忆
通过响应验证文本和图像的输出来重复重复,然后使用PIL保存创建的图像:
from PIL import Image
from io import BytesIO
for part in response.candidates.content.parts:
if part.text is not None:
print(part.text)
elif part.inline_data is not None:
image = Image.open(BytesIO(part.inline_data.data))
image.save("generated_image.png")
要到达Google AI Studio,只需在此处使用Google AI Studio上的“构建模式”。到达平台后,您可以根据所需的Gueini 2.5闪存图像输入照片生成应用程序/照片编辑应用程序的设计。想想脸部或衣服的脸。
Gemini Flash 2.5实用图像
由于使用索赔的人工智能图像的产生是清晰而直接的,因此我决定通过USPS尝试新的Gemini Flash 2.5图像,当然,与生成基本图像不同。亲自检查结果:
1。创建新照片
这是您使用Gemini 2.5 Pro Flash创建的两张照片。来自喜马al尔邦山的25岁男孩之一,另一个来自一只认真的狗。这是主张:
复杂1: 给我一张大约25岁的印度男孩的照片,从喜马al尔邦下降。这个男孩的黑发和浅绿色的眼睛,穿着非常凉爽的白色衬衫
指导2: 给我一张Paadi Gaddi的照片,黑色,皮毛厚,尺寸更大,与普通的街头狗相比
导演:
尽管结果显然显然产生了人工智能,但我将向Nano-Banana提供10/10,以获得结果。这仅仅是由于图像的质量非常高,对需求的仔细摄影以及我从未提及使图片非常现实的事实。
2。合并图片
为了保持一致性,我在其余的测试中使用了这两张图片。因此,我要求模特在背景中合并男孩和狗,欣赏壮丽的景色。这是导师:
称呼: 男孩和狗在一个巨大的开放式田野里,在河谷中流动的河流的背景,在河的另一侧覆盖着雪
导演:

它花了一些时间才能找到人工智能模型,以达到正确的输出。在我找到所需的内容之前,有了短维的初步结果,索赔和结果的结果。但是,一旦我做到了,男孩就很钦佩!正如我提到的,一切都取决于最后的细节,并尽我所能。
3。编辑照片
生成图像并合并后,编辑部分就到了。为了在外面进行测试,我首先要求一张Gemini Flash 2.5的照片,以在风景秀丽的场景中添加一个小型小屋。这是导师:
称呼: 在这张照片中,在远处显示河边的一个小棚子
导演:

在第一次尝试中获悉实施。很明显,Google在纳米式粉碎机上工作了大量工作,尤其是在突出它以取得卓越的领域。
4。保持角色的一致性
在大多数人工智能模型中最困难的部分。坦白说,我对这项USP完全持怀疑态度。当然,我也很高兴尝试一下。我要求表格将图片中的整个设置更改为海滩图像。这是导师:
称呼: 那个男孩和那只拥抱的狗,就像海滩那样,而不是当前的准备工作。这个男孩现在穿着短裤和夹克,左臂上有纹身
导演:

Gemini 2.5 Flash Image没有什么令人印象深刻的,能够做到非常体面的工作。尽管重复尝试达到美学结果,但新图像模型能够以几乎完全准确地重复男孩和狗的细节。如果您仔细观察,您会注意到的轻微差异就是在男孩的发型中。与以前的准备一样,放松与我相似的一切。我什至尝试了“一只手臂纹身”的想法,以了解双子座如何实现它。我只能说这是模型的荣耀!
5。Gemini2.5 Flash Flash驱动图像
为了在应用程序上测试Gemini 2.5 Flash图像以生成频繁和编辑图像,我们在Google AI Studio上使用了以下主张
称呼: 在应用程序上创建一个应用程序,用户可以下载照片并尝试许多衣服以查看他们的外观。
导演: 您可以看到我们在这里创建的尝试应用程序。
结论
通过在新的Gueini 2.5上遇到图片和编辑的一系列图片,我很清楚更新和改进功能。我特别高兴的是能够整合模型的新图像。我可以预测对我个人有用的方案。至于那里的大多数其他内容创建者,编辑图像和新的Gemini 2.5 Flash图像上字母的一致性将被证明是不断变化的游戏。
我们经常尝试使用这些新的人工智能模型来测试其功能的极限。因此,请务必继续调整此空间,以通过人工智能世界中的最新信息进行更新。
登录以继续阅读并享受专家内容。