北京2024年9月5日 /美通社/ -- 亚马逊云科技宣布,Stability AI最新发布的三款文本生成图像模型:Stable Image Ultra、Stable Diffusion 3 Large和Stable Image Core现已在Amazon Bedrock中正式可用。这些模型大大提升了对包含多个对象提示词的处理能力、图像质量和文字排版效果,可广泛应用于营销、广告、媒体、娱乐、零售等领域,快速生成高质量视觉内容。
这些模型生成的图像异常逼真,具有生动的细节、色彩和明暗效果,并有效解决了如手部和面部真实感渲染等常见挑战。凭借卓越的提示词理解能力,这些模型能够准确解释涉及空间推理、构图和风格的复杂指令。
Amazon Bedrock上提供的三款Stability AI新模型覆盖了不同的使用场景:
Stable Image Ultra——可生成最高质量的写实输出,适用于专业印刷媒体和大尺寸印刷等场景。该模型在细节渲染和写实性方面表现卓越。
Stable Diffusion 3 Large——在图像生成速度和质量之间实现平衡,是制作网站、新闻简报和营销材料等大批量、高质量数字内容的理想之选。
Stable Image Core——专门用于快速且经济地生成图像,非常适合在创意构思阶段快速迭代。
新模型的关键特性:
特性 |
Stable Image Ultra |
Stable Diffusion 3 Large |
Stable Image Core |
参数 |
160亿 |
80亿 |
26亿 |
输入 |
文本 |
文本或图像 |
文本 |
排版 |
为大规模展示定制 |
为大规模展示定制 |
适用不同尺寸和应用场景,具有多样性和可读性 |
视觉美感 |
超写实图像输出 |
高度写实,细节更精细 |
良好的渲染效果,但细节不如其他模型丰富 |
相比 Stable Diffusion XL (SDXL) ,Stable Image Ultra 和 Stable Diffusion 3 Large的主要改进之一是生成图像中的文字质量。得益于创新的Diffusion Transformer架构,新模型减少了拼写和排版错误。该架构为图像和文字分别设计了两套独立的权重,但允许两种模态之间的信息流动。
以下是使用这些模型生成的一些图像。
Stable Image Ultra – 提示词:照片,写实风格,一名女子坐在田野中看着天空中的风筝,暴风雨的天空,细节丰富,概念艺术,复杂、专业构图。
Stable Diffusion 3 Large – 提示词:漫画风格插画,男侦探站在路灯下,黑暗城市,穿着风衣,戴着软呢帽,雨夜,霓虹灯招牌,湿漉漉的人行道上的倒影,细节丰富,氛围感十足的光影。
Stable Image Core – 提示词:专业的 3D 渲染,一只白色和橙色的运动鞋,悬浮在中心,漂浮,高质量,写实风格。
Amazon Bedrock 中 Stability AI 新模型的应用场景
文本生成图像模型为各行业的企业带来了变革性的潜力,能够显著简化营销和广告部门的创意工作流程,为营销活动、社交媒体内容和产品模型快速生成高质量的视觉效果。通过加快创作过程,企业可以更快地响应市场趋势,缩短新产品或项目的上市时间。此外,这些模型还能在创意讨论阶段为概念提供即时的视觉呈现,激发更多创新灵感。
对于电商企业,AI生成的图像可以帮助大规模创建多样化的产品展示和个性化营销材料。在用户体验和界面设计领域,这些工具能够快速生成线框图和原型,加快推动设计迭代过程。采用文本生成图像模型可以显著节约成本、提高生产效率,并在视觉传播方面为各行业企业提供竞争优势。
以下是一些跨行业的应用场景示例:
广告与营销
电商
媒体与娱乐
Stability AI三款全新模型——Stable Image Ultra、Stable Diffusion 3 Large 和 Stable Image Core今天起在的亚马逊云科技美国西部(俄勒冈州)区域内的Amazon Bedrock正式可用。