系统极客一直在努力
专注操作系统及软件使用技能

OpenAI 揭幕 DALL-E 3 图像生成工具

OpenAI

OpenAI 最新揭幕了 DALL-E 3,这是该著名图像生成工具的最新版本。新版本能够生成与用户查询更为契合的图像,并强调了其增强的理解和解释提示词的能力。

DALL-E 是由 OpenAI 和 Microsoft 共同开发的图像生成人工智能。在创建该人工智能时,使用了由 Microsoft Azure 提供驱动的超级计算机,这一计算系统同时也是构建 GPT AI 引擎的系统之一。目前,该系统已经发展到 GPT-4,并驱动着包括 Bing Chat 和 Microsoft 365 Copilot 在内的多项服务。值得一提的是,DALL-E 也是 Bing 图像创建器的一部分。

DALL-E 3 关键特点和改进

DALL-E 3 能够理解提示的微妙之处,特别是对于较长的提示方面取得了显著进展,这使得它相较于 DALL-E 2(于 2022 年 4 月推出)表现出明显的改进。

DALL-E 3 的主要更新是与 ChatGPT 集成,用户能够通过与聊天机器人进行互动对话,来细化图像请求。这意味着,用户现在可以直接在聊天应用程序中接收生成的图像。

OpenAI 计划于 2023 年 10 月向 ChatGPT Plus 和企业客户发布 DALL-E 3 版本,而更广泛地面向公众和 API 客户的发布则计划在 2023 秋季后期。

DALL-E 3 可以生成与用户查询密切匹配的高质量图像,可以通过精确遵循复杂的描述来生成图像,并管理图像内的文本生成,如标签和 Logo,这也是早期模型所面临的挑战。DALL-E 3 能够以最小变形的方式呈现对象,忠实地遵循提供的提示词。

安全和伦理考虑

OpenAI 也强调了对安全和伦理问题的承诺。已经采取措施增强 DALL-E 3 的安全性,并尽量减少算法偏见。为了解决艺术家对图像生成工具的担忧,DALL-E 3 会拒绝以现有存艺术家风格生成图像的请求。此外,艺术家现在可以选择排除特定或全部作品,不被用于训练未来的 OpenAI 图像生成模型。

除了此之外,OpenAI 还与专业承包商合作,进行其产品的「红队」评估,旨在发现潜在的偏见和其他问题。

竞争环境

尽管 DALL-E 3 有望在图像生成领域树立新的标准,但也面临着市场上其他工具的竞争。开源工具如 Stable Diffusion 以及各种技术公司提供的其它工具也在激烈争夺市场份额。然而,凭借其先进的功能和 OpenAI 的声誉支持,DALL-E 3 具备引领人工智能图像生成领域优势地位的潜力。

赞(0) 赞赏

评论 抢沙发

微信赞赏