• 【超完整懶人包】認識比特幣!原理與應用全面解析|動區新手村
  • Account
  • Account
  • BlockTempo Beginner – 動區新手村
  • Change Password
  • Forgot Password?
  • Home 3
  • Login
  • Login
  • Logout
  • Members
  • Password Reset
  • Register
  • Register
  • Reset Password
  • User
  • 不只加密貨幣,談談那些你不知道的區塊鏈應用|動區新手村
  • 動區動趨 BlockTempo – 最有影響力的區塊鏈新聞媒體 (比特幣, 加密貨幣)
  • 所有文章
  • 最完整的「區塊鏈入門懶人包」|動區新手村
  • 服務條款 (Terms of Use)
  • 關於 BlockTempo
  • 隱私政策政策頁面 / Privacy Policy
動區動趨-最具影響力的區塊鏈新聞媒體
  • 所有文章
  • 搶先看
  • 🔥動區專題
  • 🔥Tempo 30 Award
  • 加密貨幣市場
    • 市場分析
    • 交易所
    • 投資分析
    • 創投
    • RootData
  • 區塊鏈商業應用
    • 金融市場
    • 銀行
    • 錢包
    • 支付
    • defi
    • 區塊鏈平台
    • 挖礦
    • 供應鏈
    • 遊戲
    • dApps
  • 技術
    • 比特幣
    • 以太坊
    • 分散式帳本技術
    • 其他幣別
    • 數據報告
      • 私人機構報告
      • 評級報告
  • 法規
    • 央行
    • 管制
    • 犯罪
    • 稅務
  • 區塊鏈新手教學
  • 人物專訪
    • 獨立觀點
  • 懶人包
    • 比特幣概念入門
    • 從零開始認識區塊鏈
    • 區塊鏈應用
  • 登入
No Result
View All Result
  • 所有文章
  • 搶先看
  • 🔥動區專題
  • 🔥Tempo 30 Award
  • 加密貨幣市場
    • 市場分析
    • 交易所
    • 投資分析
    • 創投
    • RootData
  • 區塊鏈商業應用
    • 金融市場
    • 銀行
    • 錢包
    • 支付
    • defi
    • 區塊鏈平台
    • 挖礦
    • 供應鏈
    • 遊戲
    • dApps
  • 技術
    • 比特幣
    • 以太坊
    • 分散式帳本技術
    • 其他幣別
    • 數據報告
      • 私人機構報告
      • 評級報告
  • 法規
    • 央行
    • 管制
    • 犯罪
    • 稅務
  • 區塊鏈新手教學
  • 人物專訪
    • 獨立觀點
  • 懶人包
    • 比特幣概念入門
    • 從零開始認識區塊鏈
    • 區塊鏈應用
  • 登入
No Result
View All Result
動區動趨-最具影響力的區塊鏈新聞媒體
No Result
View All Result
Home 區塊鏈商業應用 AI

OpenAI 新推最強生圖模型:精準製作資訊圖表、多模態輸入、品質逼真難辨,內建於GPT-4o

Natalia Wu by Natalia Wu
2025-03-26
in AI
A A
OpenAI 新推最強生圖模型:精準製作資訊圖表、多模態輸入、品質逼真難辨,內建於GPT-4o

使用 GPT-4o 生成

164
SHARES
分享至Facebook分享至Twitter

ChatGPT 開發商 OpenAI 今日宣佈推出重大的圖像生成模型升級,用戶現已能直接在 GPT-4o 快速生成並編輯圖像,無需再開啟 DALL-E。本文將整理這個迄今為止最先進的圖像生成模型有哪些功能亮點。
(前情提要:OpenAI 解鎖 Deep Research:付費用戶每月可查詢 10 次、微軟發布多模態 AI 代理 Magma)
(背景補充:中國「Manus」通用型AI代理人爆紅!能開發網頁、分析股票、找房子勝過OpenAI,邀請碼炒到20萬天價)

 

人工智慧巨頭 OpenAI 今(26)日在直播中推出迄今為止最先進的圖像生成模型,內建於 GPT-4o,用戶現已能直接在 ChatGPT 快速生成並編輯圖像,無需再開啟 DALL-E。

官方表示該功能即日起對 Pro 訂閱用戶(每月 200 美元)開放,並將陸續向 Plus、Team 及免費用戶推出,並推送至 Sora 平台及 API 開發者。企業和教育用戶也即將開放使用。

GPT-4o 產圖帶來更高準確度和實用性

新功能採用 GPT-4o 模型,取代原先的 DALL-E 3,具備原生圖像生成與編輯能力,官方稱圖像品質逼真到肉眼難辨,細節豐富,甚至超越 Midjourney 等競爭對手。

與傳統一次生成整個圖像的擴散模型不同,GPT-4o 使用自迴歸技術,從左至右、由上至下類似文字書寫的方式逐步生成圖像。研究負責人 Gabriel Goh 向 The Verge 透露,這項技術顯著提升文字渲染和綁定(binding)的能力,能更好地遵循指令,同時準確處理 10 至 20 個物件的複雜指令,遠超競爭對手 5 ~ 8 個的限制。

此外,GPT-4o 在圖像生成多方面實現突破:

  • 更精確的文字渲染和文字整合:過去模型常難以生成清晰且位置準確的文字,GPT-4o 則能將將文字與圖像精確融合,並整合 GPT 豐富的知識,更適合快速製作資訊圖表、PTT 或海報。

  • 多輪生成圖像:一句話就能 P 圖,可靈活調整長寬比,使用十六進位色碼指定精確顏色或是要求去背。還可利用聊天歷史,用戶可互動式精修圖像,保持多次生成間的一致性。

  • 多模態輸入輸出(文本、影像):GPT‑4o 可以分析和學習使用者上傳的影像,將其細節無縫整合到其上下文中以引導影像生成。

  • 多樣化的風格轉換:從手繪草圖到高解析度寫實風格,模型可靈活創建和轉換,滿足不同需求。

雖然生成速度稍慢於 DALL-E 3,OpenAI 強調品質提升值得這點等待。展示案例包括多格漫畫(角色一致性極高)、LOGO、資訊海報和餐廳菜單設計等等,展現其商業應用潛力。

OpenAI 執行長 Sam Altman 在直播中興奮表示:「這些圖像品質令人驚嘆,我幾乎不敢相信它們出自 AI!這是創意自由的新高峰。」

產品負責人 Jackie Shannon 說道:「GPT-4o 擁有廣泛的世界知識,用戶只需簡單描述如『牛頓稜鏡實驗』,即可獲得精準標註的科學圖解。」這些功能讓 ChatGPT 從文字工具升級為全方位創作平台。

Create or transform images into a variety of styles with 4o image generation. pic.twitter.com/trEqLLZ9KL

— OpenAI (@OpenAI) March 25, 2025

📍相關報導📍

OpenAI 影片生成工具Sora正式上線!5大功能亮點、訂閱方案一次看

OpenAI首款AI代理「Operator」來了!幫你購物、訂票、叫外送…解決繁瑣網路任務

奧特曼定律》OpenAI 執行長:使用AI成本每年會降10倍,未來AI將如空氣般廉價

OpenAI免費開放「ChatGPT搜尋功能」不用註冊帳號也能用,Google要慌了?

關於我們

動區動趨

為您帶來最即時最全面
區塊鏈世界脈動剖析
之動感新聞站

訂閱我們的最新消息

動區精選-為您整理一週間的國際動態

戰略夥伴

Foresight Ventures Foresight News

主題分類

  • 關於 BlockTempo

動區動趨 BlockTempo © All Rights Reserved.

No Result
View All Result
  • 所有文章
  • 搶先看
  • 市場脈動
  • 商業應用
  • 區塊鏈新手教學
  • 區塊鏈技術
  • 數據洞察
  • 政府法規
  • RootData
  • 登入

動區動趨 BlockTempo © All Rights Reserved.