OpenAI在3月25日宣布了對GPT-4o和Sora的重大更新,引入了一項引人注目的新功能——一個(gè)全新的文本到圖像生成模型。這一新模型不僅限于文本到圖像的轉換,還具備自定義操作、連續提問(wèn)、風(fēng)格轉換以及圖像PPT制作等一系列實(shí)用功能。
在周二的一次直播活動(dòng)中,OpenAI的首席執行官奧爾特曼正式宣布,基于GPT-4o模型的原生圖像生成功能已經(jīng)問(wèn)世,這標志著(zhù)DALL-E這一獨立的文本到圖像生成模型被整合進(jìn)了ChatGPT系統?;仡櫄v史,ChatGPT在2022年底推出時(shí),僅支持文字聊天功能,大約一年后,雖然集成了DALL-E 3圖像生成模型,但兩者在系統層面上仍然是獨立的。此前,AI圖像生成器存在諸如“理解提示詞能力不足”和“無(wú)法準確生成圖片中的文字”等問(wèn)題,這些問(wèn)題極大地限制了其在教育和職場(chǎng)等領(lǐng)域的應用潛力。
然而,此次升級后的ChatGPT在圖像生成功能方面取得了顯著(zhù)的進(jìn)步。它能夠更加準確地根據提示詞生成圖像中的文本,特別是在生成黑板板書(shū)、印刷體以及科學(xué)常識繪圖等涉及圖像文字的場(chǎng)景中,其表現從幾乎不可用提升到了接近商用水平。圖像編輯功能也得到了極大的增強,例如,可以將合照轉化為動(dòng)畫(huà)風(fēng)格,根據簡(jiǎn)單的提示詞生成相對論主題的彩色漫畫(huà),還能根據漫畫(huà)草稿一鍵上色或更換主要角色。
在商業(yè)應用方面,這一新模型也展現出了巨大的潛力。用戶(hù)可以根據上傳的照片和卡片模板自定義生成新的卡片,甚至能夠基于聊天的上下文生成一系列風(fēng)格一致的圖像。這對于游戲角色設計等領(lǐng)域來(lái)說(shuō),無(wú)疑是一個(gè)重大的突破。然而,OpenAI也坦誠地承認,新的圖像生成器仍然存在一些局限性,特別是在處理密集文字和非拉丁語(yǔ)文字的圖像生成時(shí),可能會(huì )遇到問(wèn)題,這在一定程度上受到了模型幻覺(jué)的影響。
盡管存在這些局限性,但OpenAI的這一升級仍然為ChatGPT的發(fā)展注入了新的活力。從周二開(kāi)始,這一新功能已經(jīng)向所有免費和付費用戶(hù)開(kāi)放,而在未來(lái)幾周內,開(kāi)發(fā)者還可以通過(guò)API接口進(jìn)行調用。這一系列的更新和改進(jìn),無(wú)疑讓我們對ChatGPT在更多領(lǐng)域的應用表現充滿(mǎn)了期待。
Copyright 2025 //m.mrigadava.com/ 版權所有 豫ICP備2021037741號-1 網(wǎng)站地圖