智谱AI新突破:CogView4文生图模型,首个开源支持汉字生成达SOTA
2025-03-05 14:33:51 小编:赛迪游戏园
智谱AI最新发布的CogView4模型在文本到图像生成领域取得了突破性进展,成为首个能够生成汉字的开源模型,并在DPG-Bench基准测试中荣获榜首,标志着开源文生图模型的新高度。这一创新成果不仅遵循Apache 2.0协议,更为图像生成领域带来了前所未有的技术革新。
据悉,CogView4模型以其卓越的复杂语义对齐和指令跟随能力,能够支持中英双语输入,无论文本长度如何,均能生成指定范围内的任意分辨率图像。这一特性使得CogView4在广告、短视频等创意领域具有广泛的应用潜力。
在DPG-Bench基准测试中,CogView4凭借其出色的表现脱颖而出,成为开源文生图模型中的佼佼者。DPG-Bench测试主要评估模型在复杂语义对齐和指令跟随方面的能力,而CogView4无疑在这一领域树立了新的标杆。
CogView4的两大技术性创新尤为引人注目。首先,它支持中英双语提示词输入,擅长理解和遵循中文提示词,这在开源文生图模型中尚属首次。通过采用具备双语能力的GLM-4 encoder,并结合中英双语图文对进行训练,CogView4成功实现了双语提示词输入功能。这一创新使得模型能够更好地满足中文用户的创意需求,如古诗文中的意境描绘等。
其次,CogView4支持输入任意长度的提示词,并能够生成指定范围内的任意分辨率图像。这一特性极大地提升了用户创作的自由度,同时也提高了训练效率。为了实现这一目标,CogView4采用了二维旋转位置编码(2D RoPE)来建模图像位置信息,并通过内插位置编码方式支持不同分辨率的图像生成任务。模型还采用了Flow-matching方案进行扩散生成建模,并结合参数化的线性动态噪声规划,以适应不同分辨率图像的信噪比需求。
作为首个遵循Apache 2.0协议的图像生成模型,CogView4的开源将极大地推动AI技术的普及和应用。智谱AI表示,将继续增加ControlNet、ComfyUI等生态支持,并推出全套的微调工具包,以满足更多用户的需求。CogView4的最新版本将于3月13日上线智谱清言平台,供用户下载和使用。
作为国内最早的开源大模型公司之一,智谱AI始终致力于推动AI技术的普惠发展。2025年被定为智谱开源年,公司将陆续开源基础模型、推理模型、多模态模型、Agent模型等,为AI技术的创新和应用注入新的活力。
- 猜你喜欢
-
巅峰霸业(0.05折伏妖记)3.21 MB游戏资源库
-
商道高手自动挂机辅助版842.04 MB游戏资源库
-
五行降妖师585.84 MB游戏资源库
-
青丘(每日6480)228.89 MB游戏资源库
-
闪玩助手最新版46.66 MB游戏资源库
-
坦克大决战GM版370.06 MB游戏资源库
-
酷跑三国(0.1折免费版)433.29 MB游戏资源库
-
奇葩战斗家雷霆版1.82 GB游戏资源库
-
主公快跑手游683.36 MB游戏资源库
- 相关手机游戏
-
盖世豪侠(0.1买断送1000代金)3.48 MB游戏资源库
-
博雅中国象棋官方版51.39 MB游戏资源库
-
特种部队小组31.4 GB游戏资源库
-
神偷鲍勃2最新版90.13 MB游戏资源库
-
大掌门手游华为版209.05 MB游戏资源库
-
城堡争霸台服最新版本549.7 MB游戏资源库
-
王者战魂132.07 MB游戏资源库
-
新斗罗大陆腾讯版2.01 GB游戏资源库
-
跨界对决337.12 MB游戏资源库
- 推荐游戏教程
- 最新手机精选
-
jmcomicron.mic2025-02-22游戏资源库 | 9.9MB
-
安装包jk2025-02-22游戏资源库 | 9.9MB
-
摔跤革命3d官方版2025-02-01游戏资源库 | 39.68 MB
-
宝可梦TCG口袋版2025-01-20游戏资源库 | 199.28MB
-
读圣经手机版和合本2025-02-16游戏资源库 | 9.9MB
-
酸橙和米粒的幸运数字2025-01-31游戏资源库 | 281.03 MB