专业配资网
你的位置:专业配资网_专业配资操盘 > 专业配资网 > 杠杆证券平台 腾讯混元文生图大模型开源训练代码
杠杆证券平台 腾讯混元文生图大模型开源训练代码

发布日期:2024-08-05 22:39    点击次数:69

杠杆证券平台 腾讯混元文生图大模型开源训练代码

记者获悉杠杆证券平台,今日,腾讯混元文生图大模型(以下简称为混元DiT模型)宣布全面开源训练代码,同时对外开源混元DiT LoRA 小规模数据集训练方案与可控制插件ControlNet。

据腾讯混元方面介绍,这意味着,全球的企业与个人开发者、创作者们,都可以基于混元DiT训练代码进行精调,创造更具个性化的专属模型,进行更大自由度的创作;或基于混元DiT的代码进行修改和优化,基于此构建自身应用,推动技术的快速迭代和创新。

作为中文原生模型,用户在通过混元DiT的训练代码进行精调时,可以直接使用中文的数据与标签,无需再将数据翻译成英文。

此前,腾讯混元文生图大模型宣布全面升级并对外开源,已在 Hugging Face 平台及 Github 上发布,可供企业与个人开发者免费商用。据悉,这是业内首个中文原生的DiT架构文生图开源模型,支持中英文双语输入及理解。模型开源仅一个月,Github Star数达到2.4k,位于开源社区热门DiT模型前列。

据悉,在开源训练代码的同时,LoRA小规模数据集训练方案与可控制插件ControlNet的发布也让混元DiT模型的开源生态更具想象力。

LoRA模型,全称Low-RankAdaptation of Large Language Models,是一种用于微调大型语言模型的技术。在文生图模型中,LoRA被用作一种插件,允许用户在不修改原有模型与增加模型大小的情况下,利用少量数据训练出具有特定画风、IP或人物特征的模型。

LoRA技术在文生图开源领域十分受欢迎,大量的创作者利用这种技术创造出多种多样的模型,比如使用几张个人照片,生成一个专属于某个人的高精度照相馆;或创造出盲盒、黏土等风格模型。

混元DiT本次发布的专属LoRA插件,支持开发者最少仅需一张图即可创作出专属的模型。比如,导入四张青花瓷图片与相应的提示词,即可完成模型训练,创建了一个“青花瓷”生成模型:用户输入简单提示词,即可生成想要的青花瓷图像。

值得关注的是,产业互联网发展空间巨大。产业互联网是发挥新一代通信技术在生产要素配置中的优化、集成作用,推动互联网等信息技术与传统产业深度融合,实现生产力跃迁,这与当前发展新质生产力的要义相契合。我国传统产业体量大,在制造业中占比超过80%。在经济转向高质量发展新阶段,传统产业要转型升级,提升在全球产业分工中的地位和竞争力,产业互联网是重要抓手。市场数据显示,我国产业互联网市场渗透率有大幅增长空间。

要推动“政银企”同向发力,让融资支持更顺畅。建立城市房地产融资协调机制的初衷是缓解银行、房企之间的信息不对称,增强双方互信。在市场交易中,信任是稀缺资源,不互信是常态,尤其当一方的风险已经暴露之时,增信就越发重要。“政银企”同向发力是增信的有效途径。一方面,相较于银行,政府部门掌握更多的涉企信用数据,三方形成合力,有助于缓解银企信息不对称问题;另一方面,多家授信银行平等协商、集体决策、一致行动,有助于降低抽贷、“踩踏”等风险,防止恐慌情绪蔓延,避免误伤正常经营的房企。

本次上线的另一个插件ControlNet,则是一种应用于文生图领域的可控化生成算法,它允许用户通过添加额外条件来更好地控制图像的生成。

目前,腾讯混元提供了能提取与应用图像的边缘(canny)、深度(depth)、人体姿势(pose)等条件的三个首发ControlNet模型,让开发者直接使用其进行推理。该三个ControlNet插件能实现通过线稿生成全彩图、生成具有同样深度结构的图、生成具有同样姿态的人等能力。同时,混元DiT也开源了ControlNet的训练方案,开发者与创作者可以训练自定义的ControlNet模型。

据悉,自混元DiT模型开源以来,得到了众多开发者的支持和反馈,腾讯混元团队也一直在持续完善和优化基于混元DiT的开源组件,与行业共建下一代视觉生成开源生态。本月初,混元DiT发布的专属加速库,可将推理效率进一步提升,生图时间缩短75%。同时模型易用性大幅提升,用户可以基于ComfyUI的图形化界面,使用混元DiT,或者通过Hugging Face Diffusers通用模型库,用三行代码即可调用混元DiT模型,无需下载原始代码库。

据了解,腾讯混元文生图能力已广泛被用于素材创作、商品合成、游戏出图等多项业务及场景中。

校对:陶谦杠杆证券平台