文本驱动的三维数字媒资AI生成技术

发布日期：2025-01-07 15:20 来源：芜湖市产业创新中心浏览次数：

项目持有方：哈尔滨工业大学
【成果简介】
针对三维数字媒资获取效率低、成本高导致的媒资匮乏问题，开发了文本驱动的三维数字媒资AI生成技术，并建立了一个体系化的文-图-三维媒资库，提出了基于视觉大模型和扩散模型的三维场景生成算法，成功实现了三维数字媒资的灵活、高效生产，推动了元宇宙相关产业的发展，为创造更加丰富、沉浸式的数字体验提供了重要支持。
【技术指标】
Mesh质量评估:宽高比均值>0.410 方差<0.019、圆度均值>0.740 方差<0.045和形状规则性均值>0.770 方差<0.041 重构点云倒角距离<0.250、召回率不低于85%、F1-score不低于75% 参数量不超过180M，对于不同种类的点云语义分割mIOU>84.0。
【应用前景】
该技术能够为网络视听产业带来高效生产和更逼真的三维场景与角色，推动虚拟现实和增强现实
技术的发展。首次应用于河南广播电视台大象元媒资内容的制作和生产。还可推广应用于建筑设计、教育培训、营销广告等行业，为用户带来更丰富、沉浸式的数字体验。
联系方式：0553—3993786

打印本页