2024-09-19 05:26

00后北大女生,打造AI生成4D动画平台,一度登上Huggingface热门榜

3.3万

文章来源:创业邦

原文链接:https://mp.weixin.qq.com/s/ELBXmA7viGko-NHPsk6Lpg

图片来源:由无界AI生成
图片来源:由无界AI生成

00后胡雅婷,大学毕业便选择了创业。胡雅婷外形靓丽,衣着时尚,完全刷新了我们对创业者形象的想象。

毕业于北京大学计算机系的胡雅婷,曾就职于谷歌、阿里、字节跳动,担任算法工程师,她还曾参加过信息学奥林匹克竞赛,获得全国金牌及最佳女选手奖项。在大厂实习期间,她看到互联网流量已经到顶,但3D是一次内容升维,因此在大学毕业便决定创业。

胡雅婷创办的Aiuni,是一个AI生成4D动画的IP平台,今年6月,AiuniAI的3D生成模型Unique3D在GitHub、Huggingface等平台开源,迅速在Huggingface登上了热门模型排行榜,并被提名为“最佳图片生成3D模型”,获得了诸多开发者的点赞。

Unique3D能够从单视图图像生成高保真度和多样化纹理的三维网格,在4090显卡上大约需要30秒。不少网友在社交媒体上分享了他们的生成结果,并且盛赞该模型在保真度、一致性、效率上已经达到了相当高的水平。短短几个月内,Unique3D已经达到百万级的生成量。

今年夏天,胡雅婷加入了创业邦星际营25期——星际营新锐AI之星加速计划。

在加速之后,她将于本月19-20日登上2024DEMO CHINA的舞台,以进阶姿态面向各领域知名投资人、行业专家、产业伙伴展示她所打造的产品与商业应用的思考。


瞄准3D市场

作为一种真实世界在互联网世界进行映射的关键手段,3D技术已经深入到各个领域,从游戏开发、电影制作到产品设计、电商渲染、建筑规划,3D技术的应用场景几乎覆盖了整个互联网产业。

根据应用场景的不同,3D建模的成本也各不相同,越精细的模型,其制作流程就越繁琐,生产周期长,成本高昂,每个3D模型的创建成本至少需要数千元甚至数万元。

当前,动漫影视、游戏等娱乐行业是3D建模最主要的应用领域。在游戏行业,随着3D引擎的不断发展,3D游戏逐渐成为市场主流,对3D建模的需求极高;在动画影视产业,利用3D技术,制作宏大的场景仅需要绿幕技术加重要演员即可完成,减少了剧方的人员成本。

根据头豹发布的数据,2021年,中国3D建模市场空间达到了103.4亿元,预计到2026年,市场规模将达到195.7亿元。而2021年全球3D动画市场的规模估计在1640亿美元左右,市场预计将以11.5%的复合年增长率(CAGR)增长,到2026年达到3100亿美元左右。

Aiuni团队瞄准的就是这片市场。

除了胡雅婷之外,公司技术合伙人吴凯路,是胡雅婷参加信息学奥林匹克竞赛认识的,毕业于清华姚班,在清华大学交叉信息研究院从事3D生成和NeRF方向的研究,本科期间就发表了多篇论文,创新性地提出了FSD(text-to-3d流分数蒸馏)和MemSR(高效训练超分辨率模型)。曾参加信息学奥林匹克竞赛国家集训队,也是在参赛时认识的。公司运营合伙人任靳珊,是曾经的文科状元,毕业于北大光华管理学院,拥有芝加哥大学艺术理论硕士学位。

Aiuni已经成功获得天使+轮在内的三轮融资。

打造垂类模型 形成技术优势

在做产品的过程中,胡雅婷发现,由于几乎所有的动画和游戏都是围绕角色展开的,因此,所有类型的3D资产中,最有价值的就是角色。而且,很多用户做经典角色二创,或者有想实现的原创角色,原创需求也比较大,胡雅婷认为,这一部分比较适合用AIGC来生成。

“这些用户希望能便捷、便宜地生成3D角色,但3D建模的成本较高,大多数情况下只能应用于动画、影视等B端工作室当中。”

当利用AI将3D建模的门槛降低到极致后,之前无法创作3D内容的用户,便具备了创作能力,可以独立制作新3D作品。

“目前我们看到的大部分视频内容都是实拍的,未来基于3D模型的动画和特效内容会被制作成短视频,视频量和创作性将会大大增加。”胡雅婷说。

相对其他图像,角色的生成难度要更高。胡雅婷说:“由于3D模型是比较专业化的场景,并且Aiuni接下来将会做角色生成、动画生成和视频合成,面向数字内容的创作者提供服务。这些都对模型精度提出了更高的要求。由于涉及到人体骨骼、服装配饰等精细维度,需要大量细节和数据,几何数据处理是一个巨大的挑战。同时,由于要支持标准的模型姿势(即A Pose),材质和动作数据也需要更标准化的处理。

Aiuni采取的方案是,通过算法架构创新达到SOTA级精度,比起以往基于Score Distillation Sampling(SDS)等方法,Aiuni解决了模型生成需要长时间优化,几何质量差,存在不一致性的问题。同时,团队也优化了基于多视图扩散模型方法受限于局部不一致性和生成分辨率,难以产生精细的纹理和复杂的几何细节的问题,首次将分辨率从256提升到2k/8k级,满足用户对模型精度和质量的要求。

Unique3D的论文中介绍,这种方案能够通过一个多视图扩散模型和相应的法线扩散模型、一个多级升级过程以及一种即时且一致的网格重建算法 ISOMER来生成更好的 3D 结果。在实验中,Aiuni的模型与 InstantMesh、CRM 和 OpenLRM 进行比较,能够生成更精确的几何图形和详细的纹理,明显优于其他模型。

“Unique3D既有它的生成式和泛化性,又可以确实地落在渲染引擎里,创造对用户来说非常有价值的内容。”胡雅婷认为,相比竞品,Unique3D的优势,是能把CG图形学和AI可微渲染的3D做了很好的结合。

相比大厂的泛化大模型,胡雅婷认为,Aiuni做的模态更多,更垂直,“其实我们是有多个不同模态的垂类模型,比如角色的设定模型、3D模型,自动绑定或者生成动作数据以及渲染合成的模型等等,我们会把它们垂直串在一起。而且这不是一个纯堆算力或者数据的事情,需要一些算法架构的创新。”

视频大模型的泛化性比较强,但对于角色一致性、动作可控性、生成训练成本和推理效率是很难控制的,相比之下,Aiuni在这些方面有更大的优势。

从3D到4D 面向全球IP创作者

在Aiuni.ai网站上,目前拥有两个已经上线的功能,能够分别生成3D世界和3D模型。而胡雅婷透露,接下来Aiuni将上线的功能将围绕着动画视频模态——生成3D角色、生成角色动画、将真人视频替换为3D角色、将角色动画合成到实拍视频等。这也是Aiuni团队正在努力的方向,即动态化的3D内容(即4D)。

Aiuni团队认为,AIGC多模态的发展趋势是从生成2D、到生成3D模型、最终到生成4D内容。文字生成2D图像仅仅是一个开始,为2D图像赋予空间维度就有了3D模型,这也是未来空间计算的基础载体。他们希望,未来该功能可以为3D模型赋予时间维度,成为高频次、可交互的4D内容。

“我们在3D角色模型生成之后可以继续延伸到4D,例如改变模型的动作,或让模型与用户互动,同时也可以拥有视频渲染和语音交互的能力,任何模型都可以持续创造动态内容。” 胡雅婷表示,要完成从自然语音到图片、再到3D模型和动态视频,整个工作流当中最重要的就是AI技术与图形学CG艺术的结合。

基于这种预期,Aiuni于4月首先推出了3D模型生成的内测版本,在部分渠道发放了邀请码。今年10月,公司预计推出新公测版本,新版本面向角色动画的IP创作者用户。

“一个用户,之前可能不会用3D专业工具,可能只是一个游戏或动画的ACGN爱好者,通过我们的平台,也可以去做他喜爱的IP角色进行原创或内容二创,并且在平台上可以导出动画视频,在创作者社群和新媒体平台上传播。”胡雅婷表示,公测新版本将支持角色生成、动画生成,适合口播视频、跳舞视频等场景。

在商业模式上,Aiuni的计划是面向专业创作者和IP爱好者推出不同的收费模式。3D专业用户需要3D原始数据,而且平台可以提高他们的生产力,所以会有较强的付费意愿;对于新媒体IP创作者,主要根据生成时长和渲染精度收取token费用。对其他类型的用户,创作者经济更加多样,比如有的用户希望增加角色个性化语音模型,或3D打印模型用于制作其他IP衍生品,这些都是潜在的付费点。

胡雅婷表示,Aiuni未来会面向IP创作的新媒体场景,陆续上线更多的AI技术结合CG艺术的多模态算法。AiuniAI的海外用户占到70%,平台会面向全球化创作者进行运营。胡雅婷说,3D/4D模态目前还是新生事物,华人在做的更多,公司在海外没有直接的竞品。

“我们使命是创建一个AI生成4D动画的IP平台,面向新媒体的数字内容创作者。3D生成是我们的第一步,在这个新的模态上我们有着无限的创作空间,我们也相信AIGC结合内容升维将为新一代IP创作赋予源源不断的生命力。”胡雅婷说。


本文链接:https://www.aixinzhijie.com/article/6846754
转载请注明文章出处

评论
登录 账号发表你的看法,还没有账号?立即免费 注册
下载
分享
收藏
阅读
评论
点赞
上一篇
下一篇