2023-12-04 14:07

哈尔滨工业大学(深圳)发布多模态大模型“九天”

东寻 发布在 快讯
5.9万

据站长之家 12 月 4 日报道,哈尔滨工业大学(深圳)近期发布了名为九天(JiuTian-LION)的多模态大语言模型,通过融合细粒度空间感知和高层语义视觉知识,取得了在 13 个视觉语言任务上的 state-of-the-art 性能,尤其在 Visual Spatial Reasoning 任务上实现了 5% 的性能提升。

据称,视觉信息提取不足问题得到解决,九天模型通过渐进式融合细粒度空间感知视觉知识和软提示下的高层语义视觉证据,有效提升了视觉理解能力,减轻了 MLLMs 的幻觉现象。

本文链接:https://www.aixinzhijie.com/article/6840148
转载请注明文章出处

评论
登录 账号发表你的看法,还没有账号?立即免费 注册
下载
分享
收藏
阅读
评论
点赞
上一篇
下一篇