去年,在加速大语言模型推理层面,我们迎来了一个比推测解码更高效的解决方案 —— 普林斯顿、UIUC 等机构提出的 Medusa。如今,关于 Medusa 终于有了完整技术论文,还提供了新的版本。
热门文章
查看更多
5 年 160 亿估值,硅谷「企业 AI」领头羊怎么做到的?
2024-07-22
老外都在用!盘点全球最高效的十大办公AI工具
2024-07-24
中国AI长卷(一):大国重算
2024-07-24
美国的芯片保护主义,适得其反
2024-07-24