据Beating称,字节跳动研究开源了 Lance,这是一个拥有 30 亿参数的统一多模态模型,仅使用 128 台 A100 GPU 进行训练。Lance 支持在单一框架内进行图像和视频理解、生成与编辑,表明通过使用双流混合专家架构和模态感知的旋转位置编码,可以在极少的计算资源下实现先进的多模态能力。