应用自监督损失将3D编码器纳入LLM本身 无编码器结构首先面临的问题是如何提取高层次3D语义信息,避免模型难以捕捉3D点云的复杂空间结构。可以观察到从PointLLM中拿掉Encoder后,模型性能显著下降。 PointLLM原生的token embedding模块过于粗粒度,为了减少信息损失并 ...
投机采样利用decode过程算力冗余,生成多个候选token并行验证,以提升效率。Clover模型通过设计独特结构和Sample策略提升了命中率和端到端推理速度,Clover2模型在此基础上进行结构升级,增加数据蒸馏loss、前置主模型预测token信息、改进regressive attention block和 ...