大牛谏言 Instructions for PhD Students

摘要: Dimitris Papadias是港科大的教授,陶宇飞的导师。他写过一个slides,叫作《Instructions for PhD Students》。虽然是这位大牛是做数据库方向的,但是他的谏言对于每一个博士生都非常有用。置顶,每天欣赏一遍。

阅读更多

FREEREG ``利用预训练扩散模型和单目深度估计器的图像到点云配准

摘要:

图像与点云之间的跨模态特征匹配是图像到点云配准的基础问题。然而,由于图像和点云之间的模态差异,现有的度量学习方法在特征匹配上难以学习到稳健且具有区分性的跨模态特征。我们提出了一种方法,首先通过预训练的大规模模型统一图像和点云的模态,然后在相同模态内建立稳健的对应关系。我们展示了通过深度到图像的扩散模型提取的中间特征(称为扩散特征),在图像和点云之间具有语义一致性,这使得建立粗略但稳健的跨模态对应关系成为可能。进一步地,我们提取了由单目深度估计器生成的深度图上的几何特征。通过匹配这些几何特征,我们显著提高了由扩散特征生成的粗略对应关系的准确性。大量实验表明,在没有进行任何I2P配准任务训练的情况下,直接利用这两种特征可以实现准确的图像到点云配准。在三个公共室内和室外基准数据集上,所提方法在Inlier Ratio上平均提升了$20.6%$,Inlier Number提高了$3.0 \times$,Registration Recall提升了$48.6%$,优于现有的最先进方法。代码和附加结果可在 https://whu-usi3dv.qithub.io/FreeReq/ 上获取。

阅读更多

awesome_X

摘要: 本文章用列表记录了多个awesome-xxx的github项目地址, 每一个项目都相当于是该领域的一个小的论文综述或者项目合集。

阅读更多

Buffer of Thoughts - Thought-Augmented Reasoning with Large Language Models

摘要: 本文介绍了Buffer of Thoughts(BoT),这是一种新颖且多功能的思想增强推理方法,用于提高大型语言模型(LLMs)的准确性、效率和鲁棒性。具体来说,我们提出了meta-buffer,用于存储一系列从不同任务的问题解决过程中提取的有用高级思想,即thought-template。然后,对于每个问题,我们检索相关的thought-template,并自适应地用具体的推理结构实例化它,以进行高效推理。 为了保证可扩展性和稳定性,我们进一步提出了buffer-manager,用于动态更新meta-buffer,从而随着更多任务的解决,增强meta-buffer的容量。 我们在10个具有挑战性的推理密集任务上进行了广泛的实验,取得了显著的性能提升:在24点游戏中提高了11%,在几何图形中提高了20%,在一步将军中提高了51%。进一步的分析表明,我们的BoT具有卓越的泛化能力和模型鲁棒性,而其成本仅为多次查询提示方法(例如,tree/graph of thoughts)的12%。 值得注意的是,我们发现我们的Llama3-8B + BoT有可能超过Llama3-70B模型。

阅读更多

TinyCudaNN

摘要: TinyCudaNN是一个用于训练和查询神经网络的小型、自包含框架。最值得注意的是,它包含一个极快的“全融合”多层感知机(技术论文)、一个多功能的多分辨率哈希编码(技术论文),以及对各种其他输入编码、损失函数和优化器的支持。

阅读更多

3D point network distillation from an open-vocabulary 2D image model via 3D fusion

摘要: “a 3D point network distilled from an open-vocabulary 2D image model through 3D fusion”指的是通过三维融合技术,从一个开放词汇的二维图像模型中提炼出一个三维点网络。在这种情况下,”distilled”表达的是从二维模型中提取和转化信息到三维模型的过程。”3D fusion”则是指结合多个来源或多种类型的数据来增强三维点网络的构建或功能。总的来说,这一技术通过结合二维视觉数据和三维处理技术,实现对三维场景的更精确理解和表示。

阅读更多