学习型索引技术作为传统索引结构的有力竞争者近年来受到了广泛研究。该技术利用静态的学习模型来拟合排序数据的分布,并通过模型对键值对位置进行预测,展现出了卓越的查询速度。然而,在并发插入场景下,频繁的重训练开销很大程度上限制了学习索引性能。尽管已有研究通过引入稀疏插槽和增量缓冲区来减轻这一问题,但是学习型索引在高并发读写场景下的性能仍未达到预期。
为了提升学习索引在并发读写场景下的性能表现,信息存储与光显示功能实验室硕士生杨雨鑫在王芳教授的指导下,提出了一种高效的ALT-index混合学习索引架构。ALT-index将读高效的学习型索引和传统插入高效的自适应基数树(ART)相结合,最大程度上利用了学习索引的读性能和ART的写性能。与现有的主流学习型索引结构相比,ALT-index在读写均衡场景下的性能分别比ALEX+、FINEdex和XIndex提高了最高1.9倍、2.1倍和2.3倍。
本工作题目为“ALT-index: A Hybrid Learned Index for Concurrent Memory Database Systems”,成果已被中国计算机学会推荐的A类学术会议ICDE 2025录用。该工作得到了重点研发项目(No. 2022YFB4501300),国家自然科学基金项目(No. U22A2027 和No. 61821003)以及深圳市科技项目((JCYJ20210324141601005)的支持。
图1 ALT-index结构图
图2 不同读写比例下的性能表现