DemoTuner: Efficient DBMS Knobs Tuning via LLM-Assisted Demonstration Reinforcement Learning
Hui Dou, Lei Jin, Yuxuan Zhou, Jiang He and Yiwen Zhang
MySQL和PostgreSQL等现代DBMS的性能很大程度上取决于性能关键旋钮的配置。 由于配置空间的复杂和高维性质,手动调谐这些旋钮是费力和低效的。 在自动调谐方法中,基于强化学习(RL)的方法最近试图从几个不同的角度改进DBMS旋钮调优过程。 然而,他们在离线训练期间仍然遇到收敛速度缓慢的挑战。 本文主要重点介绍如何利用DBMS手册和网络论坛等各种文本文档中包含的宝贵调优提示,改进基于RL的方法的离线训练。 为此,我们通过新颖的LLM辅助演示强化学习方法,提出了一个名为DemoTuner的高效DBMS旋钮调优框架。 具体来说,为了全面准确地挖掘文档中的调优提示,我们设计了一个结构化的思想提示链,以使用LLM进行条件感知的调优提示提取任务。 为了有效地将挖掘的调优提示集成到 RL 代理训练中,我们在 DemoTuner 中提出了提示感知演示强化学习算法 HA-DDPGfD。 据我们所知,DemoTuner是第一个为DBMS旋钮调优引入演示强化学习算法的工作。 在跨各种工作负载对MySQL和PostgreSQL进行的实验评估表明DemoTuner在性能改进和在线调优成本降低方面的优势,超过了DB-BERT,GPTuner和CDBTune三个代表性基线。 此外,DemoTuner还具有对未知工作负载的应用场景的卓越适应性。
The performance of modern DBMSs such as MySQL and PostgreSQL heavily depends on the configuration of performance-critical knobs. Manual tuning these knobs is laborious and inefficient due to the complex and high-dimensional nature of the configuration space. Among the automated tuning methods, reinforcement learning (RL)-based methods have recently sought to improve the DBMS knobs tuning process from several different perspectives. However, they still encounter challenges with slow convergence s...