CPET: Effective Parameter-Efficient Tuning for Compressed Large Language Models

Zhao, Weilin
Huang, Yuxiang
Han, Xu
Liu, Zhiyuan
Zhang, Zhengyan
Sun, Maosong

Publication date

November 2023

Language

English

Abstract

Parameter-efficient tuning (PET) has been widely explored in recent years because it tunes much fewer parameters (PET modules) than full-parameter fine-tuning (FT) while still stimulating sufficient knowledge from large language models (LLMs) for downstream tasks. Moreover, when PET is employed to serve multiple tasks, different task-specific PET modules can be built on a frozen LLM, avoiding redundant LLM deployments. Although PET significantly reduces the cost of tuning and deploying LLMs, its inference still suffers from the computational bottleneck of LLMs. To address the above issue, we propose an effective PET framework based on compressed LLMs, named "CPET". In CPET, we evaluate the impact of mainstream LLM compression techniques on ...

Extracted data

We use cookies to provide a better user experience.

Data Protection

CPET: Effective Parameter-Efficient Tuning for Compressed Large Language Models

Abstract

Extracted data

CPET: Effective Parameter-Efficient Tuning for Compressed Large Language Models

Abstract

Extracted data

Related items

Related items