Multitask Prompted Training Enables Zero-Shot Task Generalization

ZeroGen: Efficient Zero-shot Learning via Dataset Generation

Ye, Jiacheng
Gao, Jiahui
Li, Qintong
Xu, Hang
Feng, Jiangtao
Wu, Zhiyong
Yu, Tao
Kong, Lingpeng

February 2022

There is a growing interest in dataset generation recently due to the superior generative capacity o...

Multilingual Learning using Syntactic Multi-Task Training

Kondratyuk, Daniel

January 2019

Recent research has shown promise in multilingual modeling, demonstrating how a single model is capa...

Attention Biasing and Context Augmentation for Zero-Shot Control of Encoder-Decoder Transformers for Natural Language Generation

Hazarika, Devamanyu
Namazifar, Mahdi
Hakkani-Tür, Dilek

June 2022

Controlling neural network-based models for natural language generation (NLG) to realize desirable a...

Multitask Prompted Training Enables Zero-Shot Task Generalization

Sanh, Victor
Webson, Albert
Raffel, Colin
Bach, Stephen,
Sutawika, Lintang
Alyafeai, Zaid
Chaffin, Antoine
Stiegler, Arnaud
Le Scao, Teven
Raja, Arun
Dey, Manan
Bari, M Saiful
Xu, Canwen
Thakker, Urmish
Sharma, Shanya
Szczechla, Eliza
Kim, Taewoon
Chhablani, Gunjan
V. Nayak, Nihal
Datta, Debajyoti
Chang, Jonathan
Jiang, Mike,
Wang, Han
Manica, Matteo
Shen, Sheng
Yong, Zheng-Xin
Pandey, Harshit
Mckenna, Michael
Bawden, Rachel
Wang, Thomas
Neeraj, Trishala
Rozen, Jos
Sharma, Abheesht
Santilli, Andrea
Fevry, Thibault
Fries, Jason,
Teehan, Ryan
Bers, Tali
Biderman, Stella
Gao, Leo
Wolf, Thomas
Rush, Alexander,

April 2022

International audienceLarge language models have recently been shown to attain reasonable zero-shot ...

Prompt Consistency for Zero-Shot Task Generalization

Zhou, Chunting
He, Junxian
Ma, Xuezhe
Berg-Kirkpatrick, Taylor
Neubig, Graham

December 2022

One of the most impressive results of recent NLP history is the ability of pre-trained language mode...

Differentiable Prompt Makes Pre-trained Language Models Better Few-shot Learners

Zhang, Ningyu
Li, Luoqiu
Chen, Xiang
Deng, Shumin
Bi, Zhen
Tan, Chuanqi
Huang, Fei
Chen, Huajun

May 2022

Large-scale pre-trained language models have contributed significantly to natural language processin...

Few-shot Learning with Multilingual Language Models

Lin, Xi Victoria
Mihaylov, Todor
Artetxe, Mikel
Wang, Tianlu
Chen, Shuohui
Simig, Daniel
Ott, Myle
Goyal, Naman
Bhosale, Shruti
Du, Jingfei
Pasunuru, Ramakanth
Shleifer, Sam
Koura, Punit Singh
Chaudhary, Vishrav
O'Horo, Brian
Wang, Jeff
Zettlemoyer, Luke
Kozareva, Zornitsa
Diab, Mona
Stoyanov, Veselin
Li, Xian

November 2022

Large-scale generative language models such as GPT-3 are competitive few-shot learners. While these ...

Improving Zero and Few-shot Generalization in Dialogue through Instruction Tuning

Gupta, Prakhar
Jiao, Cathy
Yeh, Yi-Ting
Mehri, Shikib
Eskenazi, Maxine
Bigham, Jeffrey P.

May 2022

Instruction tuning is an emergent paradigm in NLP wherein natural language instructions are leverage...

ZeroPrompt: Scaling Prompt-Based Pretraining to 1,000 Tasks Improves Zero-Shot Generalization

Xu, Hanwei
Chen, Yujun
Du, Yulun
Shao, Nan
Wang, Yanggang
Li, Haiyu
Yang, Zhilin

October 2022

We propose a multitask pretraining approach ZeroPrompt for zero-shot generalization, focusing on tas...

Generating Training Data with Language Models: Towards Zero-Shot Language Understanding

Meng, Yu
Huang, Jiaxin
Zhang, Yu
Han, Jiawei

October 2022

Pretrained language models (PLMs) have demonstrated remarkable performance in various natural langua...

Parameter space factorization for zero-shot learning across tasks and languages

Ponti, Edoardo M.
Vulić, Ivan
Cotterell, Ryan
Parovic, Marinela
Reichart, Roi
Korhonen, Anna

January 2021

Most combinations of NLP tasks and language varieties lack in-domain examples for supervised trainin...

Towards Unified Prompt Tuning for Few-shot Text Classification

Wang, Jianing
Wang, Chengyu
Luo, Fuli
Tan, Chuanqi
Qiu, Minghui
Yang, Fei
Shi, Qiuhui
Huang, Songfang
Gao, Ming

May 2022

Prompt-based fine-tuning has boosted the performance of Pre-trained Language Models (PLMs) on few-sh...

Towards Strong Generalization from Few Examples

Triantafillou, Eleni

November 2021

Deep learning has recently driven remarkable progress in several applications, including image class...

Few-shot learning with language models: Learning from instructions and contexts

Schick, Timo

April 2022

Pretraining deep neural networks to perform language modeling - that is, to reconstruct missing word...

Multimodal Knowledge Alignment with Reinforcement Learning

Yu, Youngjae
Chung, Jiwan
Yun, Heeseung
Hessel, Jack
Park, JaeSung
Lu, Ximing
Ammanabrolu, Prithviraj
Zellers, Rowan
Bras, Ronan Le
Kim, Gunhee
Choi, Yejin

May 2022

Large language models readily adapt to novel settings, even without task-specific training data. Can...

ZeroGen: Efficient Zero-shot Learning via Dataset Generation

Ye, Jiacheng
Gao, Jiahui
Li, Qintong
Xu, Hang
Feng, Jiangtao
Wu, Zhiyong
Yu, Tao
Kong, Lingpeng

February 2022

There is a growing interest in dataset generation recently due to the superior generative capacity o...

Multilingual Learning using Syntactic Multi-Task Training

Kondratyuk, Daniel

January 2019

Recent research has shown promise in multilingual modeling, demonstrating how a single model is capa...

Attention Biasing and Context Augmentation for Zero-Shot Control of Encoder-Decoder Transformers for Natural Language Generation

Hazarika, Devamanyu
Namazifar, Mahdi
Hakkani-Tür, Dilek

June 2022

Controlling neural network-based models for natural language generation (NLG) to realize desirable a...

Multitask Prompted Training Enables Zero-Shot Task Generalization

Sanh, Victor
Webson, Albert
Raffel, Colin
Bach, Stephen,
Sutawika, Lintang
Alyafeai, Zaid
Chaffin, Antoine
Stiegler, Arnaud
Le Scao, Teven
Raja, Arun
Dey, Manan
Bari, M Saiful
Xu, Canwen
Thakker, Urmish
Sharma, Shanya
Szczechla, Eliza
Kim, Taewoon
Chhablani, Gunjan
V. Nayak, Nihal
Datta, Debajyoti
Chang, Jonathan
Jiang, Mike,
Wang, Han
Manica, Matteo
Shen, Sheng
Yong, Zheng-Xin
Pandey, Harshit
Mckenna, Michael
Bawden, Rachel
Wang, Thomas
Neeraj, Trishala
Rozen, Jos
Sharma, Abheesht
Santilli, Andrea
Fevry, Thibault
Fries, Jason,
Teehan, Ryan
Bers, Tali
Biderman, Stella
Gao, Leo
Wolf, Thomas
Rush, Alexander,

April 2022

International audienceLarge language models have recently been shown to attain reasonable zero-shot ...

Prompt Consistency for Zero-Shot Task Generalization

Zhou, Chunting
He, Junxian
Ma, Xuezhe
Berg-Kirkpatrick, Taylor
Neubig, Graham

December 2022

One of the most impressive results of recent NLP history is the ability of pre-trained language mode...

Differentiable Prompt Makes Pre-trained Language Models Better Few-shot Learners

Zhang, Ningyu
Li, Luoqiu
Chen, Xiang
Deng, Shumin
Bi, Zhen
Tan, Chuanqi
Huang, Fei
Chen, Huajun

May 2022

Large-scale pre-trained language models have contributed significantly to natural language processin...

Few-shot Learning with Multilingual Language Models

Lin, Xi Victoria
Mihaylov, Todor
Artetxe, Mikel
Wang, Tianlu
Chen, Shuohui
Simig, Daniel
Ott, Myle
Goyal, Naman
Bhosale, Shruti
Du, Jingfei
Pasunuru, Ramakanth
Shleifer, Sam
Koura, Punit Singh
Chaudhary, Vishrav
O'Horo, Brian
Wang, Jeff
Zettlemoyer, Luke
Kozareva, Zornitsa
Diab, Mona
Stoyanov, Veselin
Li, Xian

November 2022

Large-scale generative language models such as GPT-3 are competitive few-shot learners. While these ...

Improving Zero and Few-shot Generalization in Dialogue through Instruction Tuning

Gupta, Prakhar
Jiao, Cathy
Yeh, Yi-Ting
Mehri, Shikib
Eskenazi, Maxine
Bigham, Jeffrey P.

May 2022

Instruction tuning is an emergent paradigm in NLP wherein natural language instructions are leverage...

ZeroPrompt: Scaling Prompt-Based Pretraining to 1,000 Tasks Improves Zero-Shot Generalization

Xu, Hanwei
Chen, Yujun
Du, Yulun
Shao, Nan
Wang, Yanggang
Li, Haiyu
Yang, Zhilin

October 2022

We propose a multitask pretraining approach ZeroPrompt for zero-shot generalization, focusing on tas...

Generating Training Data with Language Models: Towards Zero-Shot Language Understanding

Meng, Yu
Huang, Jiaxin
Zhang, Yu
Han, Jiawei

October 2022

Pretrained language models (PLMs) have demonstrated remarkable performance in various natural langua...

Parameter space factorization for zero-shot learning across tasks and languages

Ponti, Edoardo M.
Vulić, Ivan
Cotterell, Ryan
Parovic, Marinela
Reichart, Roi
Korhonen, Anna

January 2021

Most combinations of NLP tasks and language varieties lack in-domain examples for supervised trainin...

Towards Unified Prompt Tuning for Few-shot Text Classification

Wang, Jianing
Wang, Chengyu
Luo, Fuli
Tan, Chuanqi
Qiu, Minghui
Yang, Fei
Shi, Qiuhui
Huang, Songfang
Gao, Ming

May 2022

Prompt-based fine-tuning has boosted the performance of Pre-trained Language Models (PLMs) on few-sh...

Towards Strong Generalization from Few Examples

Triantafillou, Eleni

November 2021

Deep learning has recently driven remarkable progress in several applications, including image class...

Few-shot learning with language models: Learning from instructions and contexts

Schick, Timo

April 2022

Pretraining deep neural networks to perform language modeling - that is, to reconstruct missing word...

Multimodal Knowledge Alignment with Reinforcement Learning

Yu, Youngjae
Chung, Jiwan
Yun, Heeseung
Hessel, Jack
Park, JaeSung
Lu, Ximing
Ammanabrolu, Prithviraj
Zellers, Rowan
Bras, Ronan Le
Kim, Gunhee
Choi, Yejin

May 2022

Large language models readily adapt to novel settings, even without task-specific training data. Can...

ZeroGen: Efficient Zero-shot Learning via Dataset Generation

Ye, Jiacheng
Gao, Jiahui
Li, Qintong
Xu, Hang
Feng, Jiangtao
Wu, Zhiyong
Yu, Tao
Kong, Lingpeng

February 2022

There is a growing interest in dataset generation recently due to the superior generative capacity o...

Multilingual Learning using Syntactic Multi-Task Training

Kondratyuk, Daniel

January 2019

Recent research has shown promise in multilingual modeling, demonstrating how a single model is capa...

Attention Biasing and Context Augmentation for Zero-Shot Control of Encoder-Decoder Transformers for Natural Language Generation

Hazarika, Devamanyu
Namazifar, Mahdi
Hakkani-Tür, Dilek

June 2022

Controlling neural network-based models for natural language generation (NLG) to realize desirable a...

Multitask Prompted Training Enables Zero-Shot Task Generalization

Abstract

Extracted data

Multitask Prompted Training Enables Zero-Shot Task Generalization

Abstract

Extracted data

Related items

Related items