huggingface/transformers: ALBERT, CamemBERT, DistilRoberta, GPT-2 XL, and Encoder-Decoder architectures

Thomas Wolf
Lysandre Debut
Victor SANH
Julien Chaumond
Rémi Louf
Denis
erenup
Matt
Grégory Châtel
Stefan Schweter
Tim Rault
Catalin Voss
Fei Wang
Louis Martin
Malte Pietsch
Davide Fiocco
dhanajitb
Jinoo
Ananya Harsh Jha
Simon Layton
yzy5630
Yongbo Wang
Shijie Wu
Nikolay Korolev
Guillem García Subies
Matt Maybeno
Joel Grus
Jade Abbott
David Pollack
Clement

Publication date

November 2019

DOI

Abstract

New model architectures: ALBERT, CamemBERT, GPT2-XL, DistilRoberta Four new models have been added in v2.2.0 ALBERT (Pytorch & TF) (from Google Research and the Toyota Technological Institute at Chicago) released with the paper ALBERT: A Lite BERT for Self-supervised Learning of Language Representations, by Zhenzhong Lan, Mingda Chen, Sebastian Goodman, Kevin Gimpel, Piyush Sharma, Radu Soricut. CamemBERT (Pytorch) (from Facebook AI Research, INRIA, and La Sorbonne Université), as the first large-scale Transformer language model. Released alongside the paper CamemBERT: a Tasty French Language Model by Louis Martin, Benjamin Muller, Pedro Javier Ortiz Suarez, Yoann Dupont, Laurent Romary, Eric Villemonte de la Clergerie, Djame Seddah, and...

Extracted data

We use cookies to provide a better user experience.

Data Protection

huggingface/transformers: ALBERT, CamemBERT, DistilRoberta, GPT-2 XL, and Encoder-Decoder architectures

Thomas Wolf
Lysandre Debut
Victor SANH
Julien Chaumond
Rémi Louf
Denis
erenup
Matt
Grégory Châtel
Stefan Schweter
Tim Rault
Catalin Voss
Fei Wang
Louis Martin
Malte Pietsch
Davide Fiocco
dhanajitb
Jinoo
Ananya Harsh Jha
Simon Layton
yzy5630
Yongbo Wang
Shijie Wu
Nikolay Korolev
Guillem García Subies
Matt Maybeno
Joel Grus
Jade Abbott
David Pollack
Clement

Open link

Publication date

November 2019

DOI

10.5281/zenodo.3554494

Abstract

Extracted data

Wolf, Thomas
Debut, Lysandre
Sanh, Victor
Chaumond, Julien
Delangue, Clement
Moi, Anthony
Cistac, Perric
Ma, Clara
Jernite, Yacine
Plu, Julien
Xu, Canwen
Le Scao, Teven
Gugger, Sylvain
Drame, Mariama
Lhoest, Quentin
Rush, Alexander M.

October 2020

Perceiver The Perceiver model was released in the previous version: Perceiver Eight new models are r...

huggingface/transformers: ALBERT, CamemBERT, DistilRoberta, GPT-2 XL, and Encoder-Decoder architectures

Thomas Wolf
Lysandre Debut
Victor SANH
Julien Chaumond
Rémi Louf
Denis
erenup
Matt
Grégory Châtel
Stefan Schweter
Tim Rault
Catalin Voss
Fei Wang
Louis Martin
Malte Pietsch
Davide Fiocco
dhanajitb
Jinoo
Ananya Harsh Jha
Simon Layton
yzy5630
Yongbo Wang
Shijie Wu
Nikolay Korolev
Guillem García Subies
Matt Maybeno
Joel Grus
Jade Abbott
David Pollack
Clement

November 2019

New model architectures: ALBERT, CamemBERT, GPT2-XL, DistilRoberta Four new models have been added s...

huggingface/pytorch-transformers: DistilBERT, GPT-2 Large, XLM multilingual models, bug fixes

Thomas Wolf
Lysandre Debut
Victor SANH
Denis
Matt
Grégory Châtel
Julien Chaumond
Tim Rault
Catalin Voss
Fei Wang
Malte Pietsch
Davide Fiocco
dhanajitb
Stefan Schweter
Ananya Harsh Jha
yzy5630
Yongbo Wang
Shijie Wu
Guillem García Subies
Weixin Wang
Zeyao Du
Chi-Liang, Liu
Nikolay Korolev
Joel Grus
Jade Abbott
David Pollack
matej-svejda
Clement
Ailing
Abhishek Rao

September 2019

New model architecture: DistilBERT Adding Huggingface's new transformer architecture, DistilBERT des...

huggingface/transformers: CTRL, DistilGPT-2, Pytorch TPU, tokenizer enhancements, guideline requirements

Thomas Wolf
Lysandre Debut
Victor SANH
Denis
erenup
Julien Chaumond
Matt
Grégory Châtel
Tim Rault
Catalin Voss
Fei Wang
Malte Pietsch
Davide Fiocco
Stefan Schweter
dhanajitb
Jinoo
Ananya Harsh Jha
yzy5630
Yongbo Wang
Shijie Wu
Guillem García Subies
Weixin Wang
Zeyao Du
Chi-Liang, Liu
Simon Layton
Nikolay Korolev
Joel Grus
Jade Abbott

October 2019

New model architectures: CTRL, DistilGPT-2 Two new models have been added since release 2.0. CTRL (...

huggingface/transformers: FlauBERT, MMBT, Dutch model, improved documentation, training from scratch, clean Python code

Thomas Wolf
Lysandre Debut
Victor SANH
Julien Chaumond
Aymeric Augustin
Rémi Louf
Funtowicz Morgan
Stefan Schweter
Denis
erenup
Matt
Piero Molino
Grégory Châtel
Patrick von Platen
Tim Rault
MOI Anthony
Catalin Voss
Bilal Khan
Bram Vanroy
Fei Wang
Julien Plu
Malte Pietsch
Louis Martin
Davide Fiocco
dhanajitb
Jinoo
Ananya Harsh Jha
Juha Kiili
Guillem García Subies
Clement

January 2020

FlauBERT, MMBT MMBT was added to the list of available models, as the first multi-modal model to ma...

huggingface/transformers: Marian

Thomas Wolf
Lysandre Debut
Julien Chaumond
Victor SANH
Patrick von Platen
Aymeric Augustin
Funtowicz Morgan
Rémi Louf
Sam Shleifer
Stefan Schweter
Manuel Romero
Denis
erenup
Matt
Piero Molino
Grégory Châtel
Bram Vanroy
Tim Rault
Gunnlaugur Thor Briem
Anthony MOI
Malte Pietsch
Catalin Voss
Bilal Khan
Fei Wang
Louis Martin
Davide Fiocco
Martin Malmsten
Lorenzo Ampil
HUSEIN ZOLKEPLI
Clement

May 2020

Marian (@sshleifer) A new model architecture, MarianMTModel with 1,008+ pretrained weights is avail...

huggingface/transformers: BART, organizations, community notebooks, lightning examples, dropping Python 3.5

Thomas Wolf
Lysandre Debut
Julien Chaumond
Victor SANH
Patrick von Platen
Aymeric Augustin
Rémi Louf
Funtowicz Morgan
Stefan Schweter
Denis
erenup
Sam Shleifer
Manuel Romero
Matt
Piero Molino
Grégory Châtel
Bram Vanroy
Tim Rault
Gunnlaugur Thor Briem
Anthony MOI
Malte Pietsch

March 2020

New Model: BART (added by @sshleifer) Bart is one of the first Seq2Seq models in the library, and ac...

huggingface/transformers: Trainer, TFTrainer, Multilingual BART, Encoder-decoder improvements, Generation Pipeline

Thomas Wolf
Lysandre Debut
Julien Chaumond
Victor SANH
Patrick von Platen
Aymeric Augustin
Rémi Louf
Funtowicz Morgan
Sam Shleifer
Stefan Schweter
Manuel Romero
Denis
erenup
Matt
Piero Molino
Grégory Châtel
Bram Vanroy
Tim Rault
Gunnlaugur Thor Briem
Anthony MOI
Malte Pietsch
Catalin Voss
Bilal Khan
Fei Wang
Louis Martin
Davide Fiocco
Martin Malmsten
Lorenzo Ampil
HUSEIN ZOLKEPLI
Clement

May 2020

Trainer & TFTrainer Version 2.9 introduces a new Trainer class for PyTorch, and its equivalent TFTra...

huggingface/transformers: Rust Tokenizers, DistilBERT base cased, Model cards

Thomas Wolf
Lysandre Debut
Julien Chaumond
Victor SANH
Aymeric Augustin
Rémi Louf
Funtowicz Morgan
Stefan Schweter
Denis
erenup
Matt
Piero Molino
Patrick von Platen
Grégory Châtel
Tim Rault
MOI Anthony
Bram Vanroy

February 2020

Rust tokenizers (@mfuntowicz, @n1t0 ) Tokenizers for Bert, Roberta, OpenAI GPT, OpenAI GPT2, Transf...

huggingface/transformers: Downstream NLP task API (feature extraction, text classification, NER, QA), Command-Line Interface and Serving – models: T5 – community-added models: Japanese & Finnish BERT, PPLM, XLM-R

Thomas Wolf
Lysandre Debut
Victor SANH
Julien Chaumond
Rémi Louf
Funtowicz Morgan
Stefan Schweter
Denis
erenup
Matt
Piero Molino
Grégory Châtel
Tim Rault
Catalin Voss
Fei Wang
Louis Martin
Malte Pietsch
Davide Fiocco
Bilal Khan
dhanajitb
Jinoo
Ananya Harsh Jha
Simon Layton
yzy5630
Yongbo Wang
Shijie Wu
Nikolay Korolev
Masatoshi Suzuki
Juha Kiili
Guillem García Subies

December 2019

New class Pipeline (beta): easily run and use models on down-stream NLP tasks We have added a new cl...

huggingface/transformers: Longformer

Thomas Wolf
Lysandre Debut
Julien Chaumond
Patrick von Platen
Victor SANH
Aymeric Augustin
Funtowicz Morgan
Rémi Louf
Sam Shleifer
Manuel Romero
Stefan Schweter
Denis
erenup
Matt
Grégory Châtel
Piero Molino
Bram Vanroy
Anthony MOI
Gunnlaugur Thor Briem
Tim Rault
Bilal Khan
Catalin Voss
Malte Pietsch
Lorenzo Ampil
Davide Fiocco
Louis Martin
Fei Wang
HUSEIN ZOLKEPLI
Suraj Patil
Martin Malmsten

June 2020

Longformer Longformer (@ibeltagy) Longformer for QA (@patil-suraj + @patrickvonplaten) Longformer f...

huggingface/transformers: v2.0.0 - TF 2.0/PyTorch interoperability, improved tokenizers, improved torchscript support

Thomas Wolf
Lysandre Debut
Victor SANH
Denis
erenup
Matt
Grégory Châtel
Julien Chaumond
Tim Rault
Catalin Voss
Fei Wang
Malte Pietsch
Davide Fiocco
dhanajitb
Stefan Schweter
Ananya Harsh Jha
yzy5630
Yongbo Wang
Shijie Wu
Guillem García Subies
Weixin Wang
Zeyao Du
Chi-Liang, Liu
Nikolay Korolev
Joel Grus
Jade Abbott
David Pollack
Clement
Ailing
Abhishek Rao

September 2019

Name change: welcome Transformers Following the extension to TensorFlow 2.0, pytorch-transformers =...

huggingface/transformers: T5 Model, BART summarization example and reduced memory, translation pipeline

Thomas Wolf
Lysandre Debut
Julien Chaumond
Victor SANH
Patrick von Platen
Aymeric Augustin
Rémi Louf
Funtowicz Morgan
Stefan Schweter
Denis
Sam Shleifer
erenup
Manuel Romero
Matt
Piero Molino
Grégory Châtel
Bram Vanroy
Tim Rault
Gunnlaugur Thor Briem
Anthony MOI
Malte Pietsch
Julien Plu
Catalin Voss
Bilal Khan
Fei Wang
Martin Malmsten
Louis Martin
Davide Fiocco
Clement
Ananya Harsh Jha

March 2020

T5 Model (@patrickvonplaten, @thomwolf ) T5 is a powerful encoder-decoder model that formats every N...

Transformers: State-of-the-Art Natural Language Processing

Wolf, Thomas
Debut, Lysandre
Sanh, Victor
Chaumond, Julien
Delangue, Clement
Moi, Anthony
Cistac, Perric
Ma, Clara
Jernite, Yacine
Plu, Julien
Xu, Canwen
Le Scao, Teven
Gugger, Sylvain
Drame, Mariama
Lhoest, Quentin
Rush, Alexander M.

October 2020

Perceiver The Perceiver model was released in the previous version: Perceiver Eight new models are r...

huggingface/transformers: ALBERT, CamemBERT, DistilRoberta, GPT-2 XL, and Encoder-Decoder architectures

Thomas Wolf
Lysandre Debut
Victor SANH
Julien Chaumond
Rémi Louf
Denis
erenup
Matt
Grégory Châtel
Stefan Schweter
Tim Rault
Catalin Voss
Fei Wang
Louis Martin
Malte Pietsch
Davide Fiocco
dhanajitb
Jinoo
Ananya Harsh Jha
Simon Layton
yzy5630
Yongbo Wang
Shijie Wu
Nikolay Korolev
Guillem García Subies
Matt Maybeno
Joel Grus
Jade Abbott
David Pollack
Clement

November 2019

New model architectures: ALBERT, CamemBERT, GPT2-XL, DistilRoberta Four new models have been added s...

huggingface/pytorch-transformers: DistilBERT, GPT-2 Large, XLM multilingual models, bug fixes

Thomas Wolf
Lysandre Debut
Victor SANH
Denis
Matt
Grégory Châtel
Julien Chaumond
Tim Rault
Catalin Voss
Fei Wang
Malte Pietsch
Davide Fiocco
dhanajitb
Stefan Schweter
Ananya Harsh Jha
yzy5630
Yongbo Wang
Shijie Wu
Guillem García Subies
Weixin Wang
Zeyao Du
Chi-Liang, Liu
Nikolay Korolev
Joel Grus
Jade Abbott
David Pollack
matej-svejda
Clement
Ailing
Abhishek Rao

September 2019

New model architecture: DistilBERT Adding Huggingface's new transformer architecture, DistilBERT des...

huggingface/transformers: CTRL, DistilGPT-2, Pytorch TPU, tokenizer enhancements, guideline requirements

Thomas Wolf
Lysandre Debut
Victor SANH
Denis
erenup
Julien Chaumond
Matt
Grégory Châtel
Tim Rault
Catalin Voss
Fei Wang
Malte Pietsch
Davide Fiocco
Stefan Schweter
dhanajitb
Jinoo
Ananya Harsh Jha
yzy5630
Yongbo Wang
Shijie Wu
Guillem García Subies
Weixin Wang
Zeyao Du
Chi-Liang, Liu
Simon Layton
Nikolay Korolev
Joel Grus
Jade Abbott

October 2019

New model architectures: CTRL, DistilGPT-2 Two new models have been added since release 2.0. CTRL (...

huggingface/transformers: FlauBERT, MMBT, Dutch model, improved documentation, training from scratch, clean Python code

Thomas Wolf
Lysandre Debut
Victor SANH
Julien Chaumond
Aymeric Augustin
Rémi Louf
Funtowicz Morgan
Stefan Schweter
Denis
erenup
Matt
Piero Molino
Grégory Châtel
Patrick von Platen
Tim Rault
MOI Anthony
Catalin Voss
Bilal Khan
Bram Vanroy
Fei Wang
Julien Plu
Malte Pietsch
Louis Martin
Davide Fiocco
dhanajitb
Jinoo
Ananya Harsh Jha
Juha Kiili
Guillem García Subies
Clement

January 2020

FlauBERT, MMBT MMBT was added to the list of available models, as the first multi-modal model to ma...

huggingface/transformers: Marian

Thomas Wolf
Lysandre Debut
Julien Chaumond
Victor SANH
Patrick von Platen
Aymeric Augustin
Funtowicz Morgan
Rémi Louf
Sam Shleifer
Stefan Schweter
Manuel Romero
Denis
erenup
Matt
Piero Molino
Grégory Châtel
Bram Vanroy
Tim Rault
Gunnlaugur Thor Briem
Anthony MOI
Malte Pietsch
Catalin Voss
Bilal Khan
Fei Wang
Louis Martin
Davide Fiocco
Martin Malmsten
Lorenzo Ampil
HUSEIN ZOLKEPLI
Clement

May 2020

Marian (@sshleifer) A new model architecture, MarianMTModel with 1,008+ pretrained weights is avail...

huggingface/transformers: BART, organizations, community notebooks, lightning examples, dropping Python 3.5

Thomas Wolf
Lysandre Debut
Julien Chaumond
Victor SANH
Patrick von Platen
Aymeric Augustin
Rémi Louf
Funtowicz Morgan
Stefan Schweter
Denis
erenup
Sam Shleifer
Manuel Romero
Matt
Piero Molino
Grégory Châtel
Bram Vanroy
Tim Rault
Gunnlaugur Thor Briem
Anthony MOI
Malte Pietsch

March 2020

New Model: BART (added by @sshleifer) Bart is one of the first Seq2Seq models in the library, and ac...

huggingface/transformers: Trainer, TFTrainer, Multilingual BART, Encoder-decoder improvements, Generation Pipeline

Thomas Wolf
Lysandre Debut
Julien Chaumond
Victor SANH
Patrick von Platen
Aymeric Augustin
Rémi Louf
Funtowicz Morgan
Sam Shleifer
Stefan Schweter
Manuel Romero
Denis
erenup
Matt
Piero Molino
Grégory Châtel
Bram Vanroy
Tim Rault
Gunnlaugur Thor Briem
Anthony MOI
Malte Pietsch
Catalin Voss
Bilal Khan
Fei Wang
Louis Martin
Davide Fiocco
Martin Malmsten
Lorenzo Ampil
HUSEIN ZOLKEPLI
Clement

May 2020

Trainer & TFTrainer Version 2.9 introduces a new Trainer class for PyTorch, and its equivalent TFTra...

huggingface/transformers: Rust Tokenizers, DistilBERT base cased, Model cards

Thomas Wolf
Lysandre Debut
Julien Chaumond
Victor SANH
Aymeric Augustin
Rémi Louf
Funtowicz Morgan
Stefan Schweter
Denis
erenup
Matt
Piero Molino
Patrick von Platen
Grégory Châtel
Tim Rault
MOI Anthony
Bram Vanroy

February 2020

Rust tokenizers (@mfuntowicz, @n1t0 ) Tokenizers for Bert, Roberta, OpenAI GPT, OpenAI GPT2, Transf...

Thomas Wolf
Lysandre Debut
Victor SANH
Julien Chaumond
Rémi Louf
Funtowicz Morgan
Stefan Schweter
Denis
erenup
Matt
Piero Molino
Grégory Châtel
Tim Rault
Catalin Voss
Fei Wang
Louis Martin
Malte Pietsch
Davide Fiocco
Bilal Khan
dhanajitb
Jinoo
Ananya Harsh Jha
Simon Layton
yzy5630
Yongbo Wang
Shijie Wu
Nikolay Korolev
Masatoshi Suzuki
Juha Kiili
Guillem García Subies

December 2019

New class Pipeline (beta): easily run and use models on down-stream NLP tasks We have added a new cl...

huggingface/transformers: Longformer

Thomas Wolf
Lysandre Debut
Julien Chaumond
Patrick von Platen
Victor SANH
Aymeric Augustin
Funtowicz Morgan
Rémi Louf
Sam Shleifer
Manuel Romero
Stefan Schweter
Denis
erenup
Matt
Grégory Châtel
Piero Molino
Bram Vanroy
Anthony MOI
Gunnlaugur Thor Briem
Tim Rault
Bilal Khan
Catalin Voss
Malte Pietsch
Lorenzo Ampil
Davide Fiocco
Louis Martin
Fei Wang
HUSEIN ZOLKEPLI
Suraj Patil
Martin Malmsten

June 2020

Longformer Longformer (@ibeltagy) Longformer for QA (@patil-suraj + @patrickvonplaten) Longformer f...

huggingface/transformers: v2.0.0 - TF 2.0/PyTorch interoperability, improved tokenizers, improved torchscript support

Thomas Wolf
Lysandre Debut
Victor SANH
Denis
erenup
Matt
Grégory Châtel
Julien Chaumond
Tim Rault
Catalin Voss
Fei Wang
Malte Pietsch
Davide Fiocco
dhanajitb
Stefan Schweter
Ananya Harsh Jha
yzy5630
Yongbo Wang
Shijie Wu
Guillem García Subies
Weixin Wang
Zeyao Du
Chi-Liang, Liu
Nikolay Korolev
Joel Grus
Jade Abbott
David Pollack
Clement
Ailing
Abhishek Rao

September 2019

Name change: welcome Transformers Following the extension to TensorFlow 2.0, pytorch-transformers =...

huggingface/transformers: T5 Model, BART summarization example and reduced memory, translation pipeline

Thomas Wolf
Lysandre Debut
Julien Chaumond
Victor SANH
Patrick von Platen
Aymeric Augustin
Rémi Louf
Funtowicz Morgan
Stefan Schweter
Denis
Sam Shleifer
erenup
Manuel Romero
Matt
Piero Molino
Grégory Châtel
Bram Vanroy
Tim Rault
Gunnlaugur Thor Briem
Anthony MOI
Malte Pietsch
Julien Plu
Catalin Voss
Bilal Khan
Fei Wang
Martin Malmsten
Louis Martin
Davide Fiocco
Clement
Ananya Harsh Jha

March 2020

T5 Model (@patrickvonplaten, @thomwolf ) T5 is a powerful encoder-decoder model that formats every N...

Transformers: State-of-the-Art Natural Language Processing

Wolf, Thomas
Debut, Lysandre
Sanh, Victor
Chaumond, Julien
Delangue, Clement
Moi, Anthony
Cistac, Perric
Ma, Clara
Jernite, Yacine
Plu, Julien
Xu, Canwen
Le Scao, Teven
Gugger, Sylvain
Drame, Mariama
Lhoest, Quentin
Rush, Alexander M.

October 2020

Perceiver The Perceiver model was released in the previous version: Perceiver Eight new models are r...

huggingface/transformers: ALBERT, CamemBERT, DistilRoberta, GPT-2 XL, and Encoder-Decoder architectures

Abstract

Extracted data

huggingface/transformers: ALBERT, CamemBERT, DistilRoberta, GPT-2 XL, and Encoder-Decoder architectures

Abstract

Extracted data

Related items

Related items