huggingface/pytorch-transformers: DistilBERT, GPT-2 Large, XLM multilingual models, bug fixes

Thomas Wolf
Lysandre Debut
Victor SANH
Denis
Matt
Grégory Châtel
Julien Chaumond
Tim Rault
Catalin Voss
Fei Wang
Malte Pietsch
Davide Fiocco
dhanajitb
Stefan Schweter
Ananya Harsh Jha
yzy5630
Yongbo Wang
Shijie Wu
Guillem García Subies
Weixin Wang
Zeyao Du
Chi-Liang, Liu
Nikolay Korolev
Joel Grus
Jade Abbott
David Pollack
matej-svejda
Clement
Ailing
Abhishek Rao

Publication date

September 2019

DOI

Abstract

New model architecture: DistilBERT Adding Huggingface's new transformer architecture, DistilBERT described in Smaller, faster, cheaper, lighter: Introducing DistilBERT, a distilled version of BERT by Victor Sanh, Lysandre Debut and Thomas Wolf. This new model architecture comes with two pretrained checkpoints: distilbert-base-uncased: the base DistilBert model distilbert-base-uncased-distilled-squad: DistilBert model fine-tuned with distillation on SQuAD. An awaited new pretrained checkpoint: GPT-2 large (774M parameters) The third OpenAI GPT-2 checkpoint (GPT-2 large) is available in the library under the shortcut name gpt2-large: 774M parameters, 36 layers, and 20 heads. New XLM multilingual pretrained checkpoints in 17 and 100 language...

Extracted data

We use cookies to provide a better user experience.

Data Protection

huggingface/pytorch-transformers: DistilBERT, GPT-2 Large, XLM multilingual models, bug fixes

Thomas Wolf
Lysandre Debut
Victor SANH
Denis
Matt
Grégory Châtel
Julien Chaumond
Tim Rault
Catalin Voss
Fei Wang
Malte Pietsch
Davide Fiocco
dhanajitb
Stefan Schweter
Ananya Harsh Jha
yzy5630
Yongbo Wang
Shijie Wu
Guillem García Subies
Weixin Wang
Zeyao Du
Chi-Liang, Liu
Nikolay Korolev
Joel Grus
Jade Abbott
David Pollack
matej-svejda
Clement
Ailing
Abhishek Rao

Open link

Publication date

September 2019

DOI

10.5281/zenodo.3385998

Abstract

Extracted data

Thomas Wolf
Lysandre Debut
Victor SANH
Denis
erenup
Julien Chaumond
Matt
Grégory Châtel
Tim Rault
Catalin Voss
Fei Wang
Malte Pietsch
Davide Fiocco
Stefan Schweter
dhanajitb
Jinoo
Ananya Harsh Jha
yzy5630
Yongbo Wang
Shijie Wu
Guillem García Subies
Weixin Wang
Zeyao Du
Chi-Liang, Liu
Simon Layton
Nikolay Korolev
Joel Grus
Jade Abbott

October 2019

New model architectures: CTRL, DistilGPT-2 Two new models have been added since release 2.0. CTRL (...

huggingface/transformers: ALBERT, CamemBERT, DistilRoberta, GPT-2 XL, and Encoder-Decoder architectures

Thomas Wolf
Lysandre Debut
Victor SANH
Julien Chaumond
Rémi Louf
Denis
erenup
Matt
Grégory Châtel
Stefan Schweter
Tim Rault
Catalin Voss
Fei Wang
Louis Martin
Malte Pietsch
Davide Fiocco
dhanajitb
Jinoo
Ananya Harsh Jha
Simon Layton
yzy5630
Yongbo Wang
Shijie Wu
Nikolay Korolev
Guillem García Subies
Matt Maybeno
Joel Grus
Jade Abbott
David Pollack
Clement

November 2019

New model architectures: ALBERT, CamemBERT, GPT2-XL, DistilRoberta Four new models have been added s...

huggingface/transformers: Rust Tokenizers, DistilBERT base cased, Model cards

Thomas Wolf
Lysandre Debut
Julien Chaumond
Victor SANH
Aymeric Augustin
Rémi Louf
Funtowicz Morgan
Stefan Schweter
Denis
erenup
Matt
Piero Molino
Patrick von Platen
Grégory Châtel
Tim Rault
MOI Anthony
Bram Vanroy

February 2020

Rust tokenizers (@mfuntowicz, @n1t0 ) Tokenizers for Bert, Roberta, OpenAI GPT, OpenAI GPT2, Transf...

huggingface/transformers: FlauBERT, MMBT, Dutch model, improved documentation, training from scratch, clean Python code

Thomas Wolf
Lysandre Debut
Victor SANH
Julien Chaumond
Aymeric Augustin
Rémi Louf
Funtowicz Morgan
Stefan Schweter
Denis
erenup
Matt
Piero Molino
Grégory Châtel
Patrick von Platen
Tim Rault
MOI Anthony
Catalin Voss
Bilal Khan
Bram Vanroy
Fei Wang
Julien Plu
Malte Pietsch
Louis Martin
Davide Fiocco
dhanajitb
Jinoo
Ananya Harsh Jha
Juha Kiili
Guillem García Subies
Clement

January 2020

FlauBERT, MMBT MMBT was added to the list of available models, as the first multi-modal model to ma...

huggingface/transformers: BART, organizations, community notebooks, lightning examples, dropping Python 3.5

Thomas Wolf
Lysandre Debut
Julien Chaumond
Victor SANH
Patrick von Platen
Aymeric Augustin
Rémi Louf
Funtowicz Morgan
Stefan Schweter
Denis
erenup
Sam Shleifer
Manuel Romero
Matt
Piero Molino
Grégory Châtel
Bram Vanroy
Tim Rault
Gunnlaugur Thor Briem
Anthony MOI
Malte Pietsch

March 2020

New Model: BART (added by @sshleifer) Bart is one of the first Seq2Seq models in the library, and ac...

huggingface/transformers: Trainer, TFTrainer, Multilingual BART, Encoder-decoder improvements, Generation Pipeline

Thomas Wolf
Lysandre Debut
Julien Chaumond
Victor SANH
Patrick von Platen
Aymeric Augustin
Rémi Louf
Funtowicz Morgan
Sam Shleifer
Stefan Schweter
Manuel Romero
Denis
erenup
Matt
Piero Molino
Grégory Châtel
Bram Vanroy
Tim Rault
Gunnlaugur Thor Briem
Anthony MOI
Malte Pietsch
Catalin Voss
Bilal Khan
Fei Wang
Louis Martin
Davide Fiocco
Martin Malmsten
Lorenzo Ampil
HUSEIN ZOLKEPLI
Clement

May 2020

Trainer & TFTrainer Version 2.9 introduces a new Trainer class for PyTorch, and its equivalent TFTra...

huggingface/transformers: Downstream NLP task API (feature extraction, text classification, NER, QA), Command-Line Interface and Serving – models: T5 – community-added models: Japanese & Finnish BERT, PPLM, XLM-R

Thomas Wolf
Lysandre Debut
Victor SANH
Julien Chaumond
Rémi Louf
Funtowicz Morgan
Stefan Schweter
Denis
erenup
Matt
Piero Molino
Grégory Châtel
Tim Rault
Catalin Voss
Fei Wang
Louis Martin
Malte Pietsch
Davide Fiocco
Bilal Khan
dhanajitb
Jinoo
Ananya Harsh Jha
Simon Layton
yzy5630
Yongbo Wang
Shijie Wu
Nikolay Korolev
Masatoshi Suzuki
Juha Kiili
Guillem García Subies

December 2019

New class Pipeline (beta): easily run and use models on down-stream NLP tasks We have added a new cl...

huggingface/transformers: Marian

Thomas Wolf
Lysandre Debut
Julien Chaumond
Victor SANH
Patrick von Platen
Aymeric Augustin
Funtowicz Morgan
Rémi Louf
Sam Shleifer
Stefan Schweter
Manuel Romero
Denis
erenup
Matt
Piero Molino
Grégory Châtel
Bram Vanroy
Tim Rault
Gunnlaugur Thor Briem
Anthony MOI
Malte Pietsch
Catalin Voss
Bilal Khan
Fei Wang
Louis Martin
Davide Fiocco
Martin Malmsten
Lorenzo Ampil
HUSEIN ZOLKEPLI
Clement

May 2020

Marian (@sshleifer) A new model architecture, MarianMTModel with 1,008+ pretrained weights is avail...

huggingface/transformers: Longformer

Thomas Wolf
Lysandre Debut
Julien Chaumond
Patrick von Platen
Victor SANH
Aymeric Augustin
Funtowicz Morgan
Rémi Louf
Sam Shleifer
Manuel Romero
Stefan Schweter
Denis
erenup
Matt
Grégory Châtel
Piero Molino
Bram Vanroy
Anthony MOI
Gunnlaugur Thor Briem
Tim Rault
Bilal Khan
Catalin Voss
Malte Pietsch
Lorenzo Ampil
Davide Fiocco
Louis Martin
Fei Wang
HUSEIN ZOLKEPLI
Suraj Patil
Martin Malmsten

June 2020

Longformer Longformer (@ibeltagy) Longformer for QA (@patil-suraj + @patrickvonplaten) Longformer f...

huggingface/transformers: T5 Model, BART summarization example and reduced memory, translation pipeline

Thomas Wolf
Lysandre Debut
Julien Chaumond
Victor SANH
Patrick von Platen
Aymeric Augustin
Rémi Louf
Funtowicz Morgan
Stefan Schweter
Denis
Sam Shleifer
erenup
Manuel Romero
Matt
Piero Molino
Grégory Châtel
Bram Vanroy
Tim Rault
Gunnlaugur Thor Briem
Anthony MOI
Malte Pietsch
Julien Plu
Catalin Voss
Bilal Khan
Fei Wang
Martin Malmsten
Louis Martin
Davide Fiocco
Clement
Ananya Harsh Jha

March 2020

T5 Model (@patrickvonplaten, @thomwolf ) T5 is a powerful encoder-decoder model that formats every N...

huggingface/transformers: Patch v3.0.1: Better backward compatibility for tokenizers

Thomas Wolf
Lysandre Debut
Julien Chaumond
Patrick von Platen
Victor SANH
Sam Shleifer
Funtowicz Morgan
Aymeric Augustin
Rémi Louf
Manuel Romero
Sylvain Gugger
Stefan Schweter
Denis
erenup
Matt
Grégory Châtel
Piero Molino
Bram Vanroy
Anthony MOI
Suraj Patil
Gunnlaugur Thor Briem
Tim Rault
Bilal Khan
Catalin Voss
Malte Pietsch
Julien Plu
Lorenzo Ampil
Davide Fiocco
Louis Martin
Fei Wang

July 2020

Better backward-compatibility for tokenizers following v3.0.0 refactoring Version v3.0.0, included a...

huggingface/transformers: v2.0.0 - TF 2.0/PyTorch interoperability, improved tokenizers, improved torchscript support

Thomas Wolf
Lysandre Debut
Victor SANH
Denis
erenup
Matt
Grégory Châtel
Julien Chaumond
Tim Rault
Catalin Voss
Fei Wang
Malte Pietsch
Davide Fiocco
dhanajitb
Stefan Schweter
Ananya Harsh Jha
yzy5630
Yongbo Wang
Shijie Wu
Guillem García Subies
Weixin Wang
Zeyao Du
Chi-Liang, Liu
Nikolay Korolev
Joel Grus
Jade Abbott
David Pollack
Clement
Ailing
Abhishek Rao

September 2019

Name change: welcome Transformers Following the extension to TensorFlow 2.0, pytorch-transformers =...

huggingface/transformers: CTRL, DistilGPT-2, Pytorch TPU, tokenizer enhancements, guideline requirements

Thomas Wolf
Lysandre Debut
Victor SANH
Denis
erenup
Julien Chaumond
Matt
Grégory Châtel
Tim Rault
Catalin Voss
Fei Wang
Malte Pietsch
Davide Fiocco
Stefan Schweter
dhanajitb
Jinoo
Ananya Harsh Jha
yzy5630
Yongbo Wang
Shijie Wu
Guillem García Subies
Weixin Wang
Zeyao Du
Chi-Liang, Liu
Simon Layton
Nikolay Korolev
Joel Grus
Jade Abbott

October 2019

New model architectures: CTRL, DistilGPT-2 Two new models have been added since release 2.0. CTRL (...

huggingface/transformers: ALBERT, CamemBERT, DistilRoberta, GPT-2 XL, and Encoder-Decoder architectures

Thomas Wolf
Lysandre Debut
Victor SANH
Julien Chaumond
Rémi Louf
Denis
erenup
Matt
Grégory Châtel
Stefan Schweter
Tim Rault
Catalin Voss
Fei Wang
Louis Martin
Malte Pietsch
Davide Fiocco
dhanajitb
Jinoo
Ananya Harsh Jha
Simon Layton
yzy5630
Yongbo Wang
Shijie Wu
Nikolay Korolev
Guillem García Subies
Matt Maybeno
Joel Grus
Jade Abbott
David Pollack
Clement

November 2019

New model architectures: ALBERT, CamemBERT, GPT2-XL, DistilRoberta Four new models have been added s...

huggingface/transformers: Rust Tokenizers, DistilBERT base cased, Model cards

Thomas Wolf
Lysandre Debut
Julien Chaumond
Victor SANH
Aymeric Augustin
Rémi Louf
Funtowicz Morgan
Stefan Schweter
Denis
erenup
Matt
Piero Molino
Patrick von Platen
Grégory Châtel
Tim Rault
MOI Anthony
Bram Vanroy

February 2020

Rust tokenizers (@mfuntowicz, @n1t0 ) Tokenizers for Bert, Roberta, OpenAI GPT, OpenAI GPT2, Transf...

huggingface/transformers: FlauBERT, MMBT, Dutch model, improved documentation, training from scratch, clean Python code

Thomas Wolf
Lysandre Debut
Victor SANH
Julien Chaumond
Aymeric Augustin
Rémi Louf
Funtowicz Morgan
Stefan Schweter
Denis
erenup
Matt
Piero Molino
Grégory Châtel
Patrick von Platen
Tim Rault
MOI Anthony
Catalin Voss
Bilal Khan
Bram Vanroy
Fei Wang
Julien Plu
Malte Pietsch
Louis Martin
Davide Fiocco
dhanajitb
Jinoo
Ananya Harsh Jha
Juha Kiili
Guillem García Subies
Clement

January 2020

FlauBERT, MMBT MMBT was added to the list of available models, as the first multi-modal model to ma...

huggingface/transformers: BART, organizations, community notebooks, lightning examples, dropping Python 3.5

Thomas Wolf
Lysandre Debut
Julien Chaumond
Victor SANH
Patrick von Platen
Aymeric Augustin
Rémi Louf
Funtowicz Morgan
Stefan Schweter
Denis
erenup
Sam Shleifer
Manuel Romero
Matt
Piero Molino
Grégory Châtel
Bram Vanroy
Tim Rault
Gunnlaugur Thor Briem
Anthony MOI
Malte Pietsch

March 2020

New Model: BART (added by @sshleifer) Bart is one of the first Seq2Seq models in the library, and ac...

huggingface/transformers: Trainer, TFTrainer, Multilingual BART, Encoder-decoder improvements, Generation Pipeline

Thomas Wolf
Lysandre Debut
Julien Chaumond
Victor SANH
Patrick von Platen
Aymeric Augustin
Rémi Louf
Funtowicz Morgan
Sam Shleifer
Stefan Schweter
Manuel Romero
Denis
erenup
Matt
Piero Molino
Grégory Châtel
Bram Vanroy
Tim Rault
Gunnlaugur Thor Briem
Anthony MOI
Malte Pietsch
Catalin Voss
Bilal Khan
Fei Wang
Louis Martin
Davide Fiocco
Martin Malmsten
Lorenzo Ampil
HUSEIN ZOLKEPLI
Clement

May 2020

Trainer & TFTrainer Version 2.9 introduces a new Trainer class for PyTorch, and its equivalent TFTra...

Thomas Wolf
Lysandre Debut
Victor SANH
Julien Chaumond
Rémi Louf
Funtowicz Morgan
Stefan Schweter
Denis
erenup
Matt
Piero Molino
Grégory Châtel
Tim Rault
Catalin Voss
Fei Wang
Louis Martin
Malte Pietsch
Davide Fiocco
Bilal Khan
dhanajitb
Jinoo
Ananya Harsh Jha
Simon Layton
yzy5630
Yongbo Wang
Shijie Wu
Nikolay Korolev
Masatoshi Suzuki
Juha Kiili
Guillem García Subies

December 2019

New class Pipeline (beta): easily run and use models on down-stream NLP tasks We have added a new cl...

huggingface/transformers: Marian

Thomas Wolf
Lysandre Debut
Julien Chaumond
Victor SANH
Patrick von Platen
Aymeric Augustin
Funtowicz Morgan
Rémi Louf
Sam Shleifer
Stefan Schweter
Manuel Romero
Denis
erenup
Matt
Piero Molino
Grégory Châtel
Bram Vanroy
Tim Rault
Gunnlaugur Thor Briem
Anthony MOI
Malte Pietsch
Catalin Voss
Bilal Khan
Fei Wang
Louis Martin
Davide Fiocco
Martin Malmsten
Lorenzo Ampil
HUSEIN ZOLKEPLI
Clement

May 2020

Marian (@sshleifer) A new model architecture, MarianMTModel with 1,008+ pretrained weights is avail...

huggingface/transformers: Longformer

Thomas Wolf
Lysandre Debut
Julien Chaumond
Patrick von Platen
Victor SANH
Aymeric Augustin
Funtowicz Morgan
Rémi Louf
Sam Shleifer
Manuel Romero
Stefan Schweter
Denis
erenup
Matt
Grégory Châtel
Piero Molino
Bram Vanroy
Anthony MOI
Gunnlaugur Thor Briem
Tim Rault
Bilal Khan
Catalin Voss
Malte Pietsch
Lorenzo Ampil
Davide Fiocco
Louis Martin
Fei Wang
HUSEIN ZOLKEPLI
Suraj Patil
Martin Malmsten

June 2020

Longformer Longformer (@ibeltagy) Longformer for QA (@patil-suraj + @patrickvonplaten) Longformer f...

huggingface/transformers: T5 Model, BART summarization example and reduced memory, translation pipeline

Thomas Wolf
Lysandre Debut
Julien Chaumond
Victor SANH
Patrick von Platen
Aymeric Augustin
Rémi Louf
Funtowicz Morgan
Stefan Schweter
Denis
Sam Shleifer
erenup
Manuel Romero
Matt
Piero Molino
Grégory Châtel
Bram Vanroy
Tim Rault
Gunnlaugur Thor Briem
Anthony MOI
Malte Pietsch
Julien Plu
Catalin Voss
Bilal Khan
Fei Wang
Martin Malmsten
Louis Martin
Davide Fiocco
Clement
Ananya Harsh Jha

March 2020

T5 Model (@patrickvonplaten, @thomwolf ) T5 is a powerful encoder-decoder model that formats every N...

huggingface/transformers: Patch v3.0.1: Better backward compatibility for tokenizers

Thomas Wolf
Lysandre Debut
Julien Chaumond
Patrick von Platen
Victor SANH
Sam Shleifer
Funtowicz Morgan
Aymeric Augustin
Rémi Louf
Manuel Romero
Sylvain Gugger
Stefan Schweter
Denis
erenup
Matt
Grégory Châtel
Piero Molino
Bram Vanroy
Anthony MOI
Suraj Patil
Gunnlaugur Thor Briem
Tim Rault
Bilal Khan
Catalin Voss
Malte Pietsch
Julien Plu
Lorenzo Ampil
Davide Fiocco
Louis Martin
Fei Wang

July 2020

Better backward-compatibility for tokenizers following v3.0.0 refactoring Version v3.0.0, included a...

huggingface/transformers: v2.0.0 - TF 2.0/PyTorch interoperability, improved tokenizers, improved torchscript support

Thomas Wolf
Lysandre Debut
Victor SANH
Denis
erenup
Matt
Grégory Châtel
Julien Chaumond
Tim Rault
Catalin Voss
Fei Wang
Malte Pietsch
Davide Fiocco
dhanajitb
Stefan Schweter
Ananya Harsh Jha
yzy5630
Yongbo Wang
Shijie Wu
Guillem García Subies
Weixin Wang
Zeyao Du
Chi-Liang, Liu
Nikolay Korolev
Joel Grus
Jade Abbott
David Pollack
Clement
Ailing
Abhishek Rao

September 2019

Name change: welcome Transformers Following the extension to TensorFlow 2.0, pytorch-transformers =...

huggingface/pytorch-transformers: DistilBERT, GPT-2 Large, XLM multilingual models, bug fixes

Abstract

Extracted data

huggingface/pytorch-transformers: DistilBERT, GPT-2 Large, XLM multilingual models, bug fixes

Abstract

Extracted data

Related items

Related items