huggingface/transformers: Downstream NLP task API (feature extraction, text classification, NER, QA), Command-Line Interface and Serving – models: T5 – community-added models: Japanese & Finnish BERT, PPLM, XLM-R

Asynchronous pipelines for processing huge corpora on medium to low resource infrastructures

Ortiz Suárez, Pedro Javier
Sagot, Benoît
Romary, Laurent

July 2019

Common Crawl is a considerably large, heterogeneous multilingual corpus comprised of crawled documen...

Transformers: State-of-the-Art Natural Language Processing

Wolf, Thomas
Debut, Lysandre
Sanh, Victor
Chaumond, Julien
Delangue, Clement
Moi, Anthony
Cistac, Perric
Ma, Clara
Jernite, Yacine
Plu, Julien
Xu, Canwen
Le Scao, Teven
Gugger, Sylvain
Drame, Mariama
Lhoest, Quentin
Rush, Alexander M.

October 2020

Perceiver The Perceiver model was released in the previous version: Perceiver Eight new models are r...

huggingface/transformers: Longformer

Thomas Wolf
Lysandre Debut
Julien Chaumond
Patrick von Platen
Victor SANH
Aymeric Augustin
Funtowicz Morgan
Rémi Louf
Sam Shleifer
Manuel Romero
Stefan Schweter
Denis
erenup
Matt
Grégory Châtel
Piero Molino
Bram Vanroy
Anthony MOI
Gunnlaugur Thor Briem
Tim Rault
Bilal Khan
Catalin Voss
Malte Pietsch
Lorenzo Ampil
Davide Fiocco
Louis Martin
Fei Wang
HUSEIN ZOLKEPLI
Suraj Patil
Martin Malmsten

June 2020

Longformer Longformer (@ibeltagy) Longformer for QA (@patil-suraj + @patrickvonplaten) Longformer f...

huggingface/transformers: BART, organizations, community notebooks, lightning examples, dropping Python 3.5

Thomas Wolf
Lysandre Debut
Julien Chaumond
Victor SANH
Patrick von Platen
Aymeric Augustin
Rémi Louf
Funtowicz Morgan
Stefan Schweter
Denis
erenup
Sam Shleifer
Manuel Romero
Matt
Piero Molino
Grégory Châtel
Bram Vanroy
Tim Rault
Gunnlaugur Thor Briem
Anthony MOI
Malte Pietsch

March 2020

New Model: BART (added by @sshleifer) Bart is one of the first Seq2Seq models in the library, and ac...

huggingface/transformers: T5 Model, BART summarization example and reduced memory, translation pipeline

Thomas Wolf
Lysandre Debut
Julien Chaumond
Victor SANH
Patrick von Platen
Aymeric Augustin
Rémi Louf
Funtowicz Morgan
Stefan Schweter
Denis
Sam Shleifer
erenup
Manuel Romero
Matt
Piero Molino
Grégory Châtel
Bram Vanroy
Tim Rault
Gunnlaugur Thor Briem
Anthony MOI
Malte Pietsch
Julien Plu
Catalin Voss
Bilal Khan
Fei Wang
Martin Malmsten
Louis Martin
Davide Fiocco
Clement
Ananya Harsh Jha

March 2020

T5 Model (@patrickvonplaten, @thomwolf ) T5 is a powerful encoder-decoder model that formats every N...

huggingface/transformers: ALBERT, CamemBERT, DistilRoberta, GPT-2 XL, and Encoder-Decoder architectures

Thomas Wolf
Lysandre Debut
Victor SANH
Julien Chaumond
Rémi Louf
Denis
erenup
Matt
Grégory Châtel
Stefan Schweter
Tim Rault
Catalin Voss
Fei Wang
Louis Martin
Malte Pietsch
Davide Fiocco
dhanajitb
Jinoo
Ananya Harsh Jha
Simon Layton
yzy5630
Yongbo Wang
Shijie Wu
Nikolay Korolev
Guillem García Subies
Matt Maybeno
Joel Grus
Jade Abbott
David Pollack
Clement

November 2019

New model architectures: ALBERT, CamemBERT, GPT2-XL, DistilRoberta Four new models have been added s...

huggingface/pytorch-transformers: DistilBERT, GPT-2 Large, XLM multilingual models, bug fixes

Thomas Wolf
Lysandre Debut
Victor SANH
Denis
Matt
Grégory Châtel
Julien Chaumond
Tim Rault
Catalin Voss
Fei Wang
Malte Pietsch
Davide Fiocco
dhanajitb
Stefan Schweter
Ananya Harsh Jha
yzy5630
Yongbo Wang
Shijie Wu
Guillem García Subies
Weixin Wang
Zeyao Du
Chi-Liang, Liu
Nikolay Korolev
Joel Grus
Jade Abbott
David Pollack
matej-svejda
Clement
Ailing
Abhishek Rao

September 2019

New model architecture: DistilBERT Adding Huggingface's new transformer architecture, DistilBERT des...

huggingface/transformers: FlauBERT, MMBT, Dutch model, improved documentation, training from scratch, clean Python code

Thomas Wolf
Lysandre Debut
Victor SANH
Julien Chaumond
Aymeric Augustin
Rémi Louf
Funtowicz Morgan
Stefan Schweter
Denis
erenup
Matt
Piero Molino
Grégory Châtel
Patrick von Platen
Tim Rault
MOI Anthony
Catalin Voss
Bilal Khan
Bram Vanroy
Fei Wang
Julien Plu
Malte Pietsch
Louis Martin
Davide Fiocco
dhanajitb
Jinoo
Ananya Harsh Jha
Juha Kiili
Guillem García Subies
Clement

January 2020

FlauBERT, MMBT MMBT was added to the list of available models, as the first multi-modal model to ma...

AdapterHub: A Framework for Adapting Transformers

Pfeiffer, Jonas
Ruckle, Andreas
Poth, Clifton
Kamath, Aishwarya
Vulic, Ivan
Ruder, Sebastian
Cho, Kyunghyun
Gurevych, Iryna

October 2020

The current modus operandi in NLP involves downloading and fine-tuning pre-trained models consisting...

Overview of the Transformer-based Models for NLP Tasks

Gillioz, Anthony
Casas, Jacky
Mugellini, Elena
Abou Khaled, Omar

January 2021

In 2017, Vaswani et al. proposed a new neural network architecture named Transformer. That modern ar...

huggingface/transformers: CTRL, DistilGPT-2, Pytorch TPU, tokenizer enhancements, guideline requirements

Thomas Wolf
Lysandre Debut
Victor SANH
Denis
erenup
Julien Chaumond
Matt
Grégory Châtel
Tim Rault
Catalin Voss
Fei Wang
Malte Pietsch
Davide Fiocco
Stefan Schweter
dhanajitb
Jinoo
Ananya Harsh Jha
yzy5630
Yongbo Wang
Shijie Wu
Guillem García Subies
Weixin Wang
Zeyao Du
Chi-Liang, Liu
Simon Layton
Nikolay Korolev
Joel Grus
Jade Abbott

October 2019

New model architectures: CTRL, DistilGPT-2 Two new models have been added since release 2.0. CTRL (...

huggingface/transformers: Trainer, TFTrainer, Multilingual BART, Encoder-decoder improvements, Generation Pipeline

Thomas Wolf
Lysandre Debut
Julien Chaumond
Victor SANH
Patrick von Platen
Aymeric Augustin
Rémi Louf
Funtowicz Morgan
Sam Shleifer
Stefan Schweter
Manuel Romero
Denis
erenup
Matt
Piero Molino
Grégory Châtel
Bram Vanroy
Tim Rault
Gunnlaugur Thor Briem
Anthony MOI
Malte Pietsch
Catalin Voss
Bilal Khan
Fei Wang
Louis Martin
Davide Fiocco
Martin Malmsten
Lorenzo Ampil
HUSEIN ZOLKEPLI
Clement

May 2020

Trainer & TFTrainer Version 2.9 introduces a new Trainer class for PyTorch, and its equivalent TFTra...

Large Scale Fine-Tuned Transformers Models Application for Business Names Generation

Lukauskas, Mantas
Rasymas, Tomas
Minelga, Matas
Vaitmonas, Domas

August 2023

Natural language processing (NLP) involves the computer analysis and processing of human languages u...

A Comprehensive Exploration of Pre-training Language Models

Guo, Tong

October 2021

Recently, the development of pre-trained language models has brought natural language processing (NL...

huggingface/transformers: Rust Tokenizers, DistilBERT base cased, Model cards

Thomas Wolf
Lysandre Debut
Julien Chaumond
Victor SANH
Aymeric Augustin
Rémi Louf
Funtowicz Morgan
Stefan Schweter
Denis
erenup
Matt
Piero Molino
Patrick von Platen
Grégory Châtel
Tim Rault
MOI Anthony
Bram Vanroy

February 2020

Rust tokenizers (@mfuntowicz, @n1t0 ) Tokenizers for Bert, Roberta, OpenAI GPT, OpenAI GPT2, Transf...

Asynchronous pipelines for processing huge corpora on medium to low resource infrastructures

Ortiz Suárez, Pedro Javier
Sagot, Benoît
Romary, Laurent

July 2019

Common Crawl is a considerably large, heterogeneous multilingual corpus comprised of crawled documen...

Transformers: State-of-the-Art Natural Language Processing

Wolf, Thomas
Debut, Lysandre
Sanh, Victor
Chaumond, Julien
Delangue, Clement
Moi, Anthony
Cistac, Perric
Ma, Clara
Jernite, Yacine
Plu, Julien
Xu, Canwen
Le Scao, Teven
Gugger, Sylvain
Drame, Mariama
Lhoest, Quentin
Rush, Alexander M.

October 2020

Perceiver The Perceiver model was released in the previous version: Perceiver Eight new models are r...

huggingface/transformers: Longformer

Thomas Wolf
Lysandre Debut
Julien Chaumond
Patrick von Platen
Victor SANH
Aymeric Augustin
Funtowicz Morgan
Rémi Louf
Sam Shleifer
Manuel Romero
Stefan Schweter
Denis
erenup
Matt
Grégory Châtel
Piero Molino
Bram Vanroy
Anthony MOI
Gunnlaugur Thor Briem
Tim Rault
Bilal Khan
Catalin Voss
Malte Pietsch
Lorenzo Ampil
Davide Fiocco
Louis Martin
Fei Wang
HUSEIN ZOLKEPLI
Suraj Patil
Martin Malmsten

June 2020

Longformer Longformer (@ibeltagy) Longformer for QA (@patil-suraj + @patrickvonplaten) Longformer f...

huggingface/transformers: BART, organizations, community notebooks, lightning examples, dropping Python 3.5

Thomas Wolf
Lysandre Debut
Julien Chaumond
Victor SANH
Patrick von Platen
Aymeric Augustin
Rémi Louf
Funtowicz Morgan
Stefan Schweter
Denis
erenup
Sam Shleifer
Manuel Romero
Matt
Piero Molino
Grégory Châtel
Bram Vanroy
Tim Rault
Gunnlaugur Thor Briem
Anthony MOI
Malte Pietsch

March 2020

New Model: BART (added by @sshleifer) Bart is one of the first Seq2Seq models in the library, and ac...

huggingface/transformers: T5 Model, BART summarization example and reduced memory, translation pipeline

Thomas Wolf
Lysandre Debut
Julien Chaumond
Victor SANH
Patrick von Platen
Aymeric Augustin
Rémi Louf
Funtowicz Morgan
Stefan Schweter
Denis
Sam Shleifer
erenup
Manuel Romero
Matt
Piero Molino
Grégory Châtel
Bram Vanroy
Tim Rault
Gunnlaugur Thor Briem
Anthony MOI
Malte Pietsch
Julien Plu
Catalin Voss
Bilal Khan
Fei Wang
Martin Malmsten
Louis Martin
Davide Fiocco
Clement
Ananya Harsh Jha

March 2020

T5 Model (@patrickvonplaten, @thomwolf ) T5 is a powerful encoder-decoder model that formats every N...

huggingface/transformers: ALBERT, CamemBERT, DistilRoberta, GPT-2 XL, and Encoder-Decoder architectures

Thomas Wolf
Lysandre Debut
Victor SANH
Julien Chaumond
Rémi Louf
Denis
erenup
Matt
Grégory Châtel
Stefan Schweter
Tim Rault
Catalin Voss
Fei Wang
Louis Martin
Malte Pietsch
Davide Fiocco
dhanajitb
Jinoo
Ananya Harsh Jha
Simon Layton
yzy5630
Yongbo Wang
Shijie Wu
Nikolay Korolev
Guillem García Subies
Matt Maybeno
Joel Grus
Jade Abbott
David Pollack
Clement

November 2019

New model architectures: ALBERT, CamemBERT, GPT2-XL, DistilRoberta Four new models have been added s...

huggingface/pytorch-transformers: DistilBERT, GPT-2 Large, XLM multilingual models, bug fixes

Thomas Wolf
Lysandre Debut
Victor SANH
Denis
Matt
Grégory Châtel
Julien Chaumond
Tim Rault
Catalin Voss
Fei Wang
Malte Pietsch
Davide Fiocco
dhanajitb
Stefan Schweter
Ananya Harsh Jha
yzy5630
Yongbo Wang
Shijie Wu
Guillem García Subies
Weixin Wang
Zeyao Du
Chi-Liang, Liu
Nikolay Korolev
Joel Grus
Jade Abbott
David Pollack
matej-svejda
Clement
Ailing
Abhishek Rao

September 2019

New model architecture: DistilBERT Adding Huggingface's new transformer architecture, DistilBERT des...

huggingface/transformers: FlauBERT, MMBT, Dutch model, improved documentation, training from scratch, clean Python code

Thomas Wolf
Lysandre Debut
Victor SANH
Julien Chaumond
Aymeric Augustin
Rémi Louf
Funtowicz Morgan
Stefan Schweter
Denis
erenup
Matt
Piero Molino
Grégory Châtel
Patrick von Platen
Tim Rault
MOI Anthony
Catalin Voss
Bilal Khan
Bram Vanroy
Fei Wang
Julien Plu
Malte Pietsch
Louis Martin
Davide Fiocco
dhanajitb
Jinoo
Ananya Harsh Jha
Juha Kiili
Guillem García Subies
Clement

January 2020

FlauBERT, MMBT MMBT was added to the list of available models, as the first multi-modal model to ma...

AdapterHub: A Framework for Adapting Transformers

Pfeiffer, Jonas
Ruckle, Andreas
Poth, Clifton
Kamath, Aishwarya
Vulic, Ivan
Ruder, Sebastian
Cho, Kyunghyun
Gurevych, Iryna

October 2020

The current modus operandi in NLP involves downloading and fine-tuning pre-trained models consisting...

Overview of the Transformer-based Models for NLP Tasks

Gillioz, Anthony
Casas, Jacky
Mugellini, Elena
Abou Khaled, Omar

January 2021

In 2017, Vaswani et al. proposed a new neural network architecture named Transformer. That modern ar...

huggingface/transformers: CTRL, DistilGPT-2, Pytorch TPU, tokenizer enhancements, guideline requirements

Thomas Wolf
Lysandre Debut
Victor SANH
Denis
erenup
Julien Chaumond
Matt
Grégory Châtel
Tim Rault
Catalin Voss
Fei Wang
Malte Pietsch
Davide Fiocco
Stefan Schweter
dhanajitb
Jinoo
Ananya Harsh Jha
yzy5630
Yongbo Wang
Shijie Wu
Guillem García Subies
Weixin Wang
Zeyao Du
Chi-Liang, Liu
Simon Layton
Nikolay Korolev
Joel Grus
Jade Abbott

October 2019

New model architectures: CTRL, DistilGPT-2 Two new models have been added since release 2.0. CTRL (...

huggingface/transformers: Trainer, TFTrainer, Multilingual BART, Encoder-decoder improvements, Generation Pipeline

Thomas Wolf
Lysandre Debut
Julien Chaumond
Victor SANH
Patrick von Platen
Aymeric Augustin
Rémi Louf
Funtowicz Morgan
Sam Shleifer
Stefan Schweter
Manuel Romero
Denis
erenup
Matt
Piero Molino
Grégory Châtel
Bram Vanroy
Tim Rault
Gunnlaugur Thor Briem
Anthony MOI
Malte Pietsch
Catalin Voss
Bilal Khan
Fei Wang
Louis Martin
Davide Fiocco
Martin Malmsten
Lorenzo Ampil
HUSEIN ZOLKEPLI
Clement

May 2020

Trainer & TFTrainer Version 2.9 introduces a new Trainer class for PyTorch, and its equivalent TFTra...

Large Scale Fine-Tuned Transformers Models Application for Business Names Generation

Lukauskas, Mantas
Rasymas, Tomas
Minelga, Matas
Vaitmonas, Domas

August 2023

Natural language processing (NLP) involves the computer analysis and processing of human languages u...

A Comprehensive Exploration of Pre-training Language Models

Guo, Tong

October 2021

Recently, the development of pre-trained language models has brought natural language processing (NL...

huggingface/transformers: Rust Tokenizers, DistilBERT base cased, Model cards

Thomas Wolf
Lysandre Debut
Julien Chaumond
Victor SANH
Aymeric Augustin
Rémi Louf
Funtowicz Morgan
Stefan Schweter
Denis
erenup
Matt
Piero Molino
Patrick von Platen
Grégory Châtel
Tim Rault
MOI Anthony
Bram Vanroy

February 2020

Rust tokenizers (@mfuntowicz, @n1t0 ) Tokenizers for Bert, Roberta, OpenAI GPT, OpenAI GPT2, Transf...

Asynchronous pipelines for processing huge corpora on medium to low resource infrastructures

Ortiz Suárez, Pedro Javier
Sagot, Benoît
Romary, Laurent

July 2019

Common Crawl is a considerably large, heterogeneous multilingual corpus comprised of crawled documen...

Transformers: State-of-the-Art Natural Language Processing

Wolf, Thomas
Debut, Lysandre
Sanh, Victor
Chaumond, Julien
Delangue, Clement
Moi, Anthony
Cistac, Perric
Ma, Clara
Jernite, Yacine
Plu, Julien
Xu, Canwen
Le Scao, Teven
Gugger, Sylvain
Drame, Mariama
Lhoest, Quentin
Rush, Alexander M.

October 2020

Perceiver The Perceiver model was released in the previous version: Perceiver Eight new models are r...

huggingface/transformers: Longformer

Thomas Wolf
Lysandre Debut
Julien Chaumond
Patrick von Platen
Victor SANH
Aymeric Augustin
Funtowicz Morgan
Rémi Louf
Sam Shleifer
Manuel Romero
Stefan Schweter
Denis
erenup
Matt
Grégory Châtel
Piero Molino
Bram Vanroy
Anthony MOI
Gunnlaugur Thor Briem
Tim Rault
Bilal Khan
Catalin Voss
Malte Pietsch
Lorenzo Ampil
Davide Fiocco
Louis Martin
Fei Wang
HUSEIN ZOLKEPLI
Suraj Patil
Martin Malmsten

June 2020

Longformer Longformer (@ibeltagy) Longformer for QA (@patil-suraj + @patrickvonplaten) Longformer f...

huggingface/transformers: Downstream NLP task API (feature extraction, text classification, NER, QA), Command-Line Interface and Serving – models: T5 – community-added models: Japanese & Finnish BERT, PPLM, XLM-R

Abstract

Extracted data

huggingface/transformers: Downstream NLP task API (feature extraction, text classification, NER, QA), Command-Line Interface and Serving – models: T5 – community-added models: Japanese & Finnish BERT, PPLM, XLM-R

Abstract

Extracted data

Related items

Related items