NervanaSystems/neon: SSD example, Deep Speech 2 IA optimizations, aeon v1.0.0

neon: Python 3 support, persistent RNN kernels, and improvements to dataloader, convolutional kernels and docs.

Scott Leishman
apark263
Anil Thomas
nervetumer
yinyinl
Jennifer Myers
Urs Köster
Scott Gray
Augustus Odena
wconstab
Stewart Hall
hanlin-nervana
John Co-Reyes
Arjun Bansal
Sébastien Arnold
Jeevan Shankar
Scott Cyphers
Zach Dwiel
Kai Arulkumaran
Gabriel Pereyra
Patrick Callier
Yixing Lao
aravind-nrv
nhynes
Neuroschemata
bbnguyen
Dongjoon Hyun
Jianyu Huang
Chris Wedgwood
Chetan Surpur

July 2016

Python2/Python3 compatibility [#191] Support for Pascal GPUs Persistent RNN kernels [#262] Implemen...

brucefan1983/GPUMD: GPUMD-v3.6

Zheyong Fan
Alexander J. Gabourie
Xu Ke
Eric Lindgren
erhart1
Lazemare
Yanzhou Wang
Penghua Ying
liangzhixin-202169
AmbroseWong
Jonsnow-willow
wang laosi
Nan Xu
Liangting
Rui Zhao
shdchen

January 2023

Bugfix: fixed a bug for the plumed interface when the number of atoms exceeds 1024 #339 fixed a fil...

Metal.jl

Besard, Tim
Hawkins, Max

March 2023

Metal v0.2.0 Diff since v0.1.2 Closed issues: Threadgroup memory breaks on small datatypes (#26) In...

NervanaSystems/neon: Improved CPU performance for SSD and inference with batchnorm, Docker file

Scott Leishman
Alex Park
Anil Thomas
yinyinl
nervetumer
Urs Köster
Scott Gray
Augustus Odena
wconstab
Zach Dwiel
Peng Zhang
Wei Wang
baojun
John Co-Reyes
Arjun Bansal
Sébastien Arnold
Andy
DawnStone
Jeevan Shankar
kulig
Tyler Lee
wsokolow
Tomasz Patejko
ruby-nervana
Kai Arulkumaran
Igor Kaplounenko
Santi Villalba
Xin Wang
Steven Robertson
Gabriel Pereyra

December 2017

Optimized SSD MKL backend performance (~3X boost version over version) Bumped aeon version to v1.3.0...

NervanaSystems/neon: New Data Loader (aeon), Neural Machine Translation, doc updates and bug fixes

Scott Leishman
apark263
Anil Thomas
Jennifer Myers
yinyinl
nervetumer
Urs Köster
Scott Gray
hanlin-nervana
Augustus Odena
wconstab
Stewart Hall
John Co-Reyes
Zach Dwiel
Arjun Bansal
Sébastien Arnold
Jeevan Shankar
Andy
Scott Cyphers
Kai Arulkumaran
Steven Robertson
jknight-nervana
Gabriel Pereyra
Keren Zhou
Yixing Lao
nhynes
Neuroschemata
Dongjoon Hyun
bbnguyen
aravind-nrv

November 2016

Update Data Loader to aeon https://github.com/NervanaSystems/aeon for flexible, multi-threaded data ...

NervanaSystems/neon: CPU optimizations bringing ~7x gain in Deep Speech 2 performance and gains in Alexnet, VGG

Scott Leishman
Alex Park
Anil Thomas
Jennifer Myers
yinyinl
nervetumer
Urs Köster
hanlin-nervana
Scott Gray
Augustus Odena
wconstab
Zach Dwiel
Wei Wang
John Co-Reyes
Peng Zhang
Arjun Bansal
Sébastien Arnold
Andy
DawnStone
Jeevan Shankar
kulig
Tyler Lee
Scott Cyphers
ruby-nervana
Kai Arulkumaran
Santi Villalba
Xin Wang
Steven Robertson
Gabriel Pereyra
aravind-nrv

October 2017

Optimized DeepSpeech2 MKL backend performance (~7X improvement over the CPU backend) Fused convoluti...

NervanaSystems/neon: MKL backend boosting CPU performance, WGAN model examples

Scott Leishman
apark263
Anil Thomas
Jennifer Myers
yinyinl
nervetumer
Urs Köster
hanlin-nervana
Scott Gray
Augustus Odena
wconstab
Zach Dwiel
John Co-Reyes
Arjun Bansal
Sébastien Arnold
Jeevan Shankar
Andy
Scott Cyphers
Tyler Lee
Kai Arulkumaran
Santi Villalba
Xin Wang
Steven Robertson
Jason Knight
Gabriel Pereyra
mikebenfield
Dongjoon Hyun
DawnStone
bbnguyen
aravind-nrv

June 2017

Added support for MKL backend (-b mkl) on Linux, which boosts neon CPU performance significantly Add...

NervanaSystems/neon: Default to MKL backend on Linux/CPU and update to MKLML release 20170720

Scott Leishman
apark263
Anil Thomas
Jennifer Myers
yinyinl
nervetumer
Urs Köster
hanlin-nervana
Scott Gray
Augustus Odena
wconstab
Zach Dwiel
John Co-Reyes
Arjun Bansal
Sébastien Arnold
Jeevan Shankar
Andy
Scott Cyphers
Tyler Lee
Kai Arulkumaran
Santi Villalba
Xin Wang
Steven Robertson
Jason Knight
Gabriel Pereyra
mikebenfield
Dongjoon Hyun
DawnStone
bbnguyen
aravind-nrv

August 2017

Set MKL backend (-b mkl) as the default CPU backend on Linux (use -b cpu to specify original CPU bac...

NervanaSystems/neon: Optimized CPU performance on macOS with new MKLML support, improved SSD CPU performance

Scott Leishman
Alex Park
Anil Thomas
yinyinl
nervetumer
Urs Köster
Scott Gray
Augustus Odena
wconstab
baojun
Zach Dwiel
Peng Zhang
Wei Wang
John Co-Reyes
Arjun Bansal
Sébastien Arnold
Andy
DawnStone
Jeevan Shankar
kulig
Tyler Lee
wsokolow
Tomasz Patejko
ruby-nervana
Kai Arulkumaran
Igor Kaplounenko
Santi Villalba
Xin Wang
Steven Robertson
Gabriel Pereyra

January 2018

Further optimized MKL backend performance for SSD inference Updated MKLML to version 20171227 Enable...

NervanaSystems/neon: Generative Adversarial Networks, 3D Deconvolution, doc updates and bug fixes

Scott Leishman
apark263
Anil Thomas
Jennifer Myers
yinyinl
nervetumer
Urs Köster
hanlin-nervana
Scott Gray
Stewart Hall
Augustus Odena
wconstab
Zach Dwiel
John Co-Reyes
Arjun Bansal
Sébastien Arnold
Jeevan Shankar
Andy
Scott Cyphers
Tyler Lee
Kai Arulkumaran
Santi Villalba
Xin Wang
Steven Robertson
Jason Knight
Gabriel Pereyra
mikebenfield
Dongjoon Hyun
bbnguyen
aravind-nrv

May 2017

Add support for 3D deconvolution Generative Adversarial Networks (GAN) implementation, and MNIST DCG...

NervanaSystems/neon: Faster RCNN, Sequence to Sequence, Reshape layer, updated pip requirements

Scott Leishman
apark263
Anil Thomas
nervetumer
yinyinl
Jennifer Myers
Urs Köster
Scott Gray
Augustus Odena
wconstab
Stewart Hall
hanlin-nervana
John Co-Reyes
Arjun Bansal
Sébastien Arnold
Jeevan Shankar
Scott Cyphers
Zach Dwiel
Kai Arulkumaran
Gabriel Pereyra
Patrick Callier
Yixing Lao
aravind-nrv
nhynes
Neuroschemata
bbnguyen
Dongjoon Hyun
Jianyu Huang
Chris Wedgwood
Chetan Surpur

September 2016

Faster RCNN model Sequence to Sequence container and char_rae recurrent autoencoder model Reshape La...

NervanaSystems/neon: Skip Thought Vectors, dilated convolution support, Nesterov Accelerated Gradient

Scott Leishman
apark263
Anil Thomas
Jennifer Myers
yinyinl
nervetumer
Urs Köster
Scott Gray
hanlin-nervana
Stewart Hall
Augustus Odena
wconstab
Zach Dwiel
John Co-Reyes
Arjun Bansal
Sébastien Arnold
Jeevan Shankar
Andy
Scott Cyphers
Kai Arulkumaran
Steven Robertson
jknight-nervana
Gabriel Pereyra
Yixing Lao
Tyler Lee
nhynes
Neuroschemata
Dongjoon Hyun
bbnguyen
aravind-nrv

December 2016

Skip Thought Vectors (http://arxiv.org/abs/1506.06726) example Dilated convolution support Nesterov ...

Profiling and characterization of deep learning model inference on CPU

Qian, Yanli

August 2022

With the rapid growth of deep learning models and higher expectations for their accuracy and through...

NervanaSystems/neon: Dilated convolution and Speech model bug fixes

Scott Leishman
apark263
Anil Thomas
Jennifer Myers
yinyinl
nervetumer
Urs Köster
Scott Gray
hanlin-nervana
Stewart Hall
Augustus Odena
wconstab
Zach Dwiel
John Co-Reyes
Arjun Bansal
Sébastien Arnold
Jeevan Shankar
Andy
Scott Cyphers
Kai Arulkumaran
Steven Robertson
jknight-nervana
Gabriel Pereyra
Yixing Lao
Tyler Lee
nhynes
Neuroschemata
Dongjoon Hyun
bbnguyen
aravind-nrv

January 2017

Bug fix: Add dilation to object dict and assign defaults to dil_w = dil_h = 1 [#335, #336] Bug fix: ...

nicolas-chaulet/torch-points3d: v 1.3.0

thomas chaton
Nicolas Chaulet
humanpose1
Tristan Heywood
Christopher Lee
daili650
Loic Landrieu
Ze Liu
Uakh
Guocheng Qian 钱国成
Simone Fontana
Wundersam
Ziyue Feng
Chaitanya Joshi
schafter89
yuqiang

April 2021

1.3.0 Added MS-SVConv: https://arxiv.org/abs/2103.14533 (thanks @humanpose1) added new data generat...

neon: Python 3 support, persistent RNN kernels, and improvements to dataloader, convolutional kernels and docs.

Scott Leishman
apark263
Anil Thomas
nervetumer
yinyinl
Jennifer Myers
Urs Köster
Scott Gray
Augustus Odena
wconstab
Stewart Hall
hanlin-nervana
John Co-Reyes
Arjun Bansal
Sébastien Arnold
Jeevan Shankar
Scott Cyphers
Zach Dwiel
Kai Arulkumaran
Gabriel Pereyra
Patrick Callier
Yixing Lao
aravind-nrv
nhynes
Neuroschemata
bbnguyen
Dongjoon Hyun
Jianyu Huang
Chris Wedgwood
Chetan Surpur

July 2016

Python2/Python3 compatibility [#191] Support for Pascal GPUs Persistent RNN kernels [#262] Implemen...

brucefan1983/GPUMD: GPUMD-v3.6

Zheyong Fan
Alexander J. Gabourie
Xu Ke
Eric Lindgren
erhart1
Lazemare
Yanzhou Wang
Penghua Ying
liangzhixin-202169
AmbroseWong
Jonsnow-willow
wang laosi
Nan Xu
Liangting
Rui Zhao
shdchen

January 2023

Bugfix: fixed a bug for the plumed interface when the number of atoms exceeds 1024 #339 fixed a fil...

Metal.jl

Besard, Tim
Hawkins, Max

March 2023

Metal v0.2.0 Diff since v0.1.2 Closed issues: Threadgroup memory breaks on small datatypes (#26) In...

NervanaSystems/neon: Improved CPU performance for SSD and inference with batchnorm, Docker file

Scott Leishman
Alex Park
Anil Thomas
yinyinl
nervetumer
Urs Köster
Scott Gray
Augustus Odena
wconstab
Zach Dwiel
Peng Zhang
Wei Wang
baojun
John Co-Reyes
Arjun Bansal
Sébastien Arnold
Andy
DawnStone
Jeevan Shankar
kulig
Tyler Lee
wsokolow
Tomasz Patejko
ruby-nervana
Kai Arulkumaran
Igor Kaplounenko
Santi Villalba
Xin Wang
Steven Robertson
Gabriel Pereyra

December 2017

Optimized SSD MKL backend performance (~3X boost version over version) Bumped aeon version to v1.3.0...

NervanaSystems/neon: New Data Loader (aeon), Neural Machine Translation, doc updates and bug fixes

Scott Leishman
apark263
Anil Thomas
Jennifer Myers
yinyinl
nervetumer
Urs Köster
Scott Gray
hanlin-nervana
Augustus Odena
wconstab
Stewart Hall
John Co-Reyes
Zach Dwiel
Arjun Bansal
Sébastien Arnold
Jeevan Shankar
Andy
Scott Cyphers
Kai Arulkumaran
Steven Robertson
jknight-nervana
Gabriel Pereyra
Keren Zhou
Yixing Lao
nhynes
Neuroschemata
Dongjoon Hyun
bbnguyen
aravind-nrv

November 2016

Update Data Loader to aeon https://github.com/NervanaSystems/aeon for flexible, multi-threaded data ...

NervanaSystems/neon: CPU optimizations bringing ~7x gain in Deep Speech 2 performance and gains in Alexnet, VGG

Scott Leishman
Alex Park
Anil Thomas
Jennifer Myers
yinyinl
nervetumer
Urs Köster
hanlin-nervana
Scott Gray
Augustus Odena
wconstab
Zach Dwiel
Wei Wang
John Co-Reyes
Peng Zhang
Arjun Bansal
Sébastien Arnold
Andy
DawnStone
Jeevan Shankar
kulig
Tyler Lee
Scott Cyphers
ruby-nervana
Kai Arulkumaran
Santi Villalba
Xin Wang
Steven Robertson
Gabriel Pereyra
aravind-nrv

October 2017

Optimized DeepSpeech2 MKL backend performance (~7X improvement over the CPU backend) Fused convoluti...

NervanaSystems/neon: MKL backend boosting CPU performance, WGAN model examples

Scott Leishman
apark263
Anil Thomas
Jennifer Myers
yinyinl
nervetumer
Urs Köster
hanlin-nervana
Scott Gray
Augustus Odena
wconstab
Zach Dwiel
John Co-Reyes
Arjun Bansal
Sébastien Arnold
Jeevan Shankar
Andy
Scott Cyphers
Tyler Lee
Kai Arulkumaran
Santi Villalba
Xin Wang
Steven Robertson
Jason Knight
Gabriel Pereyra
mikebenfield
Dongjoon Hyun
DawnStone
bbnguyen
aravind-nrv

June 2017

Added support for MKL backend (-b mkl) on Linux, which boosts neon CPU performance significantly Add...

NervanaSystems/neon: Default to MKL backend on Linux/CPU and update to MKLML release 20170720

Scott Leishman
apark263
Anil Thomas
Jennifer Myers
yinyinl
nervetumer
Urs Köster
hanlin-nervana
Scott Gray
Augustus Odena
wconstab
Zach Dwiel
John Co-Reyes
Arjun Bansal
Sébastien Arnold
Jeevan Shankar
Andy
Scott Cyphers
Tyler Lee
Kai Arulkumaran
Santi Villalba
Xin Wang
Steven Robertson
Jason Knight
Gabriel Pereyra
mikebenfield
Dongjoon Hyun
DawnStone
bbnguyen
aravind-nrv

August 2017

Set MKL backend (-b mkl) as the default CPU backend on Linux (use -b cpu to specify original CPU bac...

NervanaSystems/neon: Optimized CPU performance on macOS with new MKLML support, improved SSD CPU performance

Scott Leishman
Alex Park
Anil Thomas
yinyinl
nervetumer
Urs Köster
Scott Gray
Augustus Odena
wconstab
baojun
Zach Dwiel
Peng Zhang
Wei Wang
John Co-Reyes
Arjun Bansal
Sébastien Arnold
Andy
DawnStone
Jeevan Shankar
kulig
Tyler Lee
wsokolow
Tomasz Patejko
ruby-nervana
Kai Arulkumaran
Igor Kaplounenko
Santi Villalba
Xin Wang
Steven Robertson
Gabriel Pereyra

January 2018

Further optimized MKL backend performance for SSD inference Updated MKLML to version 20171227 Enable...

NervanaSystems/neon: Generative Adversarial Networks, 3D Deconvolution, doc updates and bug fixes

Scott Leishman
apark263
Anil Thomas
Jennifer Myers
yinyinl
nervetumer
Urs Köster
hanlin-nervana
Scott Gray
Stewart Hall
Augustus Odena
wconstab
Zach Dwiel
John Co-Reyes
Arjun Bansal
Sébastien Arnold
Jeevan Shankar
Andy
Scott Cyphers
Tyler Lee
Kai Arulkumaran
Santi Villalba
Xin Wang
Steven Robertson
Jason Knight
Gabriel Pereyra
mikebenfield
Dongjoon Hyun
bbnguyen
aravind-nrv

May 2017

Add support for 3D deconvolution Generative Adversarial Networks (GAN) implementation, and MNIST DCG...

NervanaSystems/neon: Faster RCNN, Sequence to Sequence, Reshape layer, updated pip requirements

Scott Leishman
apark263
Anil Thomas
nervetumer
yinyinl
Jennifer Myers
Urs Köster
Scott Gray
Augustus Odena
wconstab
Stewart Hall
hanlin-nervana
John Co-Reyes
Arjun Bansal
Sébastien Arnold
Jeevan Shankar
Scott Cyphers
Zach Dwiel
Kai Arulkumaran
Gabriel Pereyra
Patrick Callier
Yixing Lao
aravind-nrv
nhynes
Neuroschemata
bbnguyen
Dongjoon Hyun
Jianyu Huang
Chris Wedgwood
Chetan Surpur

September 2016

Faster RCNN model Sequence to Sequence container and char_rae recurrent autoencoder model Reshape La...

NervanaSystems/neon: Skip Thought Vectors, dilated convolution support, Nesterov Accelerated Gradient

Scott Leishman
apark263
Anil Thomas
Jennifer Myers
yinyinl
nervetumer
Urs Köster
Scott Gray
hanlin-nervana
Stewart Hall
Augustus Odena
wconstab
Zach Dwiel
John Co-Reyes
Arjun Bansal
Sébastien Arnold
Jeevan Shankar
Andy
Scott Cyphers
Kai Arulkumaran
Steven Robertson
jknight-nervana
Gabriel Pereyra
Yixing Lao
Tyler Lee
nhynes
Neuroschemata
Dongjoon Hyun
bbnguyen
aravind-nrv

December 2016

Skip Thought Vectors (http://arxiv.org/abs/1506.06726) example Dilated convolution support Nesterov ...

Profiling and characterization of deep learning model inference on CPU

Qian, Yanli

August 2022

With the rapid growth of deep learning models and higher expectations for their accuracy and through...

NervanaSystems/neon: Dilated convolution and Speech model bug fixes

Scott Leishman
apark263
Anil Thomas
Jennifer Myers
yinyinl
nervetumer
Urs Köster
Scott Gray
hanlin-nervana
Stewart Hall
Augustus Odena
wconstab
Zach Dwiel
John Co-Reyes
Arjun Bansal
Sébastien Arnold
Jeevan Shankar
Andy
Scott Cyphers
Kai Arulkumaran
Steven Robertson
jknight-nervana
Gabriel Pereyra
Yixing Lao
Tyler Lee
nhynes
Neuroschemata
Dongjoon Hyun
bbnguyen
aravind-nrv

January 2017

Bug fix: Add dilation to object dict and assign defaults to dil_w = dil_h = 1 [#335, #336] Bug fix: ...

nicolas-chaulet/torch-points3d: v 1.3.0

thomas chaton
Nicolas Chaulet
humanpose1
Tristan Heywood
Christopher Lee
daili650
Loic Landrieu
Ze Liu
Uakh
Guocheng Qian 钱国成
Simone Fontana
Wundersam
Ziyue Feng
Chaitanya Joshi
schafter89
yuqiang

April 2021

1.3.0 Added MS-SVConv: https://arxiv.org/abs/2103.14533 (thanks @humanpose1) added new data generat...

neon: Python 3 support, persistent RNN kernels, and improvements to dataloader, convolutional kernels and docs.

Scott Leishman
apark263
Anil Thomas
nervetumer
yinyinl
Jennifer Myers
Urs Köster
Scott Gray
Augustus Odena
wconstab
Stewart Hall
hanlin-nervana
John Co-Reyes
Arjun Bansal
Sébastien Arnold
Jeevan Shankar
Scott Cyphers
Zach Dwiel
Kai Arulkumaran
Gabriel Pereyra
Patrick Callier
Yixing Lao
aravind-nrv
nhynes
Neuroschemata
bbnguyen
Dongjoon Hyun
Jianyu Huang
Chris Wedgwood
Chetan Surpur

July 2016

Python2/Python3 compatibility [#191] Support for Pascal GPUs Persistent RNN kernels [#262] Implemen...

brucefan1983/GPUMD: GPUMD-v3.6

Zheyong Fan
Alexander J. Gabourie
Xu Ke
Eric Lindgren
erhart1
Lazemare
Yanzhou Wang
Penghua Ying
liangzhixin-202169
AmbroseWong
Jonsnow-willow
wang laosi
Nan Xu
Liangting
Rui Zhao
shdchen

January 2023

Bugfix: fixed a bug for the plumed interface when the number of atoms exceeds 1024 #339 fixed a fil...

Metal.jl

Besard, Tim
Hawkins, Max

March 2023

Metal v0.2.0 Diff since v0.1.2 Closed issues: Threadgroup memory breaks on small datatypes (#26) In...

NervanaSystems/neon: SSD example, Deep Speech 2 IA optimizations, aeon v1.0.0

Abstract

Extracted data

NervanaSystems/neon: SSD example, Deep Speech 2 IA optimizations, aeon v1.0.0

Abstract

Extracted data

Related items

Related items