Model Garden

Dolly 2.0 Inference

Dolly 2.0 – The World’s First, Truly Open Instruction-Tuned LLM on IPUs – Inference

View Repository

OpenAssistant Pythia 12B Inference

OpenAssistant Pythia 12B is an open-source and commercially usable chat-based assistant model trained on the OpenAssistant Conversations Dataset (OASST1)

View Repository

Whisper Inference

Speech Transcription on IPUs using OpenAI's Whisper - Inference

View Repository

Llama 2 Inference

Run Meta’s latest Open Source Large Language Model Inference on IPUs

View Repository

Stable Diffusion 2 Text-to-Image Inference

The popular latent diffusion model for generative AI with support for text-to-image on IPUs using Hugging Face Optimum.

View Repository

Stable Diffusion Text-to-Image Inference

The popular latent diffusion model for generative AI with support for text-to-image on IPUs using Hugging Face Optimum.

View Repository

Stable Diffusion Image-to-Image Inference

The popular latent diffusion model for generative AI with support for image-to-image on IPUs using Hugging Face Optimum.

View Repository

Stable Diffusion Inpainting Inference

The popular latent diffusion model for generative AI with support for inpainting on IPUs using Hugging Face Optimum.

View Repository

GPT-J 6B Fine-tuning

Text entailment on IPU using GPT-J 6B on PyTorch using fine-tuning.

View Repository

GPT-J 6B Inference

Text generation on IPU using GPT-J 6B on PyTorch for inference.

View Repository

RGCN Training

Training a GNN to do Fraud Detection using Relational Graph Convolution Network (RGCN) on IPUs with PyG (PyTorch Geometric)

View Repository

GPT-3 Fine-tuning

GPT-3 (Generative Pretrained Transformer 3) is a state-of-the-art language processing AI model developed by OpenAI.

Speak to an Expert

GPT-3 Inference

GPT-3 (Generative Pretrained Transformer 3) is a state-of-the-art language processing AI model developed by OpenAI.

Speak to an Expert

GPT2-Large Training

GPT2-L training in PyTorch leveraging the Hugging Face Transformers library.

View Repository

GPT2-Large Inference

GPT2-L inference in PyTorch leveraging the Hugging Face Transformers library.

View Repository

GPT2-Medium Training

GPT2-M training in PyTorch leveraging the Hugging Face Transformers library.

View Repository

GPT2-Medium Fine-tuning

HuggingFace Optimum implementation for fine-tuning a GPT2-Medium transformer model.

View Repository

GPT2-Medium Inference

GPT2-M inference in PyTorch leveraging the Hugging Face Transformers library.

View Repository

GPT2-Small Training

GPT2-S training in PyTorch leveraging the Hugging Face Transformers library.

View Repository

GPT2-Small Fine-tuning

HuggingFace Optimum implementation for fine-tuning a GPT2-Small transformer model.

View Repository

GPT2-Small Inference

GPT2-S inference in PyTorch leveraging the Hugging Face Transformers library.

View Repository

Flan-T5-Large/XL Inference

Flan-T5-Large/XL inference on IPUs with Hugging Face

View Repository

T5-Small Fine-Tuning

Summarization on IPU using T5 Small with Hugging Face Optimum - Fine-Tuning

View Repository

MT5-Small Fine-Tuning

Machine Translation on IPUs using MT5-Small with Hugging Face - Fine-tuning

View Repository

MT5-Large Inference

Zero-Shot Text Classification on IPUs using MT5-Large with Hugging Face - Inference

View Repository

GPS++ Training

A hybrid GNN/Transformer for training Molecular Property Prediction using IPUs on the PCQM4Mv2 dataset. Winner of the Open Graph Benchmark Large-Scale Challenge.

View Repository

GPS++ Inference

A hybrid GNN/Transformer for Molecular Property Prediction inference using IPUs trained on the PCQM4Mv2 dataset. Winner of the Open Graph Benchmark Large-Scale Challenge.

View Repository

Distributed KGE - TransE (256) Training

Knowledge graph embedding (KGE) for link-prediction training on IPUs using Poplar with the WikiKG90Mv2 dataset. Winner of the Open Graph Benchmark Large-Scale Challenge.

View Repository

Distributed KGE - TransE (256) Inference

Knowledge graph embedding (KGE) for link-prediction inference on IPUs using Poplar with the WikiKG90Mv2 dataset. Winner of the Open Graph Benchmark Large-Scale Challenge.

View Repository

Distributed KGE - TransE (256) Training

Knowledge graph embedding (KGE) for link-prediction training on IPUs using PyTorch with the WikiKG90Mv2 dataset. Winner of the Open Graph Benchmark Large-Scale Challenge.

View Repository

BERT-Large Training

BERT-Large (Bidirectional Encoder Representations from Transformers) using PyTorch for NLP training on IPUs.

View Repository

BERT-Large Training

BERT-Large (Bidirectional Encoder Representations from Transformers) using TensorFlow 1 for NLP training on IPUs.

View Repository

BERT-Large Inference

BERT-Large (Bidirectional Encoder Representations from Transformers) for NLP inference on IPUs with TensorFlow 1.

View Repository

BERT-Large Training

BERT-Large (Bidirectional Encoder Representations from Transformers) using TensorFlow 2 for NLP training on IPUs.

View Repository

BERT-Large Training

BERT-Large (Bidirectional Encoder Representations from Transformers) using PopART for NLP training on IPUs.

View Repository

BERT-Large Inference

BERT-Large (Bidirectional Encoder Representations from Transformers) using PopART for NLP inference on IPUs.

View Repository

BERT-Large Fine-tuning

HuggingFace Optimum implementation for fine-tuning a BERT-Large transformer model.

View Repository

BERT-Large Pretraining

HuggingFace Optimum implementation for pre-training a BERT-Large transformer model.

View Repository

DistilBERT Training

DistilBERT is a small, fast, cheap and light Transformer model trained by distilling BERT base using Hugging Face Optimum on IPUs.

View Repository

BERT-Base Training

BERT-Base (Bidirectional Encoder Representations from Transformers) using PyTorch for NLP training on IPUs.

View Repository

BERT-Base Training

BERT-Base (Bidirectional Encoder Representations from Transformers) using TensorFlow 2 for NLP training on IPUs.

View Repository

BERT-Base Training

BERT-Base (Bidirectional Encoder Representations from Transformers) using TensorFlow 1 for NLP training on IPUs.

View Repository

BERT-Base Training

BERT-Base (Bidirectional Encoder Representations from Transformers) using PopART for NLP training on IPUs.

View Repository

BERT-Base Inference

BERT-Base (Bidirectional Encoder Representations from Transformers) using PopART for NLP inference on IPUs.

View Repository

BERT-Base Training

BERT-Base pre-training and SQuAD fine-tuning using Baidu's PaddlePaddle framework on IPUs.

View Repository

BERT-Base Pretraining

HuggingFace Optimum implementation for pretraining a BERT-Base transformer model using bert-based-uncased datasets.

View Repository

BERT-Base Fine-tuning

HuggingFace Optimum implementation for fine-tuning a BERT-Base transformer model using bert-base-uncased on the squad dataset.

View Repository

RoBERTa-Large Training

HuggingFace Optimum implementation for training RoBERTa-Large - a transformer model for sequence classification, token classification or question answering.

View Repository

RoBERTa-Base Fine-tuning

HuggingFace Optimum implementation for fine-tuning RoBERTa-Base on the squad dataset for text generation and comprehension tasks

View Repository

RoBERTa-Base Fine-tuning

HuggingFace Optimum implementation for fine-tuning RoBERTa-Base on the squad_v2 dataset for text generation and comprehension tasks

View Repository

LXMERT Fine-tuning

HuggingFace Optimum implementation for fine-tuning LXMERT on the gqa-lxmert dataset for learning vision-and-language cross-modality representations.

View Repository

DeBERTa Training

HuggingFace Optimum implementation for training DeBERTa - a transformer models that improves BERT and RoBERTa models using disentangled attention and enhanced mask decoder.

View Repository

LXMERT Fine-tuning

HuggingFace Optimum implementation for fine-tuning LXMERT on the vqa-lxmert dataset for learning vision-and-language cross-modality representations.

View Repository

DeBERTa Inference

SQuAD and MNLI on IPUs using DeBERTa with Hugging Face - Inference

View Repository

HuBERT Training

HuggingFace Optimum implementation for training HuBERT (Hidden-Unit BERT) for self-supervised speech representation learning approach.

View Repository

BART Training

HuggingFace Optimum implementation for training BART - a transformer model for text generation and comprehension tasks

View Repository

GroupBERT Training

GroupBERT - an enhanced transformer architecture with efficient grouped structures in TensorFlow 1.

View Repository

PackedBERT Training

New BERT packing algorithm that removes padding for more efficient training in PyTorch.

View Repository

PackedBERT Training

New BERT packing algorithm that removes padding for more efficient training in PopART.

View Repository

PackedBERT Fine-tuning

New BERT packing algorithm that removes padding for more efficient fine-tuning in Hugging Face.

View Repository

PackedBERT Inference

New BERT packing algorithm that removes padding for more efficient inference in Hugging Face.

View Repository

Conformer-Medium Training

A variant of the conformer model based on WeNet (not ESPnet) using PyTorch which uses a hybrid CTC/attention architecture with transformer or conformer as an encoder.

View Repository

CLIP Training

CLIP (Contrastive Language-Image Pre-Training) - a neural network trained on a variety of (image, text) pairs using PyTorch.

View Repository

ViT (Vision Transformer) Fine-tuning

ViT (Vision Transformer) fine-tuning in PyTorch using Hugging Face transformers.

View Repository

ViT (Vision Transformer) Pretraining

ViT (Vision Transformer) pretraining in PyTorch using Hugging Face transformers.

View Repository

ViT (Vision Transformer) Fine-tuning

HuggingFace Optimum implementation for fine-tuning a ViT (vision transformer) model.

View Repository

DINO Training

Self-supervised Vision Transformer model for training in PyTorch.

View Repository

YOLOv3 Training

YOLOv3 - You Only Look Once - a convolutional neural network model that performs object detection tasks on IPUs using TensorFlow 1.

View Repository

YOLOv3 Inference

YOLOv3 - You Only Look Once - a convolutional neural network model that performs object detection tasks on IPUs using TensorFlow 1..

View Repository

YOLOv4 Inference

YOLOv4 - You Only Look Once - a convolutional neural network model that performs object detection tasks on IPUs using PyTorch.

View Repository

ResNet-50 Training

Image classification training on IPUs using the CNN (Convolutional Neural Network) model ResNet-50 with PyTorch.

View Repository

ResNet-50 Inference

Image classification inference on IPUs using the CNN (Convolutional Neural Network) model ResNet-50 with PyTorch.

View Repository

ResNet-50 Training

Image classification training on IPUs using the CNN (Convolutional Neural Network) model ResNet-50 with TensorFlow 2.

View Repository

ResNet-50 Training

Image classification training on IPUs using the CNN (Convolutional Neural Network) model ResNet-50 with TensorFlow 1.

View Repository

ResNet-50 Inference

Image classification inference on IPUs using the CNN (Convolutional Neural Network) model ResNet-50 with TensorFlow 1.

View Repository

EfficientNet-B4 Training

CNN (Convolutional Neural Network) image classification training on EfficientNet with PyTorch for IPU.

View Repository

EfficientNet-B0/B4 Inference

CNN (Convolutional Neural Network) image classification inference on EfficientNet with PyTorch for IPU.

View Repository

EfficientDet (D0-D4) Inference

Efficient object detection model for inference using TensorFlow 2 on the IPU.

View Repository

EfficientNet-B4 Training

CNN (Convolutional Neural Network) image classification training on EfficientNet with TensorFlow 1 for IPU.

View Repository

Reference Evapotranspiration (ET0) Inference

Spatial interpolation analysis and prediction calculation using TensorFlow 1 for weather forecasting, drought forecasting, and smart irrigation.

View Repository

ResNeXt-101 Training

Image classification training on IPUs using the CNN (Convolutional Neural Network) model ResNeXt-101 with TensorFlow 1.

View Repository

ResNeXt-101 Inference

Image classification inference on IPUs using the CNN (Convolutional Neural Network) model ResNeXt-101 with PyTorch.

View Repository

ResNeXt-101 Inference

Image classification inference on IPUs using the CNN (Convolutional Neural Network) model ResNeXt-101 with TensorFlow 1.

View Repository

ResNeXt-101 Inference

Image classification inference on IPUs using the CNN (Convolutional Neural Network) model ResNeXt-101 with PopART.

View Repository

Faster-RCNN Training

IPU implementation of Faster-RCNN detection framework using PopART.

View Repository

Swin Pretraining

Swin: Hierarchical Vision Transformer model using Shifted Windows for pretraining in PyTorch.

View Repository

MAE Training

Implementation of MAE computer vision model in PyTorch for the IPU based on the paper "Masked Autoencoders Are Scalable Vision Learners".

View Repository

Frozen️ in Time Training

Implementation of Frozen in Time on the IPU in PyTorch for joint video and image encoder end-to-end retrieval.

View Repository

Swin Fine-tuning

Swin: Hierarchical Vision Transformer model using Shifted Windows for fine-tuning in PyTorch.

View Repository

UNet Medical Training

U-Net for biomedical image segmentation using TensorFlow 2 Keras for the IPU.

View Repository

UNet Medical Inference

U-Net for biomedical image segmentation using TensorFlow 2 Keras for the IPU.

View Repository

UNet Industrial Training

How to run a UNet Industrial training example with TensorFlow 1 for image segmentation.

View Repository

Mini DALL-E Training

Mini DALL-E Text-to-Image Generation training example with PyTorch for the IPU.

View Repository

TGN Training

TGN: Temporal Graph Networks is a dynamic GNN model for training on the IPU using PyG (PyTorch Geometric)

View Repository

Bellman-Ford networks (NBFnet)

Bellman-Ford networks (NBFnet) is a GNN model used for link prediction in homogeneous and heterogeneous graphs implemented in PyG (PyTorch Geometric)

View Repository

GIN Training

Graph Isomorphism Network (GIN) is used to perform graph classification for molecular property prediction using TensorFlow 2.

View Repository

GIN Training

Graph Isomorphism Network (GIN) is used to perform graph classification for molecular property prediction using PyG (PyTorch Geometric)

View Repository

Cluster-GCN Training

An efficient algorithm for training deep and large Graph Convolutional Networks using TensorFlow 2.

View Repository

SchNet Training

GNN-based model in PyG (PyTorch Geometric) developed for modelling quantum interactions between atoms in a molecule

View Repository

Cluster-GCN Training

An efficient algorithm for training deep and large Graph Convolutional Networks using PyG (PyTorch Geometric)

View Repository

Neural Image Fields Training

Training a neural network model for reconstructing / compressing images in TensorFlow 2.

View Repository

Neural Image Fields Inference

Running inference on a neural network model for reconstructing / compressing images in TensorFlow 2.

View Repository

MCMC Training

Markov Chain Monte Carlo (MCMC) training on IPUs using standard TensorFlow Probability.

View Repository

Deep Voice 3 Training

Text-To-Speech training on IPUs with PopART using a Convolutional Sequence Learning technique.

View Repository

FastSpeech2 Training

FastSpeech2: Fast and High-Quality End-to-End Text to Speech training on IPUs with TensorFlow 2.

View Repository

FastSpeech2 Inference

FastSpeech2: Fast and High-Quality End-to-End Text to Speech inference on IPUs with TensorFlow 2.

View Repository

FastPitch Training

FastPitch: Parallel Text-to-speech with Pitch Prediction using PyTorch.

View Repository

Wav2Vec2 Training

HuggingFace Optimum implementation for training Wav2Vec2-Base - a speech recognition transformer model.

View Repository

wav2vec2 Inference

HuggingFace Optimum implementation for Wav2Vec2-Base inference - a speech recognition transformer model.

View Repository

DeepLOB-Seq2Seq Training

Multi-Horizon Financial Forecasting on IPU using DeepLOB-Seq2Seq - Training with TensorFlow 2

View Repository

DeepLOB-Attention Training

Multi-horizon Financial Forecasting on IPUs using DeepLOB-Attention - Training with TensorFlow 2

View Repository

Transformer Transducer (RNN-T) Training

IPU implementation of the Speech Recognition Model with Transformer Encoders and RNN-T Loss in PopART.

View Repository

DIEN Training

DIEN (Deep Interest Evolution Network) training on IPUs with TensorFlow 1 - a recommendation model for click-through rate prediction.

View Repository

DIEN Inference

DIEN (Deep Interest Evolution Network) inference on IPUs with TensorFlow 1 - a recommendation model for click-through rate prediction.

View Repository

DIN Training

DIN (Deep Interest Network) training on IPUs with TensorFlow 1 - a recommendation model for click-through rate prediction.

View Repository

DIN Inference

DIN (Deep Interest Network) inference on IPUs with TensorFlow 1 - a recommendation model for click-through rate prediction.

View Repository

CosmoFlow Training

A deep learning model for calculating cosmological parameters in TensorFlow 1. The model primarily consists of 3D convolutions, pooling operations, and dense layers.

View Repository

Approximate Bayesian Computation (ABC) COVID-19 Inference

A representative implementation of ABC for Simulation-based Inference for observing data from COVID-19 infections to enable statistical inference using TensorFlow 2.

View Repository

Deep Molecular Dynamics (DeePMD-kit) Training

DeePMD-kit - a deep learning package for many-body potential energy representation and molecular dynamics using TensorFlow 1.

View Repository

Monte Carlo Ray Tracing Inference

Monte Carlo ray tracing application built in Poplar for neural rendering on the IPU.

View Repository

MobileNetv3 Training

MobileNetv3 - Convolutional neural network training for classification, detection and segmentation using PyTorch.

View Repository

MobileNetv2 Inference

MobileNetv2 - Convolutional neural network inference for classification, detection and segmentation using TensorFlow 1.

View Repository

MobileNetv3 Inference

MobileNetv3 - Convolutional neural network inference for classification, detection and segmentation using PyTorch.

View Repository

Autoencoder Training

Custom autoencoder model on the IPU using TensorFlow 1 to train collaborative filtering in recommender systems.

View Repository

Autoencoder Inference

Custom autoencoder inference model on the IPU using TensorFlow 1 to perform collaborative filtering in recommender systems.

View Repository

Contrastive Divergence VAE Training

Train a Variational Autoencoder / Markov Chain Monte Carlo hybrid model on IPUs with TensorFlow 1.

View Repository

Reinforcement Learning Training

How to train a deep reinforcement learning model in TensorFlow 1 on multiple IPUs with synchronous data parallel training.

View Repository

Sales Forecasting Training

How to train a sales forecasting machine learning model with TensorFlow 1 on Graphcore's IPUs.

View Repository

Model Garden

Featured Models

BERT-Large Fine-tuning

Dolly 2.0 Inference

OpenAssistant Pythia 12B Inference

Library

Dolly 2.0 Inference

OpenAssistant Pythia 12B Inference

Whisper Inference

Llama 2 Inference

Stable Diffusion 2 Text-to-Image Inference

Stable Diffusion Text-to-Image Inference

Stable Diffusion Image-to-Image Inference

Stable Diffusion Inpainting Inference

GPT-J 6B Fine-tuning

GPT-J 6B Inference

RGCN Training

GPT-3 Fine-tuning

GPT-3 Inference

GPT2-Large Training

GPT2-Large Inference

GPT2-Medium Training

GPT2-Medium Fine-tuning

GPT2-Medium Inference

GPT2-Small Training

GPT2-Small Fine-tuning

GPT2-Small Inference

Flan-T5-Large/XL Inference

T5-Small Fine-Tuning

MT5-Small Fine-Tuning

MT5-Large Inference

GPS++ Training

GPS++ Inference

Distributed KGE - TransE (256) Training

Distributed KGE - TransE (256) Inference

Distributed KGE - TransE (256) Training

BERT-Large Training

BERT-Large Training

BERT-Large Inference

BERT-Large Training

BERT-Large Training

BERT-Large Inference

BERT-Large Fine-tuning

BERT-Large Pretraining

DistilBERT Training

BERT-Base Training

BERT-Base Training

BERT-Base Training

BERT-Base Training

BERT-Base Inference

BERT-Base Training

BERT-Base Pretraining

BERT-Base Fine-tuning

RoBERTa-Large Training

RoBERTa-Base Fine-tuning

RoBERTa-Base Fine-tuning

LXMERT Fine-tuning

DeBERTa Training

LXMERT Fine-tuning

DeBERTa Inference

HuBERT Training

BART Training

GroupBERT Training

PackedBERT Training

PackedBERT Training

PackedBERT Fine-tuning

PackedBERT Inference

Conformer-Medium Training

CLIP Training

ViT (Vision Transformer) Fine-tuning

ViT (Vision Transformer) Pretraining

ViT (Vision Transformer) Fine-tuning

DINO Training

YOLOv3 Training

YOLOv3 Inference

YOLOv4 Inference

ResNet-50 Training

ResNet-50 Inference

ResNet-50 Training

ResNet-50 Training