#

post-training-quantization

Here are 31 public repositories matching this topic...

smpanaro / norm-tweaking

Post post-training-quantization (PTQ) method for improving LLMs. Unofficial implementation of https://arxiv.org/abs/2309.02784

quantization post-training-quantization ptq llms

Updated Feb 21, 2024
Python

andrea-zanette / HippoScan

A framework to train a ResUNet architecture, quantize, compile and execute it on an FPGA.

fpga keras segmentation pynq alveo tensorflow2 resunet post-training-quantization vitis-ai ultra96v2

Updated Jun 23, 2023
Jupyter Notebook

amikom-gace-research-group / characterize-ptq-tensorrt

Research experiments archive for post-training quantization with TensorRT. Submitted and Accepted to IEEE EDGE 2024

research tensorrt post-training-quantization

Updated Apr 4, 2024
Python

yashmaniya0 / Quantization-of-Image-Classification-Models

Comprehensive study on the quantization of various CNN models, employing techniques such as Post-Training Quantization and Quantization Aware Training (QAT).

quantization-aware-training post-training-quantization

Updated Oct 30, 2023
Jupyter Notebook

generalMG / Medical-Dataset-Deep-Learning-Quantization-Data-Analysis

The repository discusses a research work published on MDPI Sensors and provides details about the project.

image-processing data-visualization classification data-analysis point-of-care medical-image-processing edge-device post-training-quantization

Updated Jun 10, 2022
Python

Rumeysakeskin / ASR-Quantization

Post-training quantization on Nvidia Nemo ASR model

pytorch speech-recognition quantization model-deployment pytorch-lightning post-training-quantization nvidia-nemo

Updated Aug 23, 2023
Jupyter Notebook

likholat / openvino_quantization

This sample shows how to convert TensorFlow model to OpenVINO IR model and how to quantize OpenVINO model.

tensorflow quantization model-acceleration openvino model-optimizer model-conversion post-training-quantization

Updated Oct 6, 2022
Python

TanyaChutani / Quantization_Tensorflow

Quantization for Object Detection in Tensorflow 2.x

object-detection quantization tensorflow2 model-optimization quantization-aware-training post-training-quantization

Updated Jun 8, 2022
Python

OmidGhadami95 / EfficientNetV2_Quantization_CK

EfficientNetV2 (Efficientnetv2-b2) and quantization int8 and fp32 (QAT and PTQ) on CK+ dataset . fine-tuning, augmentation, solving imbalanced dataset, etc.

python tensorflow keras quantization emotion-recognition qat ckplus facial-emotion-recognition scale-down googlecolab efficientnet imbalanced-dataset quantization-aware-training post-training-quantization efficientnetv2 ptq real-time-emotion-classification real-time-emotion-detection efficientnetv2-b2

Updated May 4, 2024
Jupyter Notebook

AndreiZoltan / ptq_resnet20

Low-bit (2/4/8/16) Post Training Quantization for ResNet20

computer-vision pytorch resnet quantization resnet-18 post-training-quantization

Updated Jun 4, 2023
Python

iszry / DI2N-PTQ4DM

Improved the performance of 8-bit PTQ4DM expecially on FID.

diffusion-model post-training-quantization

Updated Aug 30, 2023
Python

ssi-research / eptq

Implementation of EPTQ - an Enhanced Post-Training Quantization algorithm for DNN compression

computer-vision neural-network quantization hessian label-free post-training-quantization

Updated Sep 20, 2023
Python

ModelTC / QLLM

[ICLR 2024] This is the official PyTorch implementation of "QLLM: Accurate and Efficient Low-Bitwidth Quantization for Large Language Models"

transformers pytorch llama quantization post-training-quantization llm llama2

Updated Mar 11, 2024
Python

raj2022 / quantization_prunings

Post-Training quantization perfomed on the model trained with CLIC dataset.

post-training-quantization int8-quantization

Updated Apr 29, 2024
Jupyter Notebook

satya15july / quantization

Model Quantization with Pytorch, Tensorflow & Larq

quantization binarization quantization-aware-training post-training-quantization binarymodel-with-larq

Updated Apr 1, 2023
C++

yester31 / TensorRT_ONNX

Generating tensorrt model using onnx

pytorch quantization tensorrt onnx int8-inference onnxruntime post-training-quantization int8-quantization tensorrt-inference ptq

Updated Jun 22, 2023
C++

zysxmu / FDDA

Pytorch implementation of our paper accepted by ECCV 2022-- Fine-grained Data Distribution Alignment for Post-Training Quantization

acceleration compression post-training-quantization

Updated Sep 13, 2022
Python

yester31 / Quantization_EX

quantization example for pqt & qat

quantization tensorrt int8 qat model-optimization quantization-aware-training post-training-quantization pytorch-quantization ptq

Updated Jul 24, 2023
Python

KwangHoonAn / Quantizations

quantization dfq post-training-quantization data-free-quantization

Updated Apr 6, 2021
Python

ModelTC / TFMQ-DM

[CVPR 2024 Highlight] TFMQ-DM: Temporal Feature Maintenance Quantization for Diffusion Models

highlight quantization cvpr ldm diffusion-models post-training-quantization ddim stable-diffusion cvpr2024

Updated Jun 8, 2024
Jupyter Notebook

Improve this page

Add a description, image, and links to the post-training-quantization topic page so that developers can more easily learn about it.

Curate this topic

Add this topic to your repo

To associate your repository with the post-training-quantization topic, visit your repo's landing page and select "manage topics."