FP8 Quantization using TensorRT

Posted Oct 27, 2024 Updated Apr 23, 2025

FP8 Quantization using TensorRT

By Allen Philip J

views 1 min read

FP8 Quantization using TensorRT

FP8 Quantization with TensorRT

Model Optimization

Calibration Process

Attention Fusion Verification

Verify Fusion in Profiler Output

Optimization, Graph Compilation

This post is licensed under CC BY 4.0 by the author.