kzjeef · Favorites · Ruby China

Member

NO. 13301 / 2014-05-26

0 Topics / 3 Replies

0 Followers

0 Following

0 Favorites

GitHub Public Repos

AxmlParserPY 22

Python AxmlParser
CUDA-Winograd 1

Fast CUDA Kernels for ResNet Inference. Using Winograd algorithm to optimize the efficiency of co...
LeetCUDA 0

📚LeetCUDA: Modern CUDA Learn Notes with PyTorch for Beginners🐑, 200+ CUDA Kernels, Tensor Cores, ...
dash-infer 0

DashInfer is a native LLM inference engine aiming to deliver industry-leading performance atop va...
vllm 0

A high-throughput and memory-efficient inference and serving engine for LLMs
triton-learn 0
quant_kernel_benchmarks 0

Benchmarking code for running quantized kernels from vLLM and other libraries
kzjeef.github.io 0
sglang 0

SGLang is a fast serving framework for large language models and vision language models.
dash-cookbook 0

Receipts for creating AI Applications with APIs from DashScope (and friends)!