zheyishine

Yao Zhao zheyishine

Achievements

alipay/PainlessInferenceAcceleration alipay/PainlessInferenceAcceleration Public

Accelerate inference without tears

Python 372 22
flash-attention flash-attention Public

Forked from Dao-AILab/flash-attention

Fast and memory-efficient exact attention

Python
inclusionAI/linghe inclusionAI/linghe Public

A high-performance kernel library for LLM training

Python 57 7