cuda-matrix-vector-multiplication

Matrix-Vector Multiplication Using Shared and Coalesced Memory Access

The goal of this project is to create a fast and efficient matrix-vector multiplication kernel for GPU computing in CUDA C. Refer to vmp.pdf for a detailed paper describing the algorithms and testing suite.

Name		Name	Last commit message	Last commit date
Latest commit History 4 Commits
Makefile		Makefile
README.md		README.md
gen_gpu.cu		gen_gpu.cu
gen_gpu.h		gen_gpu.h
mult_kernels.cu		mult_kernels.cu
mult_kernels.h		mult_kernels.h
testmain.cu		testmain.cu
transpose_kernel.cu		transpose_kernel.cu
transpose_kernel.h		transpose_kernel.h
vmp.pdf		vmp.pdf
zero_kernels.cu		zero_kernels.cu
zero_kernels.h		zero_kernels.h

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

cuda-matrix-vector-multiplication

About

Releases

Packages

Languages

uysalere/cuda-matrix-vector-multiplication

Folders and files

Latest commit

History

Repository files navigation

cuda-matrix-vector-multiplication

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages