flashinfer.topk¶

Efficient Top-K selection kernels.

Top-K Selection¶

`top_k`(input, k[, sorted, deterministic, ...])	Radix-based Top-K selection.
`top_k_page_table_transform`(input, ...[, ...])	Fused Top-K selection + Page Table Transform for sparse attention.
`top_k_ragged_transform`(input, offsets, ...)	Fused Top-K selection + Ragged Index Transform for sparse attention.

Check if the GPU supports enough shared memory for FilteredTopK algorithm.