doxygen/html/_vk_f_f_t___defs_8h_source.html

#ifndef VKFFT_DEFS_H

#define VKFFT_DEFS_H

#include <vulkan/vulkan.h>


typedef struct {

#if(VKFFT_BACKEND==0)

    VkInstance instance;//a connection between the application and the Vulkan library

    VkPhysicalDevice physicalDevice;//a handle for the graphics card used in the application

    VkPhysicalDeviceProperties physicalDeviceProperties;//bastic device properties

    VkPhysicalDeviceMemoryProperties physicalDeviceMemoryProperties;//bastic memory properties of the device

    VkDevice device;//a logical device, interacting with physical device

    VkDebugUtilsMessengerEXT debugMessenger;//extension for debugging

    uint64_t queueFamilyIndex;//if multiple queues are available, specify the used one

    VkQueue queue;//a place, where all operations are submitted

    VkCommandPool commandPool;//an opaque objects that command buffer memory is allocated from

    VkFence fence;//a vkGPU->fence used to synchronize dispatches

    std::vector<const char*> enabledDeviceExtensions;

    uint64_t enableValidationLayers;

#elif(VKFFT_BACKEND==1)

    CUdevice device;

    CUcontext context;

#elif(VKFFT_BACKEND==2)

    hipDevice_t device;

    hipCtx_t context;

#elif(VKFFT_BACKEND==3)

    cl_platform_id platform;

    cl_device_id device;

    cl_context context;

    cl_command_queue commandQueue;

#endif

    uint64_t device_id;//an id of a device, reported by Vulkan device list

} VkGPU;//an example structure containing Vulkan primitives


typedef struct {

    //WHDCN layout


    //required parameters:

    uint64_t FFTdim; //FFT dimensionality (1, 2 or 3)

    uint64_t size[3]; // WHD -system dimensions


#if(VKFFT_BACKEND==0)

    VkPhysicalDevice* physicalDevice;//pointer to Vulkan physical device, obtained from vkEnumeratePhysicalDevices

    VkDevice* device;//pointer to Vulkan device, created with vkCreateDevice

    VkQueue* queue;//pointer to Vulkan queue, created with vkGetDeviceQueue

    VkCommandPool* commandPool;//pointer to Vulkan command pool, created with vkCreateCommandPool

    VkFence* fence;//pointer to Vulkan fence, created with vkCreateFence

    uint64_t isCompilerInitialized;//specify if glslang compiler has been intialized before (0 - off, 1 - on). Default 0

#elif(VKFFT_BACKEND==1)

    CUdevice* device;//pointer to CUDA device, obtained from cuDeviceGet

    //CUcontext* context;//pointer to CUDA context, obtained from cuDeviceGet

    cudaStream_t* stream;//pointer to streams (can be more than 1), where to execute the kernels

    uint64_t num_streams;//try to submit CUDA kernels in multiple streams for asynchronous execution. Default 1

#elif(VKFFT_BACKEND==2)

    hipDevice_t* device;//pointer to HIP device, obtained from hipDeviceGet

    //hipCtx_t* context;//pointer to HIP context, obtained from hipDeviceGet

    hipStream_t* stream;//pointer to streams (can be more than 1), where to execute the kernels

    uint64_t num_streams;//try to submit HIP kernels in multiple streams for asynchronous execution. Default 1

#elif(VKFFT_BACKEND==3)

    cl_platform_id* platform;

    cl_device_id* device;

    cl_context* context;

#endif


    //data parameters:

    uint64_t userTempBuffer; //buffer allocated by app automatically if needed to reorder Four step algorithm. Setting to non zero value enables manual user allocation (0 - off, 1 - on)


    uint64_t bufferNum;//multiple buffer sequence storage is Vulkan only. Default 1

    uint64_t tempBufferNum;//multiple buffer sequence storage is Vulkan only. Default 1, buffer allocated by app automatically if needed to reorder Four step algorithm. Setting to non zero value enables manual user allocation

    uint64_t inputBufferNum;//multiple buffer sequence storage is Vulkan only. Default 1, if isInputFormatted is enabled

    uint64_t outputBufferNum;//multiple buffer sequence storage is Vulkan only. Default 1, if isOutputFormatted is enabled

    uint64_t kernelNum;//multiple buffer sequence storage is Vulkan only. Default 1, if performConvolution is enabled


    //sizes are obligatory in Vulkan backend, optional in others

    uint64_t* bufferSize;//array of buffers sizes in bytes

    uint64_t* tempBufferSize;//array of temp buffers sizes in bytes. Default set to bufferSize sum, buffer allocated by app automatically if needed to reorder Four step algorithm. Setting to non zero value enables manual user allocation

    uint64_t* inputBufferSize;//array of input buffers sizes in bytes, if isInputFormatted is enabled

    uint64_t* outputBufferSize;//array of output buffers sizes in bytes, if isOutputFormatted is enabled

    uint64_t* kernelSize;//array of kernel buffers sizes in bytes, if performConvolution is enabled


#if(VKFFT_BACKEND==0)

    VkBuffer* buffer;//pointer to array of buffers (or one buffer) used for computations

    VkBuffer* tempBuffer;//needed if reorderFourStep is enabled to transpose the array. Same sum size or bigger as buffer (can be split in multiple). Default 0. Setting to non zero value enables manual user allocation

    VkBuffer* inputBuffer;//pointer to array of input buffers (or one buffer) used to read data from if isInputFormatted is enabled

    VkBuffer* outputBuffer;//pointer to array of output buffers (or one buffer) used for write data to if isOutputFormatted is enabled

    VkBuffer* kernel;//pointer to array of kernel buffers (or one buffer) used for read kernel data from if performConvolution is enabled

#elif(VKFFT_BACKEND==1)

    void** buffer;//pointer to device buffer used for computations

    void** tempBuffer;//needed if reorderFourStep is enabled to transpose the array. Same size as buffer. Default 0. Setting to non zero value enables manual user allocation

    void** inputBuffer;//pointer to device buffer used to read data from if isInputFormatted is enabled

    void** outputBuffer;//pointer to device buffer used to read data from if isOutputFormatted is enabled

    void** kernel;//pointer to device buffer used to read kernel data from if performConvolution is enabled

#elif(VKFFT_BACKEND==2)

    void** buffer;//pointer to device buffer used for computations

    void** tempBuffer;//needed if reorderFourStep is enabled to transpose the array. Same size as buffer. Default 0. Setting to non zero value enables manual user allocation

    void** inputBuffer;//pointer to device buffer used to read data from if isInputFormatted is enabled

    void** outputBuffer;//pointer to device buffer used to read data from if isOutputFormatted is enabled

    void** kernel;//pointer to device buffer used to read kernel data from if performConvolution is enabled

#elif(VKFFT_BACKEND==3)

    cl_mem* buffer;//pointer to device buffer used for computations

    cl_mem* tempBuffer;//needed if reorderFourStep is enabled to transpose the array. Same size as buffer. Default 0. Setting to non zero value enables manual user allocation

    cl_mem* inputBuffer;//pointer to device buffer used to read data from if isInputFormatted is enabled

    cl_mem* outputBuffer;//pointer to device buffer used to read data from if isOutputFormatted is enabled

    cl_mem* kernel;//pointer to device buffer used to read kernel data from if performConvolution is enabled

#endif

    uint64_t bufferOffset;//specify if VkFFT has to offset the first element position inside the buffer. In bytes. Default 0

    uint64_t tempBufferOffset;//specify if VkFFT has to offset the first element position inside the temp buffer. In bytes. Default 0

    uint64_t inputBufferOffset;//specify if VkFFT has to offset the first element position inside the input buffer. In bytes. Default 0

    uint64_t outputBufferOffset;//specify if VkFFT has to offset the first element position inside the output buffer. In bytes. Default 0

    uint64_t kernelOffset;//specify if VkFFT has to offset the first element position inside the kernel. In bytes. Default 0


    //optional: (default 0 if not stated otherwise)

    uint64_t coalescedMemory;//in bytes, for Nvidia and AMD is equal to 32, Intel is equal 64, scaled for half precision. Gonna work regardles, but if specified by user correctly, the performance will be higher.

    uint64_t aimThreads;//aim at this many threads per block. Default 128

    uint64_t numSharedBanks;//how many banks shared memory has. Default 32

    uint64_t inverseReturnToInputBuffer;//return data to the input buffer in inverse transform (0 - off, 1 - on). isInputFormatted must be enabled

    uint64_t numberBatches;// N - used to perform multiple batches of initial data. Default 1

    uint64_t useUint64;//use 64-bit addressing mode in generated kernels

    uint64_t omitDimension[3];//disable FFT for this dimension (0 - FFT enabled, 1 - FFT disabled). Default 0. Doesn't work for R2C dimension 0 for now. Doesn't work with convolutions.

    uint64_t fixMaxRadixBluestein;//controls the padding of sequences in Bluestein convolution. If specified, padded sequence will be made of up to fixMaxRadixBluestein primes. Default: 2 for CUDA and Vulkan/OpenCL/HIP up to 1048576 combined dimension FFT system, 7 for Vulkan/OpenCL/HIP past after. Min = 2, Max = 13.

    uint64_t performBandwidthBoost;//try to reduce coalsesced number by a factor of X to get bigger sequence in one upload for strided axes. Default: -1 for DCT, 2 for Bluestein's algorithm (or -1 if DCT), 0 otherwise


    uint64_t doublePrecision; //perform calculations in double precision (0 - off, 1 - on).

    uint64_t halfPrecision; //perform calculations in half precision (0 - off, 1 - on)

    uint64_t halfPrecisionMemoryOnly; //use half precision only as input/output buffer. Input/Output have to be allocated as half, buffer/tempBuffer have to be allocated as float (out of place mode only). Specify isInputFormatted and isOutputFormatted to use (0 - off, 1 - on)

    uint64_t doublePrecisionFloatMemory; //use FP64 precision for all calculations, while all memory storage is done in FP32.


    uint64_t performR2C; //perform R2C/C2R decomposition (0 - off, 1 - on)

    uint64_t performDCT; //perform DCT transformation (X - DCT type, 1-4)

    uint64_t disableMergeSequencesR2C; //disable merging of two real sequences to reduce calculations (0 - off, 1 - on)

    uint64_t normalize; //normalize inverse transform (0 - off, 1 - on)

    uint64_t disableReorderFourStep; // disables unshuffling of Four step algorithm. Requires tempbuffer allocation (0 - off, 1 - on)

    uint64_t useLUT; //switches from calculating sincos to using precomputed LUT tables (0 - off, 1 - on). Configured by initialization routine

    uint64_t makeForwardPlanOnly; //generate code only for forward FFT (0 - off, 1 - on)

    uint64_t makeInversePlanOnly; //generate code only for inverse FFT (0 - off, 1 - on)


    uint64_t bufferStride[3];//buffer strides - default set to x - x*y - x*y*z values

    uint64_t isInputFormatted; //specify if input buffer is padded - 0 - padded, 1 - not padded. For example if it is not padded for R2C if out-of-place mode is selected (only if numberBatches==1 and numberKernels==1)

    uint64_t isOutputFormatted; //specify if output buffer is padded - 0 - padded, 1 - not padded. For example if it is not padded for R2C if out-of-place mode is selected (only if numberBatches==1 and numberKernels==1)

    uint64_t inputBufferStride[3];//input buffer strides. Used if isInputFormatted is enabled. Default set to bufferStride values

    uint64_t outputBufferStride[3];//output buffer strides. Used if isInputFormatted is enabled. Default set to bufferStride values


    uint64_t considerAllAxesStrided;//will create plan for nonstrided axis similar as a strided axis - used with disableReorderFourStep to get the same layout for Bluestein kernel (0 - off, 1 - on)

    uint64_t keepShaderCode;//will keep shader code and print all executed shaders during the plan execution in order (0 - off, 1 - on)

    uint64_t printMemoryLayout;//will print order of buffers used in shaders (0 - off, 1 - on)


    //optional zero padding control parameters: (default 0 if not stated otherwise)

    uint64_t performZeropadding[3]; // don't read some data/perform computations if some input sequences are zeropadded for each axis (0 - off, 1 - on)

    uint64_t fft_zeropad_left[3];//specify start boundary of zero block in the system for each axis

    uint64_t fft_zeropad_right[3];//specify end boundary of zero block in the system for each axis

    uint64_t frequencyZeroPadding; //set to 1 if zeropadding of frequency domain, default 0 - spatial zeropadding


    //optional convolution control parameters: (default 0 if not stated otherwise)

    uint64_t performConvolution; //perform convolution in this application (0 - off, 1 - on). Disables reorderFourStep parameter

    uint64_t conjugateConvolution;//0 off, 1 - conjugation of the sequence FFT is currently done on, 2 - conjugation of the convolution kernel

    uint64_t crossPowerSpectrumNormalization;//normalize the FFT x kernel multiplication in frequency domain

    uint64_t coordinateFeatures; // C - coordinate, or dimension of features vector. In matrix convolution - size of vector

    uint64_t matrixConvolution; //if equal to 2 perform 2x2, if equal to 3 perform 3x3 matrix-vector convolution. Overrides coordinateFeatures

    uint64_t symmetricKernel; //specify if kernel in 2x2 or 3x3 matrix convolution is symmetric

    uint64_t numberKernels;// N - only used in convolution step - specify how many kernels were initialized before. Expands one input to multiple (batched) output

    uint64_t kernelConvolution;// specify if this application is used to create kernel for convolution, so it has the same properties. performConvolution has to be set to 0 for kernel creation


    //register overutilization (experimental): (default 0 if not stated otherwise)

    uint64_t registerBoost; //specify if register file size is bigger than shared memory and can be used to extend it X times (on Nvidia 256KB register file can be used instead of 32KB of shared memory, set this constant to 4 to emulate 128KB of shared memory). Default 1

    uint64_t registerBoostNonPow2; //specify if register overutilization should be used on non power of 2 sequences (0 - off, 1 - on)

    uint64_t registerBoost4Step; //specify if register file overutilization should be used in big sequences (>2^14), same definition as registerBoost. Default 1


    //not used techniques:

    uint64_t swapTo3Stage4Step; //specify at which power of 2 to switch from 2 upload to 3 upload 4-step FFT, in case if making max sequence size lower than coalesced sequence helps to combat TLB misses. Default 0 - disabled. Must be at least 17

    uint64_t devicePageSize;//in KB, the size of a page on the GPU. Setting to 0 disables local buffer split in pages

    uint64_t localPageSize;//in KB, the size to split page into if sequence spans multiple devicePageSize pages


    //automatically filled based on device info (still can be reconfigured by user):

    uint64_t maxComputeWorkGroupCount[3]; // maxComputeWorkGroupCount from VkPhysicalDeviceLimits

    uint64_t maxComputeWorkGroupSize[3]; // maxComputeWorkGroupCount from VkPhysicalDeviceLimits

    uint64_t maxThreadsNum; //max number of threads from VkPhysicalDeviceLimits

    uint64_t sharedMemorySizeStatic; //available for static allocation shared memory size, in bytes

    uint64_t sharedMemorySize; //available for allocation shared memory size, in bytes

    uint64_t sharedMemorySizePow2; //power of 2 which is less or equal to sharedMemorySize, in bytes

    uint64_t warpSize; //number of threads per warp/wavefront.

    uint64_t halfThreads;//Intel fix

    uint64_t allocateTempBuffer; //buffer allocated by app automatically if needed to reorder Four step algorithm. Parameter to check if it has been allocated

    uint64_t reorderFourStep; // unshuffle Four step algorithm. Requires tempbuffer allocation (0 - off, 1 - on). Default 1.

    int64_t maxCodeLength; //specify how big can be buffer used for code generation (in char). Default 1000000 chars.

    int64_t maxTempLength; //specify how big can be buffer used for intermediate string sprintfs be (in char). Default 5000 chars. If code segfaults for some reason - try increasing this number.

#if(VKFFT_BACKEND==0)

    VkDeviceMemory tempBufferDeviceMemory;//Filled at app creation

    VkCommandBuffer* commandBuffer;//Filled at app execution

    VkMemoryBarrier* memory_barrier;//Filled at app creation

#elif(VKFFT_BACKEND==1)

    cudaEvent_t* stream_event;//Filled at app creation

    uint64_t streamCounter;//Filled at app creation

    uint64_t streamID;//Filled at app creation

#elif(VKFFT_BACKEND==2)

    hipEvent_t* stream_event;//Filled at app creation

    uint64_t streamCounter;//Filled at app creation

    uint64_t streamID;//Filled at app creation

#elif(VKFFT_BACKEND==3)

    cl_command_queue* commandQueue;

#endif

} VkFFTConfiguration;//parameters specified at plan creation


typedef struct {

#if(VKFFT_BACKEND==0)

    VkCommandBuffer* commandBuffer;//commandBuffer to which FFT is appended


    VkBuffer* buffer;//pointer to array of buffers (or one buffer) used for computations

    VkBuffer* tempBuffer;//needed if reorderFourStep is enabled to transpose the array. Same sum size or bigger as buffer (can be split in multiple). Default 0. Setting to non zero value enables manual user allocation

    VkBuffer* inputBuffer;//pointer to array of input buffers (or one buffer) used to read data from if isInputFormatted is enabled

    VkBuffer* outputBuffer;//pointer to array of output buffers (or one buffer) used for write data to if isOutputFormatted is enabled

    VkBuffer* kernel;//pointer to array of kernel buffers (or one buffer) used for read kernel data from if performConvolution is enabled

#elif(VKFFT_BACKEND==1)

    void** buffer;//pointer to device buffer used for computations

    void** tempBuffer;//needed if reorderFourStep is enabled to transpose the array. Same size as buffer. Default 0. Setting to non zero value enables manual user allocation

    void** inputBuffer;//pointer to device buffer used to read data from if isInputFormatted is enabled

    void** outputBuffer;//pointer to device buffer used to read data from if isOutputFormatted is enabled

    void** kernel;//pointer to device buffer used to read kernel data from if performConvolution is enabled

#elif(VKFFT_BACKEND==2)

    void** buffer;//pointer to device buffer used for computations

    void** tempBuffer;//needed if reorderFourStep is enabled to transpose the array. Same size as buffer. Default 0. Setting to non zero value enables manual user allocation

    void** inputBuffer;//pointer to device buffer used to read data from if isInputFormatted is enabled

    void** outputBuffer;//pointer to device buffer used to read data from if isOutputFormatted is enabled

    void** kernel;//pointer to device buffer used to read kernel data from if performConvolution is enabled

#elif(VKFFT_BACKEND==3)

    cl_command_queue* commandQueue;//commandBuffer to which FFT is appended


    cl_mem* buffer;//pointer to device buffer used for computations

    cl_mem* tempBuffer;//needed if reorderFourStep is enabled to transpose the array. Same size as buffer. Default 0. Setting to non zero value enables manual user allocation

    cl_mem* inputBuffer;//pointer to device buffer used to read data from if isInputFormatted is enabled

    cl_mem* outputBuffer;//pointer to device buffer used to read data from if isOutputFormatted is enabled

    cl_mem* kernel;//pointer to device buffer used to read kernel data from if performConvolution is enabled

#endif

} VkFFTLaunchParams;//parameters specified at plan execution


typedef enum VkFFTResult {

    VKFFT_SUCCESS = 0,

    VKFFT_ERROR_MALLOC_FAILED = 1,

    VKFFT_ERROR_INSUFFICIENT_CODE_BUFFER = 2,

    VKFFT_ERROR_INSUFFICIENT_TEMP_BUFFER = 3,

    VKFFT_ERROR_PLAN_NOT_INITIALIZED = 4,

    VKFFT_ERROR_NULL_TEMP_PASSED = 5,

    VKFFT_ERROR_INVALID_PHYSICAL_DEVICE = 1001,

    VKFFT_ERROR_INVALID_DEVICE = 1002,

    VKFFT_ERROR_INVALID_QUEUE = 1003,

    VKFFT_ERROR_INVALID_COMMAND_POOL = 1004,

    VKFFT_ERROR_INVALID_FENCE = 1005,

    VKFFT_ERROR_ONLY_FORWARD_FFT_INITIALIZED = 1006,

    VKFFT_ERROR_ONLY_INVERSE_FFT_INITIALIZED = 1007,

    VKFFT_ERROR_INVALID_CONTEXT = 1008,

    VKFFT_ERROR_INVALID_PLATFORM = 1009,

    VKFFT_ERROR_EMPTY_FFTdim = 2001,

    VKFFT_ERROR_EMPTY_size = 2002,

    VKFFT_ERROR_EMPTY_bufferSize = 2003,

    VKFFT_ERROR_EMPTY_buffer = 2004,

    VKFFT_ERROR_EMPTY_tempBufferSize = 2005,

    VKFFT_ERROR_EMPTY_tempBuffer = 2006,

    VKFFT_ERROR_EMPTY_inputBufferSize = 2007,

    VKFFT_ERROR_EMPTY_inputBuffer = 2008,

    VKFFT_ERROR_EMPTY_outputBufferSize = 2009,

    VKFFT_ERROR_EMPTY_outputBuffer = 2010,

    VKFFT_ERROR_EMPTY_kernelSize = 2011,

    VKFFT_ERROR_EMPTY_kernel = 2012,

    VKFFT_ERROR_UNSUPPORTED_RADIX = 3001,

    VKFFT_ERROR_UNSUPPORTED_FFT_LENGTH = 3002,

    VKFFT_ERROR_UNSUPPORTED_FFT_LENGTH_R2C = 3003,

    VKFFT_ERROR_UNSUPPORTED_FFT_LENGTH_DCT = 3004,

    VKFFT_ERROR_UNSUPPORTED_FFT_OMIT = 3005,

    VKFFT_ERROR_FAILED_TO_ALLOCATE = 4001,

    VKFFT_ERROR_FAILED_TO_MAP_MEMORY = 4002,

    VKFFT_ERROR_FAILED_TO_ALLOCATE_COMMAND_BUFFERS = 4003,

    VKFFT_ERROR_FAILED_TO_BEGIN_COMMAND_BUFFER = 4004,

    VKFFT_ERROR_FAILED_TO_END_COMMAND_BUFFER = 4005,

    VKFFT_ERROR_FAILED_TO_SUBMIT_QUEUE = 4006,

    VKFFT_ERROR_FAILED_TO_WAIT_FOR_FENCES = 4007,

    VKFFT_ERROR_FAILED_TO_RESET_FENCES = 4008,

    VKFFT_ERROR_FAILED_TO_CREATE_DESCRIPTOR_POOL = 4009,

    VKFFT_ERROR_FAILED_TO_CREATE_DESCRIPTOR_SET_LAYOUT = 4010,

    VKFFT_ERROR_FAILED_TO_ALLOCATE_DESCRIPTOR_SETS = 4011,

    VKFFT_ERROR_FAILED_TO_CREATE_PIPELINE_LAYOUT = 4012,

    VKFFT_ERROR_FAILED_SHADER_PREPROCESS = 4013,

    VKFFT_ERROR_FAILED_SHADER_PARSE = 4014,

    VKFFT_ERROR_FAILED_SHADER_LINK = 4015,

    VKFFT_ERROR_FAILED_SPIRV_GENERATE = 4016,

    VKFFT_ERROR_FAILED_TO_CREATE_SHADER_MODULE = 4017,

    VKFFT_ERROR_FAILED_TO_CREATE_INSTANCE = 4018,

    VKFFT_ERROR_FAILED_TO_SETUP_DEBUG_MESSENGER = 4019,

    VKFFT_ERROR_FAILED_TO_FIND_PHYSICAL_DEVICE = 4020,

    VKFFT_ERROR_FAILED_TO_CREATE_DEVICE = 4021,

    VKFFT_ERROR_FAILED_TO_CREATE_FENCE = 4022,

    VKFFT_ERROR_FAILED_TO_CREATE_COMMAND_POOL = 4023,

    VKFFT_ERROR_FAILED_TO_CREATE_BUFFER = 4024,

    VKFFT_ERROR_FAILED_TO_ALLOCATE_MEMORY = 4025,

    VKFFT_ERROR_FAILED_TO_BIND_BUFFER_MEMORY = 4026,

    VKFFT_ERROR_FAILED_TO_FIND_MEMORY = 4027,

    VKFFT_ERROR_FAILED_TO_SYNCHRONIZE = 4028,

    VKFFT_ERROR_FAILED_TO_COPY = 4029,

    VKFFT_ERROR_FAILED_TO_CREATE_PROGRAM = 4030,

    VKFFT_ERROR_FAILED_TO_COMPILE_PROGRAM = 4031,

    VKFFT_ERROR_FAILED_TO_GET_CODE_SIZE = 4032,

    VKFFT_ERROR_FAILED_TO_GET_CODE = 4033,

    VKFFT_ERROR_FAILED_TO_DESTROY_PROGRAM = 4034,

    VKFFT_ERROR_FAILED_TO_LOAD_MODULE = 4035,

    VKFFT_ERROR_FAILED_TO_GET_FUNCTION = 4036,

    VKFFT_ERROR_FAILED_TO_SET_DYNAMIC_SHARED_MEMORY = 4037,

    VKFFT_ERROR_FAILED_TO_MODULE_GET_GLOBAL = 4038,

    VKFFT_ERROR_FAILED_TO_LAUNCH_KERNEL = 4039,

    VKFFT_ERROR_FAILED_TO_EVENT_RECORD = 4040,

    VKFFT_ERROR_FAILED_TO_ADD_NAME_EXPRESSION = 4041,

    VKFFT_ERROR_FAILED_TO_INITIALIZE = 4042,

    VKFFT_ERROR_FAILED_TO_SET_DEVICE_ID = 4043,

    VKFFT_ERROR_FAILED_TO_GET_DEVICE = 4044,

    VKFFT_ERROR_FAILED_TO_CREATE_CONTEXT = 4045,

    VKFFT_ERROR_FAILED_TO_CREATE_PIPELINE = 4046,

    VKFFT_ERROR_FAILED_TO_SET_KERNEL_ARG = 4047,

    VKFFT_ERROR_FAILED_TO_CREATE_COMMAND_QUEUE = 4048,

    VKFFT_ERROR_FAILED_TO_RELEASE_COMMAND_QUEUE = 4049,

    VKFFT_ERROR_FAILED_TO_ENUMERATE_DEVICES = 4050,

    VKFFT_ERROR_FAILED_TO_GET_ATTRIBUTE = 4051,

    VKFFT_ERROR_FAILED_TO_CREATE_EVENT = 4052

} VkFFTResult;


typedef struct {

    uint64_t size[3];

    uint64_t localSize[3];

    uint64_t sourceFFTSize;

    uint64_t fftDim;

    uint64_t inverse;

    uint64_t actualInverse;

    uint64_t inverseBluestein;

    uint64_t zeropad[2];

    uint64_t zeropadBluestein[2];

    uint64_t axis_id;

    uint64_t axis_upload_id;

    uint64_t numAxisUploads;

    uint64_t registers_per_thread;

    uint64_t registers_per_thread_per_radix[14];

    uint64_t min_registers_per_thread;

    uint64_t readToRegisters;

    uint64_t writeFromRegisters;

    uint64_t LUT;

    uint64_t useBluesteinFFT;

    uint64_t reverseBluesteinMultiUpload;

    uint64_t BluesteinConvolutionStep;

    uint64_t BluesteinPreMultiplication;

    uint64_t BluesteinPostMultiplication;

    uint64_t startDCT3LUT;

    uint64_t startDCT4LUT;

    uint64_t performR2C;

    uint64_t performR2CmultiUpload;

    uint64_t performDCT;

    uint64_t performBandwidthBoost;

    uint64_t frequencyZeropadding;

    uint64_t performZeropaddingFull[3]; // don't do read/write if full sequence is omitted

    uint64_t performZeropaddingInput[3]; // don't read if input is zeropadded (0 - off, 1 - on)

    uint64_t performZeropaddingOutput[3]; // don't write if output is zeropadded (0 - off, 1 - on)

    uint64_t fft_zeropad_left_full[3];

    uint64_t fft_zeropad_left_read[3];

    uint64_t fft_zeropad_left_write[3];

    uint64_t fft_zeropad_right_full[3];

    uint64_t fft_zeropad_right_read[3];

    uint64_t fft_zeropad_right_write[3];

    uint64_t fft_zeropad_Bluestein_left_read[3];

    uint64_t fft_zeropad_Bluestein_left_write[3];

    uint64_t fft_zeropad_Bluestein_right_read[3];

    uint64_t fft_zeropad_Bluestein_right_write[3];

    uint64_t inputStride[5];

    uint64_t outputStride[5];

    uint64_t fft_dim_full;

    uint64_t stageStartSize;

    uint64_t firstStageStartSize;

    uint64_t fft_dim_x;

    uint64_t dispatchZactualFFTSize;

    uint64_t numStages;

    uint64_t stageRadix[20];

    uint64_t inputOffset;

    uint64_t kernelOffset;

    uint64_t outputOffset;

    uint64_t reorderFourStep;

    uint64_t performWorkGroupShift[3];

    uint64_t inputBufferBlockNum;

    uint64_t inputBufferBlockSize;

    uint64_t outputBufferBlockNum;

    uint64_t outputBufferBlockSize;

    uint64_t kernelBlockNum;

    uint64_t kernelBlockSize;

    uint64_t numCoordinates;

    uint64_t matrixConvolution; //if equal to 2 perform 2x2, if equal to 3 perform 3x3 matrix-vector convolution. Overrides coordinateFeatures

    uint64_t numBatches;

    uint64_t numKernels;

    uint64_t conjugateConvolution;

    uint64_t crossPowerSpectrumNormalization;

    uint64_t usedSharedMemory;

    uint64_t sharedMemSize;

    uint64_t sharedMemSizePow2;

    uint64_t normalize;

    uint64_t complexSize;

    uint64_t inputNumberByteSize;

    uint64_t outputNumberByteSize;

    uint64_t kernelNumberByteSize;

    uint64_t maxStageSumLUT;

    uint64_t unroll;

    uint64_t convolutionStep;

    uint64_t symmetricKernel;

    uint64_t supportAxis;

    uint64_t cacheShuffle;

    uint64_t registerBoost;

    uint64_t warpSize;

    uint64_t numSharedBanks;

    uint64_t resolveBankConflictFirstStages;

    uint64_t sharedStrideBankConflictFirstStages;

    uint64_t sharedStrideReadWriteConflict;

    uint64_t maxSharedStride;

    uint64_t axisSwapped;

    uint64_t mergeSequencesR2C;


    uint64_t numBuffersBound[6];

    uint64_t convolutionBindingID;

    uint64_t LUTBindingID;

    uint64_t BluesteinConvolutionBindingID;

    uint64_t BluesteinMultiplicationBindingID;


    uint64_t performBufferSetUpdate;

    uint64_t useUint64;

    char** regIDs;

    char* disableThreadsStart;

    char* disableThreadsEnd;

    char sdataID[50];

    char inoutID[50];

    char combinedID[50];

    char gl_LocalInvocationID_x[50];

    char gl_LocalInvocationID_y[50];

    char gl_LocalInvocationID_z[50];

    char gl_GlobalInvocationID_x[200];

    char gl_GlobalInvocationID_y[200];

    char gl_GlobalInvocationID_z[200];

    char tshuffle[50];

    char sharedStride[50];

    char gl_WorkGroupSize_x[50];

    char gl_WorkGroupSize_y[50];

    char gl_WorkGroupSize_z[50];

    char gl_WorkGroupID_x[50];

    char gl_WorkGroupID_y[50];

    char gl_WorkGroupID_z[50];

    char tempReg[50];

    char stageInvocationID[50];

    char blockInvocationID[50];

    char temp[50];

    char w[50];

    char iw[50];

    char locID[13][40];

    char* code0;

    char* output;

    char* tempStr;

    int64_t tempLen;

    int64_t currentLen;

    int64_t maxCodeLength;

    int64_t maxTempLength;

} VkFFTSpecializationConstantsLayout;


typedef struct {

    uint32_t workGroupShift[3];

} VkFFTPushConstantsLayoutUint32;


typedef struct {

    uint64_t workGroupShift[3];

} VkFFTPushConstantsLayoutUint64;


typedef struct {

    uint64_t numBindings;

    uint64_t axisBlock[4];

    uint64_t groupedBatch;

    VkFFTSpecializationConstantsLayout specializationConstants;

    VkFFTPushConstantsLayoutUint32 pushConstantsUint32;

    VkFFTPushConstantsLayoutUint64 pushConstants;

    uint64_t updatePushConstants;

#if(VKFFT_BACKEND==0)

    VkBuffer* inputBuffer;

    VkBuffer* outputBuffer;

    VkDescriptorPool descriptorPool;

    VkDescriptorSetLayout descriptorSetLayout;

    VkDescriptorSet descriptorSet;

    VkPipelineLayout pipelineLayout;

    VkPipeline pipeline;

    VkDeviceMemory bufferLUTDeviceMemory;

    VkBuffer bufferLUT;

    VkDeviceMemory* bufferBluesteinDeviceMemory;

    VkDeviceMemory* bufferBluesteinFFTDeviceMemory;

    VkBuffer* bufferBluestein;

    VkBuffer* bufferBluesteinFFT;

#elif(VKFFT_BACKEND==1)

    void** inputBuffer;

    void** outputBuffer;

    CUmodule VkFFTModule;

    CUfunction VkFFTKernel;

    void* bufferLUT;

    CUdeviceptr consts_addr;

    void** bufferBluestein;

    void** bufferBluesteinFFT;

#elif(VKFFT_BACKEND==2)

    void** inputBuffer;

    void** outputBuffer;

    hipModule_t VkFFTModule;

    hipFunction_t VkFFTKernel;

    void* bufferLUT;

    hipDeviceptr_t consts_addr;

    void** bufferBluestein;

    void** bufferBluesteinFFT;

#elif(VKFFT_BACKEND==3)

    cl_mem* inputBuffer;

    cl_mem* outputBuffer;

    cl_program  program;

    cl_kernel kernel;

    cl_mem bufferLUT;

    cl_mem* bufferBluestein;

    cl_mem* bufferBluesteinFFT;

#endif

    uint64_t bufferLUTSize;

    uint64_t referenceLUT;

} VkFFTAxis;


typedef struct {

    uint64_t actualFFTSizePerAxis[3][3];

    uint64_t numAxisUploads[3];

    uint64_t axisSplit[3][4];

    VkFFTAxis axes[3][4];


    uint64_t multiUploadR2C;

    uint64_t actualPerformR2CPerAxis[3]; // automatically specified, shows if R2C is actually performed or inside FFT or as a separate step

    VkFFTAxis R2Cdecomposition;

    VkFFTAxis inverseBluesteinAxes[3][4];

} VkFFTPlan;


typedef struct {

    VkFFTConfiguration configuration;

    VkFFTPlan* localFFTPlan;

    VkFFTPlan* localFFTPlan_inverse; //additional inverse plan


    uint64_t actualNumBatches;

    uint64_t firstAxis;

    uint64_t lastAxis;

    //Bluestein buffers reused among plans

    uint64_t useBluesteinFFT[3];

#if(VKFFT_BACKEND==0)

    VkDeviceMemory bufferBluesteinDeviceMemory[3];

    VkDeviceMemory bufferBluesteinFFTDeviceMemory[3];

    VkDeviceMemory bufferBluesteinIFFTDeviceMemory[3];

    VkBuffer bufferBluestein[3];

    VkBuffer bufferBluesteinFFT[3];

    VkBuffer bufferBluesteinIFFT[3];

#elif(VKFFT_BACKEND==1)

    void* bufferBluestein[3];

    void* bufferBluesteinFFT[3];

    void* bufferBluesteinIFFT[3];

#elif(VKFFT_BACKEND==2)

    void* bufferBluestein[3];

    void* bufferBluesteinFFT[3];

    void* bufferBluesteinIFFT[3];

#elif(VKFFT_BACKEND==3)

    cl_mem bufferBluestein[3];

    cl_mem bufferBluesteinFFT[3];

    cl_mem bufferBluesteinIFFT[3];

#endif

    uint64_t bufferBluesteinSize[3];

} VkFFTApplication;


#endif

VkFFTResult
VkFFTResult
Definition VkFFT_Defs.h:232

VKFFT_ERROR_EMPTY_inputBuffer
@ VKFFT_ERROR_EMPTY_inputBuffer
Definition VkFFT_Defs.h:255

VKFFT_ERROR_FAILED_TO_CREATE_PROGRAM
@ VKFFT_ERROR_FAILED_TO_CREATE_PROGRAM
Definition VkFFT_Defs.h:294

VKFFT_ERROR_FAILED_TO_RELEASE_COMMAND_QUEUE
@ VKFFT_ERROR_FAILED_TO_RELEASE_COMMAND_QUEUE
Definition VkFFT_Defs.h:313

VKFFT_ERROR_FAILED_TO_GET_FUNCTION
@ VKFFT_ERROR_FAILED_TO_GET_FUNCTION
Definition VkFFT_Defs.h:300

VKFFT_ERROR_INVALID_FENCE
@ VKFFT_ERROR_INVALID_FENCE
Definition VkFFT_Defs.h:243

VKFFT_ERROR_UNSUPPORTED_FFT_LENGTH
@ VKFFT_ERROR_UNSUPPORTED_FFT_LENGTH
Definition VkFFT_Defs.h:261

VKFFT_ERROR_FAILED_TO_ALLOCATE_MEMORY
@ VKFFT_ERROR_FAILED_TO_ALLOCATE_MEMORY
Definition VkFFT_Defs.h:289

VKFFT_ERROR_INVALID_PLATFORM
@ VKFFT_ERROR_INVALID_PLATFORM
Definition VkFFT_Defs.h:247

VKFFT_ERROR_FAILED_TO_RESET_FENCES
@ VKFFT_ERROR_FAILED_TO_RESET_FENCES
Definition VkFFT_Defs.h:272

VKFFT_ERROR_UNSUPPORTED_RADIX
@ VKFFT_ERROR_UNSUPPORTED_RADIX
Definition VkFFT_Defs.h:260

VKFFT_ERROR_FAILED_TO_CREATE_CONTEXT
@ VKFFT_ERROR_FAILED_TO_CREATE_CONTEXT
Definition VkFFT_Defs.h:309

VKFFT_ERROR_FAILED_TO_COPY
@ VKFFT_ERROR_FAILED_TO_COPY
Definition VkFFT_Defs.h:293

VKFFT_ERROR_FAILED_SHADER_PREPROCESS
@ VKFFT_ERROR_FAILED_SHADER_PREPROCESS
Definition VkFFT_Defs.h:277

VKFFT_ERROR_EMPTY_FFTdim
@ VKFFT_ERROR_EMPTY_FFTdim
Definition VkFFT_Defs.h:248

VKFFT_ERROR_EMPTY_kernel
@ VKFFT_ERROR_EMPTY_kernel
Definition VkFFT_Defs.h:259

VKFFT_ERROR_INSUFFICIENT_CODE_BUFFER
@ VKFFT_ERROR_INSUFFICIENT_CODE_BUFFER
Definition VkFFT_Defs.h:235

VKFFT_ERROR_EMPTY_size
@ VKFFT_ERROR_EMPTY_size
Definition VkFFT_Defs.h:249

VKFFT_ERROR_FAILED_TO_SET_KERNEL_ARG
@ VKFFT_ERROR_FAILED_TO_SET_KERNEL_ARG
Definition VkFFT_Defs.h:311

VKFFT_ERROR_FAILED_TO_GET_CODE_SIZE
@ VKFFT_ERROR_FAILED_TO_GET_CODE_SIZE
Definition VkFFT_Defs.h:296

VKFFT_ERROR_EMPTY_inputBufferSize
@ VKFFT_ERROR_EMPTY_inputBufferSize
Definition VkFFT_Defs.h:254

VKFFT_ERROR_EMPTY_tempBuffer
@ VKFFT_ERROR_EMPTY_tempBuffer
Definition VkFFT_Defs.h:253

VKFFT_ERROR_FAILED_TO_CREATE_SHADER_MODULE
@ VKFFT_ERROR_FAILED_TO_CREATE_SHADER_MODULE
Definition VkFFT_Defs.h:281

VKFFT_ERROR_FAILED_TO_ADD_NAME_EXPRESSION
@ VKFFT_ERROR_FAILED_TO_ADD_NAME_EXPRESSION
Definition VkFFT_Defs.h:305

VKFFT_ERROR_EMPTY_outputBuffer
@ VKFFT_ERROR_EMPTY_outputBuffer
Definition VkFFT_Defs.h:257

VKFFT_ERROR_FAILED_TO_BEGIN_COMMAND_BUFFER
@ VKFFT_ERROR_FAILED_TO_BEGIN_COMMAND_BUFFER
Definition VkFFT_Defs.h:268

VKFFT_ERROR_FAILED_TO_END_COMMAND_BUFFER
@ VKFFT_ERROR_FAILED_TO_END_COMMAND_BUFFER
Definition VkFFT_Defs.h:269

VKFFT_SUCCESS
@ VKFFT_SUCCESS
Definition VkFFT_Defs.h:233

VKFFT_ERROR_INSUFFICIENT_TEMP_BUFFER
@ VKFFT_ERROR_INSUFFICIENT_TEMP_BUFFER
Definition VkFFT_Defs.h:236

VKFFT_ERROR_FAILED_TO_ENUMERATE_DEVICES
@ VKFFT_ERROR_FAILED_TO_ENUMERATE_DEVICES
Definition VkFFT_Defs.h:314

VKFFT_ERROR_FAILED_TO_CREATE_COMMAND_QUEUE
@ VKFFT_ERROR_FAILED_TO_CREATE_COMMAND_QUEUE
Definition VkFFT_Defs.h:312

VKFFT_ERROR_FAILED_TO_MODULE_GET_GLOBAL
@ VKFFT_ERROR_FAILED_TO_MODULE_GET_GLOBAL
Definition VkFFT_Defs.h:302

VKFFT_ERROR_FAILED_TO_DESTROY_PROGRAM
@ VKFFT_ERROR_FAILED_TO_DESTROY_PROGRAM
Definition VkFFT_Defs.h:298

VKFFT_ERROR_FAILED_TO_BIND_BUFFER_MEMORY
@ VKFFT_ERROR_FAILED_TO_BIND_BUFFER_MEMORY
Definition VkFFT_Defs.h:290

VKFFT_ERROR_FAILED_TO_GET_CODE
@ VKFFT_ERROR_FAILED_TO_GET_CODE
Definition VkFFT_Defs.h:297

VKFFT_ERROR_PLAN_NOT_INITIALIZED
@ VKFFT_ERROR_PLAN_NOT_INITIALIZED
Definition VkFFT_Defs.h:237

VKFFT_ERROR_INVALID_COMMAND_POOL
@ VKFFT_ERROR_INVALID_COMMAND_POOL
Definition VkFFT_Defs.h:242

VKFFT_ERROR_FAILED_TO_WAIT_FOR_FENCES
@ VKFFT_ERROR_FAILED_TO_WAIT_FOR_FENCES
Definition VkFFT_Defs.h:271

VKFFT_ERROR_FAILED_TO_CREATE_DESCRIPTOR_POOL
@ VKFFT_ERROR_FAILED_TO_CREATE_DESCRIPTOR_POOL
Definition VkFFT_Defs.h:273

VKFFT_ERROR_EMPTY_bufferSize
@ VKFFT_ERROR_EMPTY_bufferSize
Definition VkFFT_Defs.h:250

VKFFT_ERROR_EMPTY_tempBufferSize
@ VKFFT_ERROR_EMPTY_tempBufferSize
Definition VkFFT_Defs.h:252

VKFFT_ERROR_FAILED_TO_CREATE_DEVICE
@ VKFFT_ERROR_FAILED_TO_CREATE_DEVICE
Definition VkFFT_Defs.h:285

VKFFT_ERROR_FAILED_TO_FIND_PHYSICAL_DEVICE
@ VKFFT_ERROR_FAILED_TO_FIND_PHYSICAL_DEVICE
Definition VkFFT_Defs.h:284

VKFFT_ERROR_FAILED_TO_CREATE_BUFFER
@ VKFFT_ERROR_FAILED_TO_CREATE_BUFFER
Definition VkFFT_Defs.h:288

VKFFT_ERROR_INVALID_CONTEXT
@ VKFFT_ERROR_INVALID_CONTEXT
Definition VkFFT_Defs.h:246

VKFFT_ERROR_FAILED_TO_INITIALIZE
@ VKFFT_ERROR_FAILED_TO_INITIALIZE
Definition VkFFT_Defs.h:306

VKFFT_ERROR_FAILED_TO_GET_DEVICE
@ VKFFT_ERROR_FAILED_TO_GET_DEVICE
Definition VkFFT_Defs.h:308

VKFFT_ERROR_FAILED_TO_LAUNCH_KERNEL
@ VKFFT_ERROR_FAILED_TO_LAUNCH_KERNEL
Definition VkFFT_Defs.h:303

VKFFT_ERROR_ONLY_INVERSE_FFT_INITIALIZED
@ VKFFT_ERROR_ONLY_INVERSE_FFT_INITIALIZED
Definition VkFFT_Defs.h:245

VKFFT_ERROR_FAILED_TO_CREATE_INSTANCE
@ VKFFT_ERROR_FAILED_TO_CREATE_INSTANCE
Definition VkFFT_Defs.h:282

VKFFT_ERROR_FAILED_TO_SETUP_DEBUG_MESSENGER
@ VKFFT_ERROR_FAILED_TO_SETUP_DEBUG_MESSENGER
Definition VkFFT_Defs.h:283

VKFFT_ERROR_EMPTY_buffer
@ VKFFT_ERROR_EMPTY_buffer
Definition VkFFT_Defs.h:251

VKFFT_ERROR_INVALID_DEVICE
@ VKFFT_ERROR_INVALID_DEVICE
Definition VkFFT_Defs.h:240

VKFFT_ERROR_FAILED_TO_ALLOCATE_DESCRIPTOR_SETS
@ VKFFT_ERROR_FAILED_TO_ALLOCATE_DESCRIPTOR_SETS
Definition VkFFT_Defs.h:275

VKFFT_ERROR_FAILED_TO_CREATE_COMMAND_POOL
@ VKFFT_ERROR_FAILED_TO_CREATE_COMMAND_POOL
Definition VkFFT_Defs.h:287

VKFFT_ERROR_FAILED_TO_GET_ATTRIBUTE
@ VKFFT_ERROR_FAILED_TO_GET_ATTRIBUTE
Definition VkFFT_Defs.h:315

VKFFT_ERROR_FAILED_TO_CREATE_EVENT
@ VKFFT_ERROR_FAILED_TO_CREATE_EVENT
Definition VkFFT_Defs.h:316

VKFFT_ERROR_FAILED_TO_SYNCHRONIZE
@ VKFFT_ERROR_FAILED_TO_SYNCHRONIZE
Definition VkFFT_Defs.h:292

VKFFT_ERROR_FAILED_TO_CREATE_PIPELINE_LAYOUT
@ VKFFT_ERROR_FAILED_TO_CREATE_PIPELINE_LAYOUT
Definition VkFFT_Defs.h:276

VKFFT_ERROR_UNSUPPORTED_FFT_OMIT
@ VKFFT_ERROR_UNSUPPORTED_FFT_OMIT
Definition VkFFT_Defs.h:264

VKFFT_ERROR_FAILED_TO_CREATE_PIPELINE
@ VKFFT_ERROR_FAILED_TO_CREATE_PIPELINE
Definition VkFFT_Defs.h:310

VKFFT_ERROR_FAILED_TO_LOAD_MODULE
@ VKFFT_ERROR_FAILED_TO_LOAD_MODULE
Definition VkFFT_Defs.h:299

VKFFT_ERROR_FAILED_TO_CREATE_DESCRIPTOR_SET_LAYOUT
@ VKFFT_ERROR_FAILED_TO_CREATE_DESCRIPTOR_SET_LAYOUT
Definition VkFFT_Defs.h:274

VKFFT_ERROR_UNSUPPORTED_FFT_LENGTH_DCT
@ VKFFT_ERROR_UNSUPPORTED_FFT_LENGTH_DCT
Definition VkFFT_Defs.h:263

VKFFT_ERROR_FAILED_TO_ALLOCATE
@ VKFFT_ERROR_FAILED_TO_ALLOCATE
Definition VkFFT_Defs.h:265

VKFFT_ERROR_EMPTY_kernelSize
@ VKFFT_ERROR_EMPTY_kernelSize
Definition VkFFT_Defs.h:258

VKFFT_ERROR_FAILED_TO_MAP_MEMORY
@ VKFFT_ERROR_FAILED_TO_MAP_MEMORY
Definition VkFFT_Defs.h:266

VKFFT_ERROR_UNSUPPORTED_FFT_LENGTH_R2C
@ VKFFT_ERROR_UNSUPPORTED_FFT_LENGTH_R2C
Definition VkFFT_Defs.h:262

VKFFT_ERROR_FAILED_TO_SUBMIT_QUEUE
@ VKFFT_ERROR_FAILED_TO_SUBMIT_QUEUE
Definition VkFFT_Defs.h:270

VKFFT_ERROR_FAILED_TO_FIND_MEMORY
@ VKFFT_ERROR_FAILED_TO_FIND_MEMORY
Definition VkFFT_Defs.h:291

VKFFT_ERROR_FAILED_SHADER_LINK
@ VKFFT_ERROR_FAILED_SHADER_LINK
Definition VkFFT_Defs.h:279

VKFFT_ERROR_INVALID_QUEUE
@ VKFFT_ERROR_INVALID_QUEUE
Definition VkFFT_Defs.h:241

VKFFT_ERROR_MALLOC_FAILED
@ VKFFT_ERROR_MALLOC_FAILED
Definition VkFFT_Defs.h:234

VKFFT_ERROR_FAILED_TO_ALLOCATE_COMMAND_BUFFERS
@ VKFFT_ERROR_FAILED_TO_ALLOCATE_COMMAND_BUFFERS
Definition VkFFT_Defs.h:267

VKFFT_ERROR_ONLY_FORWARD_FFT_INITIALIZED
@ VKFFT_ERROR_ONLY_FORWARD_FFT_INITIALIZED
Definition VkFFT_Defs.h:244

VKFFT_ERROR_FAILED_TO_CREATE_FENCE
@ VKFFT_ERROR_FAILED_TO_CREATE_FENCE
Definition VkFFT_Defs.h:286

VKFFT_ERROR_FAILED_TO_EVENT_RECORD
@ VKFFT_ERROR_FAILED_TO_EVENT_RECORD
Definition VkFFT_Defs.h:304

VKFFT_ERROR_FAILED_SHADER_PARSE
@ VKFFT_ERROR_FAILED_SHADER_PARSE
Definition VkFFT_Defs.h:278

VKFFT_ERROR_FAILED_TO_SET_DEVICE_ID
@ VKFFT_ERROR_FAILED_TO_SET_DEVICE_ID
Definition VkFFT_Defs.h:307

VKFFT_ERROR_FAILED_TO_COMPILE_PROGRAM
@ VKFFT_ERROR_FAILED_TO_COMPILE_PROGRAM
Definition VkFFT_Defs.h:295

VKFFT_ERROR_FAILED_TO_SET_DYNAMIC_SHARED_MEMORY
@ VKFFT_ERROR_FAILED_TO_SET_DYNAMIC_SHARED_MEMORY
Definition VkFFT_Defs.h:301

VKFFT_ERROR_INVALID_PHYSICAL_DEVICE
@ VKFFT_ERROR_INVALID_PHYSICAL_DEVICE
Definition VkFFT_Defs.h:239

VKFFT_ERROR_FAILED_SPIRV_GENERATE
@ VKFFT_ERROR_FAILED_SPIRV_GENERATE
Definition VkFFT_Defs.h:280

VKFFT_ERROR_NULL_TEMP_PASSED
@ VKFFT_ERROR_NULL_TEMP_PASSED
Definition VkFFT_Defs.h:238

VKFFT_ERROR_EMPTY_outputBufferSize
@ VKFFT_ERROR_EMPTY_outputBufferSize
Definition VkFFT_Defs.h:256

VkFFTApplication
Definition VkFFT_Defs.h:525

VkFFTApplication::configuration
VkFFTConfiguration configuration
Definition VkFFT_Defs.h:526

VkFFTApplication::bufferBluesteinFFT
VkBuffer bufferBluesteinFFT[3]
Definition VkFFT_Defs.h:540

VkFFTApplication::lastAxis
uint64_t lastAxis
Definition VkFFT_Defs.h:532

VkFFTApplication::useBluesteinFFT
uint64_t useBluesteinFFT[3]
Definition VkFFT_Defs.h:534

VkFFTApplication::bufferBluestein
VkBuffer bufferBluestein[3]
Definition VkFFT_Defs.h:539

VkFFTApplication::bufferBluesteinIFFT
VkBuffer bufferBluesteinIFFT[3]
Definition VkFFT_Defs.h:541

VkFFTApplication::actualNumBatches
uint64_t actualNumBatches
Definition VkFFT_Defs.h:530

VkFFTApplication::bufferBluesteinIFFTDeviceMemory
VkDeviceMemory bufferBluesteinIFFTDeviceMemory[3]
Definition VkFFT_Defs.h:538

VkFFTApplication::bufferBluesteinFFTDeviceMemory
VkDeviceMemory bufferBluesteinFFTDeviceMemory[3]
Definition VkFFT_Defs.h:537

VkFFTApplication::bufferBluesteinSize
uint64_t bufferBluesteinSize[3]
Definition VkFFT_Defs.h:555

VkFFTApplication::localFFTPlan_inverse
VkFFTPlan * localFFTPlan_inverse
Definition VkFFT_Defs.h:528

VkFFTApplication::localFFTPlan
VkFFTPlan * localFFTPlan
Definition VkFFT_Defs.h:527

VkFFTApplication::bufferBluesteinDeviceMemory
VkDeviceMemory bufferBluesteinDeviceMemory[3]
Definition VkFFT_Defs.h:536

VkFFTApplication::firstAxis
uint64_t firstAxis
Definition VkFFT_Defs.h:531

VkFFTAxis
Definition VkFFT_Defs.h:461

VkFFTAxis::pushConstantsUint32
VkFFTPushConstantsLayoutUint32 pushConstantsUint32
Definition VkFFT_Defs.h:466

VkFFTAxis::pipelineLayout
VkPipelineLayout pipelineLayout
Definition VkFFT_Defs.h:475

VkFFTAxis::referenceLUT
uint64_t referenceLUT
Definition VkFFT_Defs.h:511

VkFFTAxis::bufferBluesteinDeviceMemory
VkDeviceMemory * bufferBluesteinDeviceMemory
Definition VkFFT_Defs.h:479

VkFFTAxis::bufferLUTDeviceMemory
VkDeviceMemory bufferLUTDeviceMemory
Definition VkFFT_Defs.h:477

VkFFTAxis::bufferLUTSize
uint64_t bufferLUTSize
Definition VkFFT_Defs.h:510

VkFFTAxis::bufferBluesteinFFTDeviceMemory
VkDeviceMemory * bufferBluesteinFFTDeviceMemory
Definition VkFFT_Defs.h:480

VkFFTAxis::descriptorPool
VkDescriptorPool descriptorPool
Definition VkFFT_Defs.h:472

VkFFTAxis::descriptorSetLayout
VkDescriptorSetLayout descriptorSetLayout
Definition VkFFT_Defs.h:473

VkFFTAxis::groupedBatch
uint64_t groupedBatch
Definition VkFFT_Defs.h:464

VkFFTAxis::numBindings
uint64_t numBindings
Definition VkFFT_Defs.h:462

VkFFTAxis::inputBuffer
VkBuffer * inputBuffer
Definition VkFFT_Defs.h:470

VkFFTAxis::outputBuffer
VkBuffer * outputBuffer
Definition VkFFT_Defs.h:471

VkFFTAxis::bufferLUT
VkBuffer bufferLUT
Definition VkFFT_Defs.h:478

VkFFTAxis::bufferBluesteinFFT
VkBuffer * bufferBluesteinFFT
Definition VkFFT_Defs.h:482

VkFFTAxis::pushConstants
VkFFTPushConstantsLayoutUint64 pushConstants
Definition VkFFT_Defs.h:467

VkFFTAxis::descriptorSet
VkDescriptorSet descriptorSet
Definition VkFFT_Defs.h:474

VkFFTAxis::specializationConstants
VkFFTSpecializationConstantsLayout specializationConstants
Definition VkFFT_Defs.h:465

VkFFTAxis::axisBlock
uint64_t axisBlock[4]
Definition VkFFT_Defs.h:463

VkFFTAxis::pipeline
VkPipeline pipeline
Definition VkFFT_Defs.h:476

VkFFTAxis::updatePushConstants
uint64_t updatePushConstants
Definition VkFFT_Defs.h:468

VkFFTAxis::bufferBluestein
VkBuffer * bufferBluestein
Definition VkFFT_Defs.h:481

VkFFTConfiguration
Definition VkFFT_Defs.h:33

VkFFTConfiguration::inputBufferOffset
uint64_t inputBufferOffset
Definition VkFFT_Defs.h:106

VkFFTConfiguration::printMemoryLayout
uint64_t printMemoryLayout
Definition VkFFT_Defs.h:143

VkFFTConfiguration::normalize
uint64_t normalize
Definition VkFFT_Defs.h:129

VkFFTConfiguration::numberBatches
uint64_t numberBatches
Definition VkFFT_Defs.h:115

VkFFTConfiguration::outputBufferOffset
uint64_t outputBufferOffset
Definition VkFFT_Defs.h:107

VkFFTConfiguration::disableMergeSequencesR2C
uint64_t disableMergeSequencesR2C
Definition VkFFT_Defs.h:128

VkFFTConfiguration::registerBoost4Step
uint64_t registerBoost4Step
Definition VkFFT_Defs.h:164

VkFFTConfiguration::sharedMemorySize
uint64_t sharedMemorySize
Definition VkFFT_Defs.h:176

VkFFTConfiguration::makeForwardPlanOnly
uint64_t makeForwardPlanOnly
Definition VkFFT_Defs.h:132

VkFFTConfiguration::isCompilerInitialized
uint64_t isCompilerInitialized
Definition VkFFT_Defs.h:46

VkFFTConfiguration::outputBuffer
VkBuffer * outputBuffer
Definition VkFFT_Defs.h:83

VkFFTConfiguration::inputBuffer
VkBuffer * inputBuffer
Definition VkFFT_Defs.h:82

VkFFTConfiguration::queue
VkQueue * queue
Definition VkFFT_Defs.h:43

VkFFTConfiguration::devicePageSize
uint64_t devicePageSize
Definition VkFFT_Defs.h:168

VkFFTConfiguration::kernel
VkBuffer * kernel
Definition VkFFT_Defs.h:84

VkFFTConfiguration::fixMaxRadixBluestein
uint64_t fixMaxRadixBluestein
Definition VkFFT_Defs.h:118

VkFFTConfiguration::coordinateFeatures
uint64_t coordinateFeatures
Definition VkFFT_Defs.h:155

VkFFTConfiguration::isOutputFormatted
uint64_t isOutputFormatted
Definition VkFFT_Defs.h:137

VkFFTConfiguration::memory_barrier
VkMemoryBarrier * memory_barrier
Definition VkFFT_Defs.h:187

VkFFTConfiguration::halfThreads
uint64_t halfThreads
Definition VkFFT_Defs.h:179

VkFFTConfiguration::maxComputeWorkGroupSize
uint64_t maxComputeWorkGroupSize[3]
Definition VkFFT_Defs.h:173

VkFFTConfiguration::bufferSize
uint64_t * bufferSize
Definition VkFFT_Defs.h:73

VkFFTConfiguration::doublePrecisionFloatMemory
uint64_t doublePrecisionFloatMemory
Definition VkFFT_Defs.h:124

VkFFTConfiguration::fence
VkFence * fence
Definition VkFFT_Defs.h:45

VkFFTConfiguration::makeInversePlanOnly
uint64_t makeInversePlanOnly
Definition VkFFT_Defs.h:133

VkFFTConfiguration::inputBufferNum
uint64_t inputBufferNum
Definition VkFFT_Defs.h:68

VkFFTConfiguration::inputBufferSize
uint64_t * inputBufferSize
Definition VkFFT_Defs.h:75

VkFFTConfiguration::localPageSize
uint64_t localPageSize
Definition VkFFT_Defs.h:169

VkFFTConfiguration::commandPool
VkCommandPool * commandPool
Definition VkFFT_Defs.h:44

VkFFTConfiguration::kernelNum
uint64_t kernelNum
Definition VkFFT_Defs.h:70

VkFFTConfiguration::numberKernels
uint64_t numberKernels
Definition VkFFT_Defs.h:158

VkFFTConfiguration::halfPrecisionMemoryOnly
uint64_t halfPrecisionMemoryOnly
Definition VkFFT_Defs.h:123

VkFFTConfiguration::maxTempLength
int64_t maxTempLength
Definition VkFFT_Defs.h:183

VkFFTConfiguration::keepShaderCode
uint64_t keepShaderCode
Definition VkFFT_Defs.h:142

VkFFTConfiguration::symmetricKernel
uint64_t symmetricKernel
Definition VkFFT_Defs.h:157

VkFFTConfiguration::physicalDevice
VkPhysicalDevice * physicalDevice
Definition VkFFT_Defs.h:41

VkFFTConfiguration::maxCodeLength
int64_t maxCodeLength
Definition VkFFT_Defs.h:182

VkFFTConfiguration::useUint64
uint64_t useUint64
Definition VkFFT_Defs.h:116

VkFFTConfiguration::swapTo3Stage4Step
uint64_t swapTo3Stage4Step
Definition VkFFT_Defs.h:167

VkFFTConfiguration::isInputFormatted
uint64_t isInputFormatted
Definition VkFFT_Defs.h:136

VkFFTConfiguration::matrixConvolution
uint64_t matrixConvolution
Definition VkFFT_Defs.h:156

VkFFTConfiguration::bufferNum
uint64_t bufferNum
Definition VkFFT_Defs.h:66

VkFFTConfiguration::coalescedMemory
uint64_t coalescedMemory
Definition VkFFT_Defs.h:111

VkFFTConfiguration::size
uint64_t size[3]
Definition VkFFT_Defs.h:38

VkFFTConfiguration::outputBufferNum
uint64_t outputBufferNum
Definition VkFFT_Defs.h:69

VkFFTConfiguration::performConvolution
uint64_t performConvolution
Definition VkFFT_Defs.h:152

VkFFTConfiguration::frequencyZeroPadding
uint64_t frequencyZeroPadding
Definition VkFFT_Defs.h:149

VkFFTConfiguration::aimThreads
uint64_t aimThreads
Definition VkFFT_Defs.h:112

VkFFTConfiguration::registerBoostNonPow2
uint64_t registerBoostNonPow2
Definition VkFFT_Defs.h:163

VkFFTConfiguration::tempBufferNum
uint64_t tempBufferNum
Definition VkFFT_Defs.h:67

VkFFTConfiguration::tempBufferOffset
uint64_t tempBufferOffset
Definition VkFFT_Defs.h:105

VkFFTConfiguration::considerAllAxesStrided
uint64_t considerAllAxesStrided
Definition VkFFT_Defs.h:141

VkFFTConfiguration::performDCT
uint64_t performDCT
Definition VkFFT_Defs.h:127

VkFFTConfiguration::FFTdim
uint64_t FFTdim
Definition VkFFT_Defs.h:37

VkFFTConfiguration::performR2C
uint64_t performR2C
Definition VkFFT_Defs.h:126

VkFFTConfiguration::doublePrecision
uint64_t doublePrecision
Definition VkFFT_Defs.h:121

VkFFTConfiguration::bufferStride
uint64_t bufferStride[3]
Definition VkFFT_Defs.h:135

VkFFTConfiguration::omitDimension
uint64_t omitDimension[3]
Definition VkFFT_Defs.h:117

VkFFTConfiguration::sharedMemorySizePow2
uint64_t sharedMemorySizePow2
Definition VkFFT_Defs.h:177

VkFFTConfiguration::performBandwidthBoost
uint64_t performBandwidthBoost
Definition VkFFT_Defs.h:119

VkFFTConfiguration::fft_zeropad_left
uint64_t fft_zeropad_left[3]
Definition VkFFT_Defs.h:147

VkFFTConfiguration::registerBoost
uint64_t registerBoost
Definition VkFFT_Defs.h:162

VkFFTConfiguration::halfPrecision
uint64_t halfPrecision
Definition VkFFT_Defs.h:122

VkFFTConfiguration::tempBufferDeviceMemory
VkDeviceMemory tempBufferDeviceMemory
Definition VkFFT_Defs.h:185

VkFFTConfiguration::numSharedBanks
uint64_t numSharedBanks
Definition VkFFT_Defs.h:113

VkFFTConfiguration::tempBufferSize
uint64_t * tempBufferSize
Definition VkFFT_Defs.h:74

VkFFTConfiguration::tempBuffer
VkBuffer * tempBuffer
Definition VkFFT_Defs.h:81

VkFFTConfiguration::commandBuffer
VkCommandBuffer * commandBuffer
Definition VkFFT_Defs.h:186

VkFFTConfiguration::allocateTempBuffer
uint64_t allocateTempBuffer
Definition VkFFT_Defs.h:180

VkFFTConfiguration::performZeropadding
uint64_t performZeropadding[3]
Definition VkFFT_Defs.h:146

VkFFTConfiguration::bufferOffset
uint64_t bufferOffset
Definition VkFFT_Defs.h:104

VkFFTConfiguration::warpSize
uint64_t warpSize
Definition VkFFT_Defs.h:178

VkFFTConfiguration::sharedMemorySizeStatic
uint64_t sharedMemorySizeStatic
Definition VkFFT_Defs.h:175

VkFFTConfiguration::useLUT
uint64_t useLUT
Definition VkFFT_Defs.h:131

VkFFTConfiguration::kernelOffset
uint64_t kernelOffset
Definition VkFFT_Defs.h:108

VkFFTConfiguration::inverseReturnToInputBuffer
uint64_t inverseReturnToInputBuffer
Definition VkFFT_Defs.h:114

VkFFTConfiguration::buffer
VkBuffer * buffer
Definition VkFFT_Defs.h:80

VkFFTConfiguration::maxThreadsNum
uint64_t maxThreadsNum
Definition VkFFT_Defs.h:174

VkFFTConfiguration::userTempBuffer
uint64_t userTempBuffer
Definition VkFFT_Defs.h:64

VkFFTConfiguration::disableReorderFourStep
uint64_t disableReorderFourStep
Definition VkFFT_Defs.h:130

VkFFTConfiguration::inputBufferStride
uint64_t inputBufferStride[3]
Definition VkFFT_Defs.h:138

VkFFTConfiguration::kernelConvolution
uint64_t kernelConvolution
Definition VkFFT_Defs.h:159

VkFFTConfiguration::crossPowerSpectrumNormalization
uint64_t crossPowerSpectrumNormalization
Definition VkFFT_Defs.h:154

VkFFTConfiguration::outputBufferStride
uint64_t outputBufferStride[3]
Definition VkFFT_Defs.h:139

VkFFTConfiguration::outputBufferSize
uint64_t * outputBufferSize
Definition VkFFT_Defs.h:76

VkFFTConfiguration::kernelSize
uint64_t * kernelSize
Definition VkFFT_Defs.h:77

VkFFTConfiguration::conjugateConvolution
uint64_t conjugateConvolution
Definition VkFFT_Defs.h:153

VkFFTConfiguration::maxComputeWorkGroupCount
uint64_t maxComputeWorkGroupCount[3]
Definition VkFFT_Defs.h:172

VkFFTConfiguration::fft_zeropad_right
uint64_t fft_zeropad_right[3]
Definition VkFFT_Defs.h:148

VkFFTConfiguration::reorderFourStep
uint64_t reorderFourStep
Definition VkFFT_Defs.h:181

VkFFTConfiguration::device
VkDevice * device
Definition VkFFT_Defs.h:42

VkFFTLaunchParams
Definition VkFFT_Defs.h:201

VkFFTLaunchParams::outputBuffer
VkBuffer * outputBuffer
Definition VkFFT_Defs.h:208

VkFFTLaunchParams::inputBuffer
VkBuffer * inputBuffer
Definition VkFFT_Defs.h:207

VkFFTLaunchParams::kernel
VkBuffer * kernel
Definition VkFFT_Defs.h:209

VkFFTLaunchParams::commandBuffer
VkCommandBuffer * commandBuffer
Definition VkFFT_Defs.h:203

VkFFTLaunchParams::buffer
VkBuffer * buffer
Definition VkFFT_Defs.h:205

VkFFTLaunchParams::tempBuffer
VkBuffer * tempBuffer
Definition VkFFT_Defs.h:206

VkFFTPlan
Definition VkFFT_Defs.h:514

VkFFTPlan::axes
VkFFTAxis axes[3][4]
Definition VkFFT_Defs.h:518

VkFFTPlan::numAxisUploads
uint64_t numAxisUploads[3]
Definition VkFFT_Defs.h:516

VkFFTPlan::R2Cdecomposition
VkFFTAxis R2Cdecomposition
Definition VkFFT_Defs.h:522

VkFFTPlan::axisSplit
uint64_t axisSplit[3][4]
Definition VkFFT_Defs.h:517

VkFFTPlan::inverseBluesteinAxes
VkFFTAxis inverseBluesteinAxes[3][4]
Definition VkFFT_Defs.h:523

VkFFTPlan::actualFFTSizePerAxis
uint64_t actualFFTSizePerAxis[3][3]
Definition VkFFT_Defs.h:515

VkFFTPlan::multiUploadR2C
uint64_t multiUploadR2C
Definition VkFFT_Defs.h:520

VkFFTPlan::actualPerformR2CPerAxis
uint64_t actualPerformR2CPerAxis[3]
Definition VkFFT_Defs.h:521

VkFFTPushConstantsLayoutUint32
Definition VkFFT_Defs.h:455

VkFFTPushConstantsLayoutUint32::workGroupShift
uint32_t workGroupShift[3]
Definition VkFFT_Defs.h:456

VkFFTPushConstantsLayoutUint64
Definition VkFFT_Defs.h:458

VkFFTPushConstantsLayoutUint64::workGroupShift
uint64_t workGroupShift[3]
Definition VkFFT_Defs.h:459

VkFFTSpecializationConstantsLayout
Definition VkFFT_Defs.h:318

VkFFTSpecializationConstantsLayout::maxCodeLength
int64_t maxCodeLength
Definition VkFFT_Defs.h:452

VkFFTSpecializationConstantsLayout::stageStartSize
uint64_t stageStartSize
Definition VkFFT_Defs.h:365

VkFFTSpecializationConstantsLayout::outputBufferBlockNum
uint64_t outputBufferBlockNum
Definition VkFFT_Defs.h:378

VkFFTSpecializationConstantsLayout::resolveBankConflictFirstStages
uint64_t resolveBankConflictFirstStages
Definition VkFFT_Defs.h:405

VkFFTSpecializationConstantsLayout::BluesteinPostMultiplication
uint64_t BluesteinPostMultiplication
Definition VkFFT_Defs.h:341

VkFFTSpecializationConstantsLayout::numKernels
uint64_t numKernels
Definition VkFFT_Defs.h:385

VkFFTSpecializationConstantsLayout::tempLen
int64_t tempLen
Definition VkFFT_Defs.h:450

VkFFTSpecializationConstantsLayout::performBandwidthBoost
uint64_t performBandwidthBoost
Definition VkFFT_Defs.h:347

VkFFTSpecializationConstantsLayout::tempReg
char tempReg[50]
Definition VkFFT_Defs.h:440

VkFFTSpecializationConstantsLayout::registerBoost
uint64_t registerBoost
Definition VkFFT_Defs.h:402

VkFFTSpecializationConstantsLayout::BluesteinConvolutionStep
uint64_t BluesteinConvolutionStep
Definition VkFFT_Defs.h:339

VkFFTSpecializationConstantsLayout::fft_dim_full
uint64_t fft_dim_full
Definition VkFFT_Defs.h:364

VkFFTSpecializationConstantsLayout::performDCT
uint64_t performDCT
Definition VkFFT_Defs.h:346

VkFFTSpecializationConstantsLayout::zeropad
uint64_t zeropad[2]
Definition VkFFT_Defs.h:326

VkFFTSpecializationConstantsLayout::gl_WorkGroupSize_y
char gl_WorkGroupSize_y[50]
Definition VkFFT_Defs.h:435

VkFFTSpecializationConstantsLayout::performR2CmultiUpload
uint64_t performR2CmultiUpload
Definition VkFFT_Defs.h:345

VkFFTSpecializationConstantsLayout::inverseBluestein
uint64_t inverseBluestein
Definition VkFFT_Defs.h:325

VkFFTSpecializationConstantsLayout::fft_zeropad_Bluestein_right_write
uint64_t fft_zeropad_Bluestein_right_write[3]
Definition VkFFT_Defs.h:361

VkFFTSpecializationConstantsLayout::maxStageSumLUT
uint64_t maxStageSumLUT
Definition VkFFT_Defs.h:396

VkFFTSpecializationConstantsLayout::outputOffset
uint64_t outputOffset
Definition VkFFT_Defs.h:373

VkFFTSpecializationConstantsLayout::kernelBlockSize
uint64_t kernelBlockSize
Definition VkFFT_Defs.h:381

VkFFTSpecializationConstantsLayout::iw
char iw[50]
Definition VkFFT_Defs.h:445

VkFFTSpecializationConstantsLayout::fft_zeropad_right_write
uint64_t fft_zeropad_right_write[3]
Definition VkFFT_Defs.h:357

VkFFTSpecializationConstantsLayout::supportAxis
uint64_t supportAxis
Definition VkFFT_Defs.h:400

VkFFTSpecializationConstantsLayout::inverse
uint64_t inverse
Definition VkFFT_Defs.h:323

VkFFTSpecializationConstantsLayout::axis_upload_id
uint64_t axis_upload_id
Definition VkFFT_Defs.h:329

VkFFTSpecializationConstantsLayout::sdataID
char sdataID[50]
Definition VkFFT_Defs.h:423

VkFFTSpecializationConstantsLayout::numAxisUploads
uint64_t numAxisUploads
Definition VkFFT_Defs.h:330

VkFFTSpecializationConstantsLayout::sharedStrideReadWriteConflict
uint64_t sharedStrideReadWriteConflict
Definition VkFFT_Defs.h:407

VkFFTSpecializationConstantsLayout::LUT
uint64_t LUT
Definition VkFFT_Defs.h:336

VkFFTSpecializationConstantsLayout::fft_zeropad_Bluestein_left_write
uint64_t fft_zeropad_Bluestein_left_write[3]
Definition VkFFT_Defs.h:359

VkFFTSpecializationConstantsLayout::fftDim
uint64_t fftDim
Definition VkFFT_Defs.h:322

VkFFTSpecializationConstantsLayout::normalize
uint64_t normalize
Definition VkFFT_Defs.h:391

VkFFTSpecializationConstantsLayout::LUTBindingID
uint64_t LUTBindingID
Definition VkFFT_Defs.h:414

VkFFTSpecializationConstantsLayout::frequencyZeropadding
uint64_t frequencyZeropadding
Definition VkFFT_Defs.h:348

VkFFTSpecializationConstantsLayout::gl_WorkGroupID_y
char gl_WorkGroupID_y[50]
Definition VkFFT_Defs.h:438

VkFFTSpecializationConstantsLayout::gl_WorkGroupSize_z
char gl_WorkGroupSize_z[50]
Definition VkFFT_Defs.h:436

VkFFTSpecializationConstantsLayout::actualInverse
uint64_t actualInverse
Definition VkFFT_Defs.h:324

VkFFTSpecializationConstantsLayout::fft_zeropad_Bluestein_right_read
uint64_t fft_zeropad_Bluestein_right_read[3]
Definition VkFFT_Defs.h:360

VkFFTSpecializationConstantsLayout::numSharedBanks
uint64_t numSharedBanks
Definition VkFFT_Defs.h:404

VkFFTSpecializationConstantsLayout::blockInvocationID
char blockInvocationID[50]
Definition VkFFT_Defs.h:442

VkFFTSpecializationConstantsLayout::regIDs
char ** regIDs
Definition VkFFT_Defs.h:420

VkFFTSpecializationConstantsLayout::sharedMemSizePow2
uint64_t sharedMemSizePow2
Definition VkFFT_Defs.h:390

VkFFTSpecializationConstantsLayout::performBufferSetUpdate
uint64_t performBufferSetUpdate
Definition VkFFT_Defs.h:418

VkFFTSpecializationConstantsLayout::sharedStrideBankConflictFirstStages
uint64_t sharedStrideBankConflictFirstStages
Definition VkFFT_Defs.h:406

VkFFTSpecializationConstantsLayout::performZeropaddingOutput
uint64_t performZeropaddingOutput[3]
Definition VkFFT_Defs.h:351

VkFFTSpecializationConstantsLayout::combinedID
char combinedID[50]
Definition VkFFT_Defs.h:425

VkFFTSpecializationConstantsLayout::stageInvocationID
char stageInvocationID[50]
Definition VkFFT_Defs.h:441

VkFFTSpecializationConstantsLayout::kernelNumberByteSize
uint64_t kernelNumberByteSize
Definition VkFFT_Defs.h:395

VkFFTSpecializationConstantsLayout::gl_LocalInvocationID_y
char gl_LocalInvocationID_y[50]
Definition VkFFT_Defs.h:427

VkFFTSpecializationConstantsLayout::locID
char locID[13][40]
Definition VkFFT_Defs.h:446

VkFFTSpecializationConstantsLayout::performZeropaddingFull
uint64_t performZeropaddingFull[3]
Definition VkFFT_Defs.h:349

VkFFTSpecializationConstantsLayout::mergeSequencesR2C
uint64_t mergeSequencesR2C
Definition VkFFT_Defs.h:410

VkFFTSpecializationConstantsLayout::fft_zeropad_right_read
uint64_t fft_zeropad_right_read[3]
Definition VkFFT_Defs.h:356

VkFFTSpecializationConstantsLayout::stageRadix
uint64_t stageRadix[20]
Definition VkFFT_Defs.h:370

VkFFTSpecializationConstantsLayout::registers_per_thread
uint64_t registers_per_thread
Definition VkFFT_Defs.h:331

VkFFTSpecializationConstantsLayout::maxSharedStride
uint64_t maxSharedStride
Definition VkFFT_Defs.h:408

VkFFTSpecializationConstantsLayout::code0
char * code0
Definition VkFFT_Defs.h:447

VkFFTSpecializationConstantsLayout::reorderFourStep
uint64_t reorderFourStep
Definition VkFFT_Defs.h:374

VkFFTSpecializationConstantsLayout::inputNumberByteSize
uint64_t inputNumberByteSize
Definition VkFFT_Defs.h:393

VkFFTSpecializationConstantsLayout::sharedStride
char sharedStride[50]
Definition VkFFT_Defs.h:433

VkFFTSpecializationConstantsLayout::numStages
uint64_t numStages
Definition VkFFT_Defs.h:369

VkFFTSpecializationConstantsLayout::writeFromRegisters
uint64_t writeFromRegisters
Definition VkFFT_Defs.h:335

VkFFTSpecializationConstantsLayout::axisSwapped
uint64_t axisSwapped
Definition VkFFT_Defs.h:409

VkFFTSpecializationConstantsLayout::numBuffersBound
uint64_t numBuffersBound[6]
Definition VkFFT_Defs.h:412

VkFFTSpecializationConstantsLayout::crossPowerSpectrumNormalization
uint64_t crossPowerSpectrumNormalization
Definition VkFFT_Defs.h:387

VkFFTSpecializationConstantsLayout::unroll
uint64_t unroll
Definition VkFFT_Defs.h:397

VkFFTSpecializationConstantsLayout::warpSize
uint64_t warpSize
Definition VkFFT_Defs.h:403

VkFFTSpecializationConstantsLayout::inputBufferBlockSize
uint64_t inputBufferBlockSize
Definition VkFFT_Defs.h:377

VkFFTSpecializationConstantsLayout::w
char w[50]
Definition VkFFT_Defs.h:444

VkFFTSpecializationConstantsLayout::BluesteinConvolutionBindingID
uint64_t BluesteinConvolutionBindingID
Definition VkFFT_Defs.h:415

VkFFTSpecializationConstantsLayout::firstStageStartSize
uint64_t firstStageStartSize
Definition VkFFT_Defs.h:366

VkFFTSpecializationConstantsLayout::inputBufferBlockNum
uint64_t inputBufferBlockNum
Definition VkFFT_Defs.h:376

VkFFTSpecializationConstantsLayout::outputStride
uint64_t outputStride[5]
Definition VkFFT_Defs.h:363

VkFFTSpecializationConstantsLayout::fft_zeropad_left_read
uint64_t fft_zeropad_left_read[3]
Definition VkFFT_Defs.h:353

VkFFTSpecializationConstantsLayout::reverseBluesteinMultiUpload
uint64_t reverseBluesteinMultiUpload
Definition VkFFT_Defs.h:338

VkFFTSpecializationConstantsLayout::startDCT3LUT
uint64_t startDCT3LUT
Definition VkFFT_Defs.h:342

VkFFTSpecializationConstantsLayout::BluesteinMultiplicationBindingID
uint64_t BluesteinMultiplicationBindingID
Definition VkFFT_Defs.h:416

VkFFTSpecializationConstantsLayout::inputStride
uint64_t inputStride[5]
Definition VkFFT_Defs.h:362

VkFFTSpecializationConstantsLayout::BluesteinPreMultiplication
uint64_t BluesteinPreMultiplication
Definition VkFFT_Defs.h:340

VkFFTSpecializationConstantsLayout::convolutionStep
uint64_t convolutionStep
Definition VkFFT_Defs.h:398

VkFFTSpecializationConstantsLayout::gl_WorkGroupID_x
char gl_WorkGroupID_x[50]
Definition VkFFT_Defs.h:437

VkFFTSpecializationConstantsLayout::conjugateConvolution
uint64_t conjugateConvolution
Definition VkFFT_Defs.h:386

VkFFTSpecializationConstantsLayout::readToRegisters
uint64_t readToRegisters
Definition VkFFT_Defs.h:334

VkFFTSpecializationConstantsLayout::gl_GlobalInvocationID_z
char gl_GlobalInvocationID_z[200]
Definition VkFFT_Defs.h:431

VkFFTSpecializationConstantsLayout::inoutID
char inoutID[50]
Definition VkFFT_Defs.h:424

VkFFTSpecializationConstantsLayout::temp
char temp[50]
Definition VkFFT_Defs.h:443

VkFFTSpecializationConstantsLayout::localSize
uint64_t localSize[3]
Definition VkFFT_Defs.h:320

VkFFTSpecializationConstantsLayout::currentLen
int64_t currentLen
Definition VkFFT_Defs.h:451

VkFFTSpecializationConstantsLayout::matrixConvolution
uint64_t matrixConvolution
Definition VkFFT_Defs.h:383

VkFFTSpecializationConstantsLayout::symmetricKernel
uint64_t symmetricKernel
Definition VkFFT_Defs.h:399

VkFFTSpecializationConstantsLayout::size
uint64_t size[3]
Definition VkFFT_Defs.h:319

VkFFTSpecializationConstantsLayout::tshuffle
char tshuffle[50]
Definition VkFFT_Defs.h:432

VkFFTSpecializationConstantsLayout::startDCT4LUT
uint64_t startDCT4LUT
Definition VkFFT_Defs.h:343

VkFFTSpecializationConstantsLayout::min_registers_per_thread
uint64_t min_registers_per_thread
Definition VkFFT_Defs.h:333

VkFFTSpecializationConstantsLayout::numBatches
uint64_t numBatches
Definition VkFFT_Defs.h:384

VkFFTSpecializationConstantsLayout::performZeropaddingInput
uint64_t performZeropaddingInput[3]
Definition VkFFT_Defs.h:350

VkFFTSpecializationConstantsLayout::performR2C
uint64_t performR2C
Definition VkFFT_Defs.h:344

VkFFTSpecializationConstantsLayout::complexSize
uint64_t complexSize
Definition VkFFT_Defs.h:392

VkFFTSpecializationConstantsLayout::outputNumberByteSize
uint64_t outputNumberByteSize
Definition VkFFT_Defs.h:394

VkFFTSpecializationConstantsLayout::zeropadBluestein
uint64_t zeropadBluestein[2]
Definition VkFFT_Defs.h:327

VkFFTSpecializationConstantsLayout::kernelBlockNum
uint64_t kernelBlockNum
Definition VkFFT_Defs.h:380

VkFFTSpecializationConstantsLayout::useUint64
uint64_t useUint64
Definition VkFFT_Defs.h:419

VkFFTSpecializationConstantsLayout::outputBufferBlockSize
uint64_t outputBufferBlockSize
Definition VkFFT_Defs.h:379

VkFFTSpecializationConstantsLayout::gl_LocalInvocationID_z
char gl_LocalInvocationID_z[50]
Definition VkFFT_Defs.h:428

VkFFTSpecializationConstantsLayout::gl_GlobalInvocationID_x
char gl_GlobalInvocationID_x[200]
Definition VkFFT_Defs.h:429

VkFFTSpecializationConstantsLayout::kernelOffset
uint64_t kernelOffset
Definition VkFFT_Defs.h:372

VkFFTSpecializationConstantsLayout::convolutionBindingID
uint64_t convolutionBindingID
Definition VkFFT_Defs.h:413

VkFFTSpecializationConstantsLayout::dispatchZactualFFTSize
uint64_t dispatchZactualFFTSize
Definition VkFFT_Defs.h:368

VkFFTSpecializationConstantsLayout::gl_WorkGroupSize_x
char gl_WorkGroupSize_x[50]
Definition VkFFT_Defs.h:434

VkFFTSpecializationConstantsLayout::gl_WorkGroupID_z
char gl_WorkGroupID_z[50]
Definition VkFFT_Defs.h:439

VkFFTSpecializationConstantsLayout::cacheShuffle
uint64_t cacheShuffle
Definition VkFFT_Defs.h:401

VkFFTSpecializationConstantsLayout::numCoordinates
uint64_t numCoordinates
Definition VkFFT_Defs.h:382

VkFFTSpecializationConstantsLayout::disableThreadsStart
char * disableThreadsStart
Definition VkFFT_Defs.h:421

VkFFTSpecializationConstantsLayout::output
char * output
Definition VkFFT_Defs.h:448

VkFFTSpecializationConstantsLayout::fft_zeropad_left_write
uint64_t fft_zeropad_left_write[3]
Definition VkFFT_Defs.h:354

VkFFTSpecializationConstantsLayout::gl_LocalInvocationID_x
char gl_LocalInvocationID_x[50]
Definition VkFFT_Defs.h:426

VkFFTSpecializationConstantsLayout::fft_dim_x
uint64_t fft_dim_x
Definition VkFFT_Defs.h:367

VkFFTSpecializationConstantsLayout::registers_per_thread_per_radix
uint64_t registers_per_thread_per_radix[14]
Definition VkFFT_Defs.h:332

VkFFTSpecializationConstantsLayout::axis_id
uint64_t axis_id
Definition VkFFT_Defs.h:328

VkFFTSpecializationConstantsLayout::disableThreadsEnd
char * disableThreadsEnd
Definition VkFFT_Defs.h:422

VkFFTSpecializationConstantsLayout::usedSharedMemory
uint64_t usedSharedMemory
Definition VkFFT_Defs.h:388

VkFFTSpecializationConstantsLayout::tempStr
char * tempStr
Definition VkFFT_Defs.h:449

VkFFTSpecializationConstantsLayout::inputOffset
uint64_t inputOffset
Definition VkFFT_Defs.h:371

VkFFTSpecializationConstantsLayout::fft_zeropad_Bluestein_left_read
uint64_t fft_zeropad_Bluestein_left_read[3]
Definition VkFFT_Defs.h:358

VkFFTSpecializationConstantsLayout::gl_GlobalInvocationID_y
char gl_GlobalInvocationID_y[200]
Definition VkFFT_Defs.h:430

VkFFTSpecializationConstantsLayout::sharedMemSize
uint64_t sharedMemSize
Definition VkFFT_Defs.h:389

VkFFTSpecializationConstantsLayout::fft_zeropad_left_full
uint64_t fft_zeropad_left_full[3]
Definition VkFFT_Defs.h:352

VkFFTSpecializationConstantsLayout::sourceFFTSize
uint64_t sourceFFTSize
Definition VkFFT_Defs.h:321

VkFFTSpecializationConstantsLayout::performWorkGroupShift
uint64_t performWorkGroupShift[3]
Definition VkFFT_Defs.h:375

VkFFTSpecializationConstantsLayout::maxTempLength
int64_t maxTempLength
Definition VkFFT_Defs.h:453

VkFFTSpecializationConstantsLayout::useBluesteinFFT
uint64_t useBluesteinFFT
Definition VkFFT_Defs.h:337

VkFFTSpecializationConstantsLayout::fft_zeropad_right_full
uint64_t fft_zeropad_right_full[3]
Definition VkFFT_Defs.h:355

VkGPU
Definition VkFFT_Defs.h:4

VkGPU::physicalDeviceProperties
VkPhysicalDeviceProperties physicalDeviceProperties
Definition VkFFT_Defs.h:8

VkGPU::enableValidationLayers
uint64_t enableValidationLayers
Definition VkFFT_Defs.h:17

VkGPU::commandPool
VkCommandPool commandPool
Definition VkFFT_Defs.h:14

VkGPU::device_id
uint64_t device_id
Definition VkFFT_Defs.h:30

VkGPU::queueFamilyIndex
uint64_t queueFamilyIndex
Definition VkFFT_Defs.h:12

VkGPU::physicalDevice
VkPhysicalDevice physicalDevice
Definition VkFFT_Defs.h:7

VkGPU::debugMessenger
VkDebugUtilsMessengerEXT debugMessenger
Definition VkFFT_Defs.h:11

VkGPU::device
VkDevice device
Definition VkFFT_Defs.h:10

VkGPU::fence
VkFence fence
Definition VkFFT_Defs.h:15

VkGPU::instance
VkInstance instance
Definition VkFFT_Defs.h:6

VkGPU::physicalDeviceMemoryProperties
VkPhysicalDeviceMemoryProperties physicalDeviceMemoryProperties
Definition VkFFT_Defs.h:9

VkGPU::queue
VkQueue queue
Definition VkFFT_Defs.h:13

VkGPU::enabledDeviceExtensions
std::vector< const char * > enabledDeviceExtensions
Definition VkFFT_Defs.h:16