doxygen/html/_vulkan_2_array_2_array3_d_8inl_source.html

#include "VkDeviceArray3D.h"

#include "VkTransfer.h"


namespace dyno {


    template<typename T>

    void Array3D<T, DeviceType::CPU>::assign(const Array3D<T, DeviceType::GPU>& src)

    {

        if (m_nx != src.size() || m_ny != src.size() || m_nz != src.size()) {

            this->resize(src.nx(), src.ny(), src.nz());

        }


        vkTransfer(m_data, *src.handle());

        //cuSafeCall(cudaMemcpy2D(m_data.data(), sizeof(T) * m_nx, src.begin(), src.pitch(), sizeof(T) * src.nx(), src.ny() * src.nz(), cudaMemcpyDeviceToHost));

    }


    template<typename T>

    class Array3D<T, DeviceType::GPU>

    {

    public:

        Array3D()

        {};


        Array3D(uint nx, uint ny, uint nz)

        {

            this->resize(nx, ny, nz);

        };


        ~Array3D() { };


        void resize(const uint nx, const uint ny, const uint nz);


        void reset();


        void clear();


        inline const VkDeviceArray3D<T>* handle() const { return &m_data; }

        inline VkDeviceArray3D<T>* handle() { return &m_data; }


        VkBuffer buffer() const { return m_data.bufferHandle(); }


        uint32_t bufferSize() { return m_data.bufferSize(); }


        inline T* begin() const { return m_data; }


        inline uint nx() const { return m_nx; }

        inline uint ny() const { return m_ny; }

        inline uint nz() const { return m_nz; }

//      inline uint pitch() const { return m_pitch_x; }


//      DYN_FUNC inline T operator () (const int i, const int j, const int k) const

//      {

//          char* addr = (char*)m_data;

//          addr += (j * m_pitch_x + k * m_nxy);

//          return ((T*)addr)[i];

//      }

//

//      DYN_FUNC inline T& operator () (const int i, const int j, const int k)

//      {

//          char* addr = (char*)m_data;

//          addr += (j * m_pitch_x + k * m_nxy);

//          return ((T*)addr)[i];

//      }

//

//      DYN_FUNC inline T operator [] (const int id) const

//      {

//          return m_data[id];

//      }

//

//      DYN_FUNC inline T& operator [] (const int id)

//      {

//          return m_data[id];

//      }


        inline size_t index(const uint i, const uint j, const uint k) const

        {

            return i + j * m_nx + k * m_nx * m_ny;

        }


        inline size_t size() const { return m_nx * m_ny * m_nz; }

        inline bool isCPU() const { return false; }

        inline bool isGPU() const { return true; }


        void assign(const std::vector<T>& src);

        void assign(const Array3D<T, DeviceType::GPU>& src);

        void assign(const Array3D<T, DeviceType::CPU>& src);


    private:

        uint m_nx = 0;


        uint m_ny = 0;

        uint m_nz = 0;

        uint m_nxy = 0;

        VkDeviceArray3D<T> m_data;

    };


    template<typename T>

    using DArray3D = Array3D<T, DeviceType::GPU>;


//  typedef DArray3D<float> Grid1f;

//  typedef DArray3D<float3> Grid3f;

//  typedef DArray3D<bool> Grid1b;


    template<typename T>

    void Array3D<T, DeviceType::GPU>::resize(const uint nx, const uint ny, const uint nz)

    {

        uint total = nx * ny * nz;

        if (m_data.size() == total) return;


        if (total == 0) {

            m_data.clear();

            return;

        }


        //cuSafeCall(cudaMallocPitch((void**)&m_data, (size_t*)&m_pitch_x, (size_t)sizeof(T) * nx, (size_t)ny*nz));

        m_data.resize(nx, ny, nz);


        //TODO: check whether it has problem when m_pitch_x is not divisible by sizeof(T)

        m_nx = nx;  m_ny = ny;  m_nz = nz;

        m_nxy = m_nx * m_ny;

    }


    template<typename T>

    void Array3D<T, DeviceType::GPU>::reset()

    {

        //TODO:

        //cuSafeCall(cudaMemset(m_data, 0, m_nxy * m_nz));

    }


    template<typename T>

    void Array3D<T, DeviceType::GPU>::clear()

    {

        m_data.clear();


        m_nx = 0;

        m_ny = 0;

        m_nz = 0;

        m_nxy = 0;

    }


    template<typename T>

    void Array3D<T, DeviceType::GPU>::assign(const std::vector<T>& src)

    {

        assert(m_nx * m_ny * m_nz == src.size());


        vkTransfer(m_data, src);

        //cuSafeCall(cudaMemcpy2D(m_data, m_pitch_x, src.begin(), src.pitch(), sizeof(T) *src.nx(), src.ny()*src.nz(), cudaMemcpyDeviceToDevice));

    }


    template<typename T>

    void Array3D<T, DeviceType::GPU>::assign(const Array3D<T, DeviceType::GPU>& src)

    {

        if (m_nx != src.nx() || m_ny != src.ny() || m_nz != src.nz()) {

            this->resize(src.nx(), src.ny(), src.nz());

        }


        vkTransfer(m_data, *src.handle());

        //cuSafeCall(cudaMemcpy2D(m_data, m_pitch_x, src.begin(), src.pitch(), sizeof(T) *src.nx(), src.ny()*src.nz(), cudaMemcpyDeviceToDevice));

    }


    template<typename T>

    void Array3D<T, DeviceType::GPU>::assign(const Array3D<T, DeviceType::CPU>& src)

    {

        if (m_nx != src.nx() || m_ny != src.ny() || m_nz != src.nz()) {

            this->resize(src.nx(), src.ny(), src.nz());

        }


        vkTransfer(m_data, *src.handle());

        //cuSafeCall(cudaMemcpy2D(m_data, m_pitch_x, src.begin(), sizeof(T) *src.nx(), sizeof(T) *src.nx(), src.ny()*src.nz(), cudaMemcpyHostToDevice));

    }

}

VkDeviceArray3D.h

VkTransfer.h

assert
assert(queueCount >=1)

dyno::Array3D
Definition Array3D.h:6

T
#define T(t)

dyno
This is an implementation of AdditiveCCD based on peridyno.
Definition Array.h:25

dyno::DArray3D
Array3D< T, DeviceType::GPU > DArray3D
Definition Array3D.inl:90

dyno::uint
unsigned int uint
Definition VkProgram.h:14

dyno::vkTransfer
bool vkTransfer(VkHostArray< T > &dst, const VkDeviceArray< T > &src)
Definition VkTransfer.inl:7