add specialised run function for turbVisc cumulant kernel

d02e2d26 · Henrik Asmuth · 8f190580 · d02e2d26 · d02e2d26 · d02e2d26
Commit d02e2d26 authored 2 years ago by Henrik Asmuth
--- a/src/gpu/VirtualFluids_GPU/Calculation/CollisionStrategy.h
+++ b/src/gpu/VirtualFluids_GPU/Calculation/CollisionStrategy.h
@@ -32,4 +32,10 @@ public:
    void operator()(UpdateGrid27 *updateGrid, Parameter *para, int level, unsigned int t);
 };
+//! \brief experimental version for specialized collision kernel calls with different read/write options
+class CollisionAndExchange_noStreams_withReadWriteFlags
+{
+    void operator()(UpdateGrid27 *updateGrid, Parameter *para, int level, unsigned int t);
+};
 #endif
--- a/src/gpu/VirtualFluids_GPU/Calculation/CollisisionStrategy.cpp
+++ b/src/gpu/VirtualFluids_GPU/Calculation/CollisisionStrategy.cpp
@@ -86,3 +86,20 @@ void CollisionAndExchange_streams::operator()(UpdateGrid27 *updateGrid, Paramete
    //! 4. exchange information between GPUs
    updateGrid->exchangeMultiGPU(level, borderStreamIndex);
 }
+void CollisionAndExchange_noStreams_withReadWriteFlags::operator()(UpdateGrid27 *updateGrid, Parameter *para, int level,
+                                                            unsigned int t)
+{
+    //! \details steps:
+    //!
+    //! 1. run collision
+    //!
+    updateGrid->collisionWithReadWriteFlags(level, t, 
+                                            para->getParD(level)->fluidNodeIndices,                     para->getParD(level)->numberOfFluidNodes,
+                                            para->getParD(level)->indicesWithMacroscopicVariableOutput, para->getParD(level)->numberOfIndicesWithMacroscopicVariableOutput,
+                                            para->getParD(level)->indicesWithApplyBodyForce,            para->getParD(level)->numberOfIndicesWithApplyBodyForce,
+                                            para->getParD(level)->indicesWithMacroscopicVariableOutputAndApplyBodyForce,   para->getParD(level)->numberOfIndicesWithMacroscopicVariableOutputAndApplyBodyForce);
+    //! 2. exchange information between GPUs
+    updateGrid->exchangeMultiGPU_noStreams_withPrepare(level, false);
+}
\ No newline at end of file
--- a/src/gpu/VirtualFluids_GPU/Calculation/UpdateGrid27.cpp
+++ b/src/gpu/VirtualFluids_GPU/Calculation/UpdateGrid27.cpp
@@ -90,6 +90,37 @@ void UpdateGrid27::collisionUsingIndices(int level, unsigned int t, uint *fluidN
        collisionAdvectionDiffusion(level);
 }
+void UpdateGrid27::collisionWithReadWriteFlags(int level, unsigned int t, uint *fluidNodeIndices,                                   uint numberOfFluidNodes,
+                                                                    uint *indicesWithMacroscopicVariableOutput,                     uint numberOfIndicesWithMacroscopicVariableOutput,
+                                                                    uint *indicesWithApplyBodyForce,                                uint numberOfIndicesWithApplyBodyForce,
+                                                                    uint *indicesWithMacroscopicVariableOutputAndApplyBodyForce,    uint numberOfIndicesWithMacroscopicVariableOutputAndApplyBodyForce)
+{
+    void runOnIndicesWithMacroscopicVariableOutput(	const unsigned int *indices, unsigned int size_indices, int streamIndex = -1);
+    void runOnIndicesWithApplyBodyForce( const unsigned int *indices, unsigned int size_indices, int streamIndex = -1);
+    void runOnIndicesWithMacroscopicVariableOutputAndApplyBodyForce( const unsigned int *indices, unsigned int size_indices, int streamIndex = -1);
+    if      (fluidNodeIndices != nullptr && numberOfFluidNodes != 0)
+        kernels.at(level)->runOnIndices(fluidNodeIndices, numberOfFluidNodes, 1);
+    else if (indicesWithMacroscopicVariableOutput != nullptr && numberOfIndicesWithMacroscopicVariableOutput != 0)
+        kernels.at(level)->runOnIndicesWithMacroscopicVariableOutput(indicesWithMacroscopicVariableOutput, numberOfIndicesWithMacroscopicVariableOutput, 2);
+    else if (indicesWithApplyBodyForce != nullptr && numberOfIndicesWithApplyBodyForce != 0)
+        kernels.at(level)->runOnIndicesWithApplyBodyForce(indicesWithMacroscopicVariableOutput, numberOfIndicesWithMacroscopicVariableOutput, 3);
+    else if (indicesWithMacroscopicVariableOutputAndApplyBodyForce != nullptr && numberOfIndicesWithMacroscopicVariableOutputAndApplyBodyForce != 0)
+        kernels.at(level)->runOnIndicesWithMacroscopicVariableOutputAndApplyBodyForce(indicesWithMacroscopicVariableOutputAndApplyBodyForce, numberOfIndicesWithMacroscopicVariableOutputAndApplyBodyForce, 4);
+    else
+        std::cout << "In collision: fluidNodeIndices or numberOfFluidNodes not definded" << std::endl;
+    //////////////////////////////////////////////////////////////////////////
+    if (para->getSimulatePorousMedia())
+        collisionPorousMedia(level);
+    //////////////////////////////////////////////////////////////////////////
+    if (para->getDiffOn())
+        collisionAdvectionDiffusion(level);
+}
 void UpdateGrid27::collisionPorousMedia(int level)
 {
    for( std::size_t i = 0; i < pm.size(); i++ )

--- a/src/gpu/VirtualFluids_GPU/Calculation/UpdateGrid27.h
+++ b/src/gpu/VirtualFluids_GPU/Calculation/UpdateGrid27.h
@@ -32,6 +32,12 @@ public:
 private:
    void collisionAllNodes(int level, unsigned int t);
    void collisionUsingIndices(int level, unsigned int t, uint *fluidNodeIndices = nullptr, uint numberOfFluidNodes = 0, int stream = -1);
+    void collisionWithReadWriteFlags(int level, unsigned int t, 
+                                        uint *fluidNodeIndices,                                         uint numberOfFluidNodes,
+                                        uint *indicesWithMacroscopicVariableOutput,                     uint numberOfIndicesWithMacroscopicVariableOutput,
+                                        uint *indicesWithApplyBodyForce,                                uint numberOfIndicesWithApplyBodyForce,
+                                        uint *indicesWithMacroscopicVariableOutputAndApplyBodyForce,    uint numberOfIndicesWithMacroscopicVariableOutputAndApplyBodyForce);
    void collisionAdvectionDiffusion(int level);
    void postCollisionBC(int level);
@@ -60,6 +66,7 @@ private:
    friend class CollisionAndExchange_noStreams_indexKernel;
    friend class CollisionAndExchange_noStreams_oldKernel;
    friend class CollisionAndExchange_streams;
+    friend class CollisionAndExchange_noStreams_withReadWriteFlags;
    RefinementStrategy refinement;
    friend class RefinementAndExchange_streams_exchangeInterface;

--- a/src/gpu/VirtualFluids_GPU/Kernel/Kernel.h
+++ b/src/gpu/VirtualFluids_GPU/Kernel/Kernel.h
@@ -14,6 +14,9 @@ public:
    virtual ~Kernel()  = default;
    virtual void run() = 0;
    virtual void runOnIndices(const unsigned int *indices, unsigned int size_indices, int stream = -1) = 0; //if stream == -1: run on default stream
+    virtual void runOnIndicesWithMacroscopicVariableOutput(const unsigned int *indices, unsigned int size_indices, int stream = -1) = 0;
+    virtual void runOnIndicesWithApplyBodyForce(const unsigned int *indices, unsigned int size_indices, int stream = -1) = 0;
+    virtual void runOnIndicesWithMacroscopicVariableOutputAndApplyBodyForce(const unsigned int *indices, unsigned int size_indices, int stream = -1) = 0;
    virtual bool checkParameter()                                = 0;
    virtual std::vector<PreProcessorType> getPreProcessorTypes() = 0;

--- a/src/gpu/VirtualFluids_GPU/Kernel/KernelImp.cpp
+++ b/src/gpu/VirtualFluids_GPU/Kernel/KernelImp.cpp
@@ -8,6 +8,21 @@ void KernelImp::runOnIndices(const unsigned int *indices, unsigned int size_indi
    printf("Method not implemented for this Kernel \n");
 }
+void KernelImp::runOnIndicesWithMacroscopicVariableOutput(const unsigned int *indices, unsigned int size_indices, int stream)
+{
+    printf("Method not implemented for this Kernel \n");
+}
+void KernelImp::runOnIndicesWithApplyBodyForce(const unsigned int *indices, unsigned int size_indices, int stream)
+{
+    printf("Method not implemented for this Kernel \n");
+}
+void KernelImp::runOnIndicesWithMacroscopicVariableOutputAndApplyBodyForce(const unsigned int *indices, unsigned int size_indices, int stream)
+{
+    printf("Method not implemented for this Kernel \n");
+}
 bool KernelImp::checkParameter() { 
    return checkStrategy->checkParameter(para);
 }

--- a/src/gpu/VirtualFluids_GPU/Kernel/KernelImp.h
+++ b/src/gpu/VirtualFluids_GPU/Kernel/KernelImp.h
@@ -15,6 +15,9 @@ class KernelImp : public Kernel
 public:
    virtual void run() = 0;
    virtual void runOnIndices(const unsigned int *indices, unsigned int size_indices, int stream = -1);
+    virtual void runOnIndicesWithMacroscopicVariableOutput(const unsigned int *indices, unsigned int size_indices, int stream = -1);
+    virtual void runOnIndicesWithApplyBodyForce(const unsigned int *indices, unsigned int size_indices, int stream = -1);
+    virtual void runOnIndicesWithMacroscopicVariableOutputAndApplyBodyForce(const unsigned int *indices, unsigned int size_indices, int stream = -1);
    bool checkParameter();
    std::vector<PreProcessorType> getPreProcessorTypes();

--- a/src/gpu/VirtualFluids_GPU/Kernel/Kernels/TurbulentViscosityKernels/FluidFlow/Compressible/CumulantK17chim/TurbulentViscosityCumulantK17CompChim.cu
+++ b/src/gpu/VirtualFluids_GPU/Kernel/Kernels/TurbulentViscosityKernels/FluidFlow/Compressible/CumulantK17chim/TurbulentViscosityCumulantK17CompChim.cu
@@ -43,7 +43,7 @@ void TurbulentViscosityCumulantK17CompChim<turbulenceModel>::run()
 }
 template<TurbulenceModel turbulenceModel>
-void TurbulentViscosityCumulantK17CompChim<turbulenceModel>::runOnIndices(const unsigned int *indices, unsigned int size_indices, int streamIndex)
+void TurbulentViscosityCumulantK17CompChim<turbulenceModel>::runOnIndices(	const unsigned int *indices, unsigned int size_indices, int streamIndex )
 {
 	cudaStream_t stream = (streamIndex == -1) ? CU_STREAM_LEGACY : para->getStreamManager()->getStream(streamIndex);
@@ -73,6 +73,99 @@ void TurbulentViscosityCumulantK17CompChim<turbulenceModel>::runOnIndices(const
 	getLastCudaError("LB_Kernel_TurbulentViscosityCumulantK17CompChim execution failed");
 }
+template<TurbulenceModel turbulenceModel>
+void TurbulentViscosityCumulantK17CompChim<turbulenceModel>::runOnIndicesWithMacroscopicVariableOutput(	const unsigned int *indices, unsigned int size_indices, int streamIndex)
+{
+	cudaStream_t stream = (streamIndex == -1) ? CU_STREAM_LEGACY : para->getStreamManager()->getStream(streamIndex);
+	LB_Kernel_TurbulentViscosityCumulantK17CompChim < turbulenceModel, true, false  > <<< cudaGrid.grid, cudaGrid.threads, 0, stream >>>(   para->getParD(level)->omega, 	
+																											para->getParD(level)->typeOfGridNode, 										para->getParD(level)->neighborX,	
+																											para->getParD(level)->neighborY,	
+																											para->getParD(level)->neighborZ,	
+																											para->getParD(level)->distributions.f[0],	
+																											para->getParD(level)->rho,		
+																											para->getParD(level)->velocityX,		
+																											para->getParD(level)->velocityY,	
+																											para->getParD(level)->velocityZ,	
+																											para->getParD(level)->turbViscosity,
+																											para->getSGSConstant(),
+																											(unsigned long)para->getParD(level)->numberOfNodes,	
+																											level,				
+																											para->getIsBodyForce(),				
+																											para->getForcesDev(),				
+																											para->getParD(level)->forceX_SP,	
+																											para->getParD(level)->forceY_SP,
+																											para->getParD(level)->forceZ_SP,
+																											para->getQuadricLimitersDev(),			
+																											para->getParD(level)->isEvenTimestep,
+																											indices,
+        																									size_indices);
+	getLastCudaError("LB_Kernel_TurbulentViscosityCumulantK17CompChim execution failed");
+}
+template<TurbulenceModel turbulenceModel>
+void TurbulentViscosityCumulantK17CompChim<turbulenceModel>::runOnIndicesWithApplyBodyForce(	const unsigned int *indices, unsigned int size_indices, int streamIndex)
+{
+	cudaStream_t stream = (streamIndex == -1) ? CU_STREAM_LEGACY : para->getStreamManager()->getStream(streamIndex);
+	LB_Kernel_TurbulentViscosityCumulantK17CompChim < turbulenceModel, false, true  > <<< cudaGrid.grid, cudaGrid.threads, 0, stream >>>(   para->getParD(level)->omega, 	
+																											para->getParD(level)->typeOfGridNode, 										para->getParD(level)->neighborX,	
+																											para->getParD(level)->neighborY,	
+																											para->getParD(level)->neighborZ,	
+																											para->getParD(level)->distributions.f[0],	
+																											para->getParD(level)->rho,		
+																											para->getParD(level)->velocityX,		
+																											para->getParD(level)->velocityY,	
+																											para->getParD(level)->velocityZ,	
+																											para->getParD(level)->turbViscosity,
+																											para->getSGSConstant(),
+																											(unsigned long)para->getParD(level)->numberOfNodes,	
+																											level,				
+																											para->getIsBodyForce(),				
+																											para->getForcesDev(),				
+																											para->getParD(level)->forceX_SP,	
+																											para->getParD(level)->forceY_SP,
+																											para->getParD(level)->forceZ_SP,
+																											para->getQuadricLimitersDev(),			
+																											para->getParD(level)->isEvenTimestep,
+																											indices,
+        																									size_indices);
+	getLastCudaError("LB_Kernel_TurbulentViscosityCumulantK17CompChim execution failed");
+}
+template<TurbulenceModel turbulenceModel>
+void TurbulentViscosityCumulantK17CompChim<turbulenceModel>::runOnIndicesWithMacroscopicVariableOutputAndApplyBodyForce(	const unsigned int *indices, unsigned int size_indices, int streamIndex)
+{
+	cudaStream_t stream = (streamIndex == -1) ? CU_STREAM_LEGACY : para->getStreamManager()->getStream(streamIndex);
+	LB_Kernel_TurbulentViscosityCumulantK17CompChim < turbulenceModel, true, true  > <<< cudaGrid.grid, cudaGrid.threads, 0, stream >>>(   para->getParD(level)->omega, 	
+																											para->getParD(level)->typeOfGridNode, 										para->getParD(level)->neighborX,	
+																											para->getParD(level)->neighborY,	
+																											para->getParD(level)->neighborZ,	
+																											para->getParD(level)->distributions.f[0],	
+																											para->getParD(level)->rho,		
+																											para->getParD(level)->velocityX,		
+																											para->getParD(level)->velocityY,	
+																											para->getParD(level)->velocityZ,	
+																											para->getParD(level)->turbViscosity,
+																											para->getSGSConstant(),
+																											(unsigned long)para->getParD(level)->numberOfNodes,	
+																											level,				
+																											para->getIsBodyForce(),				
+																											para->getForcesDev(),				
+																											para->getParD(level)->forceX_SP,	
+																											para->getParD(level)->forceY_SP,
+																											para->getParD(level)->forceZ_SP,
+																											para->getQuadricLimitersDev(),			
+																											para->getParD(level)->isEvenTimestep,
+																											indices,
+        																									size_indices);
+	getLastCudaError("LB_Kernel_TurbulentViscosityCumulantK17CompChim execution failed");
+}
 template<TurbulenceModel turbulenceModel>
 TurbulentViscosityCumulantK17CompChim<turbulenceModel>::TurbulentViscosityCumulantK17CompChim(std::shared_ptr<Parameter> para, int level)
 {

--- a/src/gpu/VirtualFluids_GPU/Kernel/Kernels/TurbulentViscosityKernels/FluidFlow/Compressible/CumulantK17chim/TurbulentViscosityCumulantK17CompChim.h
+++ b/src/gpu/VirtualFluids_GPU/Kernel/Kernels/TurbulentViscosityKernels/FluidFlow/Compressible/CumulantK17chim/TurbulentViscosityCumulantK17CompChim.h
@@ -11,7 +11,9 @@ public:
 	static std::shared_ptr< TurbulentViscosityCumulantK17CompChim<turbulenceModel> > getNewInstance(std::shared_ptr< Parameter> para, int level);
 	void run() override;
    void runOnIndices(const unsigned int *indices, unsigned int size_indices, int stream = -1) override;
+    void runOnIndicesWithMacroscopicVariableOutput(	const unsigned int *indices, unsigned int size_indices, int streamIndex = -1) override;
+    void runOnIndicesWithApplyBodyForce( const unsigned int *indices, unsigned int size_indices, int streamIndex = -1) override;
+    void runOnIndicesWithMacroscopicVariableOutputAndApplyBodyForce( const unsigned int *indices, unsigned int size_indices, int streamIndex = -1) override;
 private:
    TurbulentViscosityCumulantK17CompChim();
    TurbulentViscosityCumulantK17CompChim(std::shared_ptr<Parameter> para, int level);

--- a/src/gpu/VirtualFluids_GPU/Parameter/Parameter.h
+++ b/src/gpu/VirtualFluids_GPU/Parameter/Parameter.h
@@ -372,6 +372,12 @@ struct LBMSimulationParameter {
    uint numberOfFluidNodes;
    uint *fluidNodeIndicesBorder;
    uint numberOfFluidNodesBorder;
+    uint *indicesWithMacroscopicVariableOutput;
+    uint numberOfIndicesWithMacroscopicVariableOutput;
+    uint *indicesWithApplyBodyForce;              
+    uint numberOfIndicesWithApplyBodyForce;
+    uint *indicesWithMacroscopicVariableOutputAndApplyBodyForce;    
+    uint numberOfIndicesWithMacroscopicVariableOutputAndApplyBodyForce;
 };
 //! \brief Class for LBM-parameter management