Shamrock/doxygen/sph_2src_2modules_2DiffOperator_8cpp_source.html

// -------------------------------------------------------//

//

// SHAMROCK code for hydrodynamics

// Copyright (c) 2021-2026 Timothée David--Cléris <tim.shamrock@proton.me>

// SPDX-License-Identifier: CeCILL Free Software License Agreement v2.1

// Shamrock is licensed under the CeCILL 2.1 License, see LICENSE for more information

//

// -------------------------------------------------------//


#include "shambase/stacktrace.hpp"

#include "shammath/sphkernels.hpp"

#include "shammodels/sph/math/density.hpp"

#include "shammodels/sph/modules/DiffOperator.hpp"

#include "shamrock/scheduler/InterfacesUtility.hpp"


template<class Tvec, template<class> class SPHKernel>

void shammodels::sph::modules::DiffOperators<Tvec, SPHKernel>::update_divv() {


    StackEntry stack_loc{};

    shamlog_debug_ln("SPH", "Updating divv");


    Tscal gpart_mass = solver_config.gpart_mass;


    using namespace shamrock;

    using namespace shamrock::patch;


    PatchDataLayerLayout &pdl = scheduler().pdl_old();


    shambase::DistributedData<PatchDataLayer> &mpdats = storage.merged_patchdata_ghost.get();


    auto &merged_xyzh = storage.merged_xyzh.get();


    shamrock::patch::PatchDataLayerLayout &ghost_layout

        = shambase::get_check_ref(storage.ghost_layout.get());

    u32 ihpart_interf = ghost_layout.get_field_idx<Tscal>("hpart");

    u32 iuint_interf  = ghost_layout.get_field_idx<Tscal>("uint");

    u32 ivxyz_interf  = ghost_layout.get_field_idx<Tvec>("vxyz");

    u32 iomega_interf = ghost_layout.get_field_idx<Tscal>("omega");


    const u32 idivv = pdl.get_field_idx<Tscal>("divv");

    scheduler().for_each_patchdata_nonempty([&](Patch cur_p, PatchDataLayer &pdat) {

        PatchDataLayer &mpdat = mpdats.get(cur_p.id_patch);


        sham::DeviceBuffer<Tvec> &buf_xyz

            = merged_xyzh.get(cur_p.id_patch).template get_field_buf_ref<Tvec>(0);

        sham::DeviceBuffer<Tvec> &buf_vxyz   = mpdat.get_field_buf_ref<Tvec>(ivxyz_interf);

        sham::DeviceBuffer<Tscal> &buf_hpart = mpdat.get_field_buf_ref<Tscal>(ihpart_interf);

        sham::DeviceBuffer<Tscal> &buf_omega = mpdat.get_field_buf_ref<Tscal>(iomega_interf);

        sham::DeviceBuffer<Tscal> &buf_uint  = mpdat.get_field_buf_ref<Tscal>(iuint_interf);

        sham::DeviceBuffer<Tscal> &buf_divv  = pdat.get_field_buf_ref<Tscal>(idivv);


        sycl::range range_npart{pdat.get_obj_cnt()};


        tree::ObjectCache &pcache

            = shambase::get_check_ref(storage.neigh_cache).get_cache(cur_p.id_patch);


        {

            NamedStackEntry tmppp{"compute divv"};


            sham::EventList depends_list;


            auto xyz        = buf_xyz.get_read_access(depends_list);

            auto vxyz       = buf_vxyz.get_read_access(depends_list);

            auto hpart      = buf_hpart.get_read_access(depends_list);

            auto omega      = buf_omega.get_read_access(depends_list);

            auto divv       = buf_divv.get_write_access(depends_list);

            auto ploop_ptrs = pcache.get_read_access(depends_list);


            sham::DeviceQueue &q = shamsys::instance::get_compute_scheduler().get_queue();


            auto e = q.submit(depends_list, [&](sycl::handler &cgh) {

                const Tscal pmass = gpart_mass;


                tree::ObjectCacheIterator particle_looper(ploop_ptrs);


                constexpr Tscal Rker2 = Kernel::Rkern * Kernel::Rkern;


                shambase::parallel_for(cgh, pdat.get_obj_cnt(), "compute divv", [=](i32 id_a) {

                    using namespace shamrock::sph;


                    Tvec sum_axyz  = {0, 0, 0};

                    Tscal sum_du_a = 0;

                    Tscal h_a      = hpart[id_a];

                    Tvec xyz_a     = xyz[id_a];

                    Tvec vxyz_a    = vxyz[id_a];

                    Tscal omega_a  = omega[id_a];


                    Tscal rho_a = rho_h(pmass, h_a, Kernel::hfactd);

                    // Tscal rho_a_sq  = rho_a * rho_a;

                    // Tscal rho_a_inv = 1. / rho_a;

                    Tscal inv_rho_omega_a = 1. / (omega_a * rho_a);


                    Tscal sum_nabla_v = 0;


                    particle_looper.for_each_object(id_a, [&](u32 id_b) {

                        // compute only omega_a

                        Tvec dr    = xyz_a - xyz[id_b];

                        Tscal rab2 = sycl::dot(dr, dr);

                        Tscal h_b  = hpart[id_b];


                        if (rab2 > h_a * h_a * Rker2 && rab2 > h_b * h_b * Rker2) {

                            return;

                        }


                        Tscal rab   = sycl::sqrt(rab2);

                        Tvec vxyz_b = vxyz[id_b];

                        Tvec v_ab   = vxyz_a - vxyz_b;


                        Tvec r_ab_unit = dr / rab;


                        if (rab < 1e-9) {

                            r_ab_unit = {0, 0, 0};

                        }


                        Tvec dWab_a = Kernel::dW_3d(rab, h_a) * r_ab_unit;


                        sum_nabla_v += pmass * sycl::dot(v_ab, dWab_a);

                    });


                    divv[id_a] = -inv_rho_omega_a * sum_nabla_v;

                });

            });


            buf_xyz.complete_event_state(e);

            buf_vxyz.complete_event_state(e);

            buf_hpart.complete_event_state(e);

            buf_omega.complete_event_state(e);

            buf_divv.complete_event_state(e);


            sham::EventList resulting_events;

            resulting_events.add_event(e);

            pcache.complete_event_state(resulting_events);

        }

    });

}


template<class Tvec, template<class> class SPHKernel>

void shammodels::sph::modules::DiffOperators<Tvec, SPHKernel>::update_curlv() {


    StackEntry stack_loc{};

    shamlog_debug_ln("SPH", "Updating curlv");


    Tscal gpart_mass = solver_config.gpart_mass;


    using namespace shamrock;

    using namespace shamrock::patch;


    PatchDataLayerLayout &pdl = scheduler().pdl_old();


    shambase::DistributedData<PatchDataLayer> &mpdats = storage.merged_patchdata_ghost.get();


    auto &merged_xyzh = storage.merged_xyzh.get();


    shamrock::patch::PatchDataLayerLayout &ghost_layout

        = shambase::get_check_ref(storage.ghost_layout.get());

    u32 ihpart_interf = ghost_layout.get_field_idx<Tscal>("hpart");

    u32 iuint_interf  = ghost_layout.get_field_idx<Tscal>("uint");

    u32 ivxyz_interf  = ghost_layout.get_field_idx<Tvec>("vxyz");

    u32 iomega_interf = ghost_layout.get_field_idx<Tscal>("omega");


    const u32 icurlv = pdl.get_field_idx<Tvec>("curlv");

    scheduler().for_each_patchdata_nonempty([&](Patch cur_p, PatchDataLayer &pdat) {

        PatchDataLayer &mpdat = mpdats.get(cur_p.id_patch);


        sham::DeviceBuffer<Tvec> &buf_xyz

            = merged_xyzh.get(cur_p.id_patch).template get_field_buf_ref<Tvec>(0);

        sham::DeviceBuffer<Tvec> &buf_vxyz   = mpdat.get_field_buf_ref<Tvec>(ivxyz_interf);

        sham::DeviceBuffer<Tscal> &buf_hpart = mpdat.get_field_buf_ref<Tscal>(ihpart_interf);

        sham::DeviceBuffer<Tscal> &buf_omega = mpdat.get_field_buf_ref<Tscal>(iomega_interf);

        sham::DeviceBuffer<Tscal> &buf_uint  = mpdat.get_field_buf_ref<Tscal>(iuint_interf);

        sham::DeviceBuffer<Tvec> &buf_curlv  = pdat.get_field_buf_ref<Tvec>(icurlv);


        sycl::range range_npart{pdat.get_obj_cnt()};


        tree::ObjectCache &pcache

            = shambase::get_check_ref(storage.neigh_cache).get_cache(cur_p.id_patch);


        {

            NamedStackEntry tmppp{"compute curlv"};


            sham::EventList depends_list;

            auto xyz        = buf_xyz.get_read_access(depends_list);

            auto vxyz       = buf_vxyz.get_read_access(depends_list);

            auto hpart      = buf_hpart.get_read_access(depends_list);

            auto omega      = buf_omega.get_read_access(depends_list);

            auto curlv      = buf_curlv.get_write_access(depends_list);

            auto ploop_ptrs = pcache.get_read_access(depends_list);


            sham::DeviceQueue &q = shamsys::instance::get_compute_scheduler().get_queue();


            auto e = q.submit(depends_list, [&](sycl::handler &cgh) {

                const Tscal pmass = gpart_mass;


                tree::ObjectCacheIterator particle_looper(ploop_ptrs);


                constexpr Tscal Rker2 = Kernel::Rkern * Kernel::Rkern;


                shambase::parallel_for(cgh, pdat.get_obj_cnt(), "compute curlv", [=](i32 id_a) {

                    using namespace shamrock::sph;


                    Tvec sum_axyz  = {0, 0, 0};

                    Tscal sum_du_a = 0;

                    Tscal h_a      = hpart[id_a];

                    Tvec xyz_a     = xyz[id_a];

                    Tvec vxyz_a    = vxyz[id_a];

                    Tscal omega_a  = omega[id_a];


                    Tscal rho_a = rho_h(pmass, h_a, Kernel::hfactd);

                    // Tscal rho_a_sq  = rho_a * rho_a;

                    // Tscal rho_a_inv = 1. / rho_a;

                    Tscal inv_rho_omega_a = 1. / (omega_a * rho_a);


                    Tvec sum_nabla_cross_v{};


                    particle_looper.for_each_object(id_a, [&](u32 id_b) {

                        // compute only omega_a

                        Tvec dr    = xyz_a - xyz[id_b];

                        Tscal rab2 = sycl::dot(dr, dr);

                        Tscal h_b  = hpart[id_b];


                        if (rab2 > h_a * h_a * Rker2 && rab2 > h_b * h_b * Rker2) {

                            return;

                        }


                        Tscal rab   = sycl::sqrt(rab2);

                        Tvec vxyz_b = vxyz[id_b];

                        Tvec v_ab   = vxyz_a - vxyz_b;


                        Tvec r_ab_unit = dr / rab;


                        if (rab < 1e-9) {

                            r_ab_unit = {0, 0, 0};

                        }


                        Tvec dWab_a = Kernel::dW_3d(rab, h_a) * r_ab_unit;


                        sum_nabla_cross_v += pmass * sycl::cross(v_ab, dWab_a);

                    });


                    curlv[id_a] = -inv_rho_omega_a * sum_nabla_cross_v;

                });

            });


            buf_xyz.complete_event_state(e);

            buf_vxyz.complete_event_state(e);

            buf_hpart.complete_event_state(e);

            buf_omega.complete_event_state(e);

            buf_curlv.complete_event_state(e);


            sham::EventList resulting_events;

            resulting_events.add_event(e);

            pcache.complete_event_state(resulting_events);

        }

    });

}


using namespace shammath;

template class shammodels::sph::modules::DiffOperators<f64_3, M4>;

template class shammodels::sph::modules::DiffOperators<f64_3, M6>;

template class shammodels::sph::modules::DiffOperators<f64_3, M8>;


template class shammodels::sph::modules::DiffOperators<f64_3, C2>;

template class shammodels::sph::modules::DiffOperators<f64_3, C4>;

template class shammodels::sph::modules::DiffOperators<f64_3, C6>;

shammodels::gsph::names::newtonian::vxyz
constexpr const char * vxyz
3-velocity field
Definition FieldNames.hpp:43

shammodels::gsph::names::common::xyz
constexpr const char * xyz
Position field (3D coordinates).
Definition FieldNames.hpp:33

shammodels::gsph::names::common::hpart
constexpr const char * hpart
Smoothing length field.
Definition FieldNames.hpp:34

shammodels::gsph::names::newtonian::omega
constexpr const char * omega
Grad-h correction factor \Omega.
Definition FieldNames.hpp:64

InterfacesUtility.hpp

u32
std::uint32_t u32
32 bit unsigned integer
Definition aliases_int.hpp:27

i32
std::int32_t i32
32 bit integer
Definition aliases_int.hpp:23

sham::DeviceBuffer
A buffer allocated in USM (Unified Shared Memory).
Definition DeviceBuffer.hpp:106

sham::DeviceBuffer::complete_event_state
void complete_event_state(sycl::event e) const
Complete the event state of the buffer.
Definition DeviceBuffer.hpp:368

sham::DeviceBuffer::get_read_access
const T * get_read_access(sham::EventList &depends_list, SourceLocation src_loc=SourceLocation{}) const
Get a read-only pointer to the buffer's data.
Definition DeviceBuffer.hpp:331

sham::DeviceQueue
A SYCL queue associated with a device and a context.
Definition DeviceQueue.hpp:32

sham::DeviceQueue::submit
sycl::event submit(Fct &&fct)
Submits a kernel to the SYCL queue.
Definition DeviceQueue.hpp:101

sham::EventList
Class to manage a list of SYCL events.
Definition EventList.hpp:31

sham::EventList::add_event
void add_event(sycl::event e)
Add an event to the list of events.
Definition EventList.hpp:87

shambase::DistributedData
Represents a collection of objects distributed across patches identified by a u64 id.
Definition DistributedData.hpp:43

shambase::DistributedData::get
T & get(u64 id)
Returns a reference to an object in the collection.
Definition DistributedData.hpp:145

shammodels::sph::modules::DiffOperators
Definition DiffOperator.hpp:28

shamrock::patch::PatchDataLayerLayout
Definition PatchDataLayerLayout.hpp:66

shamrock::patch::PatchDataLayerLayout::get_field_idx
u32 get_field_idx(const std::string &field_name) const
Get the field id if matching name & type.
Definition PatchDataLayerLayout.hpp:349

shamrock::patch::PatchDataLayer
PatchDataLayer container class, the layout is described in patchdata_layout.
Definition PatchDataLayer.hpp:35

shamrock.tree::ObjectCacheIterator
Definition TreeTraversal.hpp:487

density.hpp

shambase::get_check_ref
T & get_check_ref(const std::unique_ptr< T > &ptr, SourceLocation loc=SourceLocation())
Takes a std::unique_ptr and returns a reference to the object it holds. It throws a std::runtime_erro...
Definition memory.hpp:110

shammath
namespace for math utility
Definition AABB.hpp:26

shamrock
namespace for the main framework
Definition __init__.py:1

DiffOperator.hpp

sphkernels.hpp
sph kernels

stacktrace.hpp
This file contains the definition for the stacktrace related functionality.

NamedStackEntry
shambase::details::NamedBasicStackEntry NamedStackEntry
Alias for shambase::details::NamedBasicStackEntry.
Definition stacktrace.hpp:249

StackEntry
shambase::details::BasicStackEntry StackEntry
Alias for shambase::details::BasicStackEntry.
Definition stacktrace.hpp:242

shamrock::patch::Patch
Patch object that contain generic patch information.
Definition Patch.hpp:33

shamrock::patch::Patch::id_patch
u64 id_patch
unique key that identify the patch
Definition Patch.hpp:86

shamrock.tree::ObjectCache
Definition TreeTraversal.hpp:375