Shamrock/doxygen/SourceStep_8cpp_source.html

// -------------------------------------------------------//

//

// SHAMROCK code for hydrodynamics

// Copyright (c) 2021-2026 Timothée David--Cléris <tim.shamrock@proton.me>

// SPDX-License-Identifier: CeCILL Free Software License Agreement v2.1

// Shamrock is licensed under the CeCILL 2.1 License, see LICENSE for more information

//

// -------------------------------------------------------//


#include "shammodels/zeus/modules/SourceStep.hpp"

#include "shammodels/zeus/modules/FaceFlagger.hpp"

#include "shammodels/zeus/modules/ValueLoader.hpp"

#include "shamrock/scheduler/InterfacesUtility.hpp"

#include "shamrock/scheduler/SchedulerUtility.hpp"

#include "shamsys/legacy/log.hpp"


template<class Tvec, class TgridVec>


void shammodels::zeus::modules::SourceStep<Tvec, TgridVec>::compute_forces() {

    StackEntry stack_loc{};


    using namespace shamrock::patch;

    using namespace shamrock;

    using namespace shammath;

    using MergedPDat = shamrock::MergedPatchData;


    using Flagger = FaceFlagger<Tvec, TgridVec>;


    using Block = typename Config::AMRBlock;


    ComputeField<Tscal> &rho_xm = storage.rho_n_xm.get();

    ComputeField<Tscal> &rho_ym = storage.rho_n_ym.get();

    ComputeField<Tscal> &rho_zm = storage.rho_n_zm.get();


    ComputeField<Tscal> &pressure_field = storage.pressure.get();

    ComputeField<Tscal> &p_xm           = storage.pres_n_xm.get();

    ComputeField<Tscal> &p_ym           = storage.pres_n_ym.get();

    ComputeField<Tscal> &p_zm           = storage.pres_n_zm.get();


    shamrock::SchedulerUtility utility(scheduler());

    storage.forces.set(utility.make_compute_field<Tvec>("forces", Block::block_size, [&](u64 id) {

        return storage.merged_patchdata_ghost.get().get(id).total_elements;

    }));


    shamrock::patch::PatchDataLayerLayout &ghost_layout

        = shambase::get_check_ref(storage.ghost_layout.get());

    u32 irho_interf = ghost_layout.get_field_idx<Tscal>("rho");


    scheduler().for_each_patchdata_nonempty([&](Patch p, PatchDataLayer &pdat) {

        MergedPDat &mpdat = storage.merged_patchdata_ghost.get().get(p.id_patch);


        sham::DeviceBuffer<TgridVec> &buf_cell_min = mpdat.pdat.get_field_buf_ref<TgridVec>(0);

        sham::DeviceBuffer<TgridVec> &buf_cell_max = mpdat.pdat.get_field_buf_ref<TgridVec>(1);


        Tscal coord_conv_fact = solver_config.grid_coord_to_pos_fact / Block::Nside;


        sham::DeviceBuffer<Tscal> &buf_p   = pressure_field.get_buf_check(p.id_patch);

        sham::DeviceBuffer<Tscal> &buf_rho = mpdat.pdat.get_field_buf_ref<Tscal>(irho_interf);


        sham::DeviceBuffer<Tscal> &buf_rho_xm = rho_xm.get_buf_check(p.id_patch);

        sham::DeviceBuffer<Tscal> &buf_rho_ym = rho_ym.get_buf_check(p.id_patch);

        sham::DeviceBuffer<Tscal> &buf_rho_zm = rho_zm.get_buf_check(p.id_patch);


        sham::DeviceBuffer<Tscal> &buf_p_xm = p_xm.get_buf_check(p.id_patch);

        sham::DeviceBuffer<Tscal> &buf_p_ym = p_ym.get_buf_check(p.id_patch);

        sham::DeviceBuffer<Tscal> &buf_p_zm = p_zm.get_buf_check(p.id_patch);


        sham::DeviceBuffer<Tvec> &forces_buf = storage.forces.get().get_buf_check(p.id_patch);


        sham::DeviceQueue &q = shamsys::instance::get_compute_scheduler().get_queue();


        sham::EventList depends_list;


        auto cell_min = buf_cell_min.get_read_access(depends_list);

        auto cell_max = buf_cell_max.get_read_access(depends_list);

        auto rho      = buf_rho.get_read_access(depends_list);

        auto rho_xm   = buf_rho_xm.get_read_access(depends_list);

        auto rho_ym   = buf_rho_ym.get_read_access(depends_list);

        auto rho_zm   = buf_rho_zm.get_read_access(depends_list);

        auto press    = buf_p.get_read_access(depends_list);

        auto p_xm     = buf_p_xm.get_read_access(depends_list);

        auto p_ym     = buf_p_ym.get_read_access(depends_list);

        auto p_zm     = buf_p_zm.get_read_access(depends_list);


        auto grad_p = forces_buf.get_write_access(depends_list);


        auto e = q.submit(depends_list, [&](sycl::handler &cgh) {

            shambase::parallel_for(

                cgh, mpdat.total_elements * Block::block_size, "compute grad p", [=](u64 id_a) {

                    u32 block_id = id_a / Block::block_size;

                    Tvec d_cell

                        = (cell_max[block_id] - cell_min[block_id]).template convert<Tscal>()

                          * coord_conv_fact;


                    // clang-format off

                    Tscal rho_i_j_k   = rho[id_a];

                    Tscal rho_im1_j_k = rho_xm[id_a];

                    Tscal rho_i_jm1_k = rho_ym[id_a];

                    Tscal rho_i_j_km1 = rho_zm[id_a];


                    Tscal p_i_j_k   = press[id_a];

                    Tscal p_im1_j_k = p_xm[id_a];

                    Tscal p_i_jm1_k = p_ym[id_a];

                    Tscal p_i_j_km1 = p_zm[id_a];


                    Tvec dp = {

                        p_i_j_k - p_im1_j_k,

                        p_i_j_k - p_i_jm1_k,

                        p_i_j_k - p_i_j_km1

                    };


                    Tvec avg_rho =

                        Tvec{

                            rho_i_j_k + rho_im1_j_k,

                            rho_i_j_k + rho_i_jm1_k,

                            rho_i_j_k + rho_i_j_km1

                            } * Tscal{0.5};


                    Tvec grad_p_source_term = dp / (avg_rho * d_cell);


                    //sycl::ext::oneapi::experimental::printf("(%f %f %f) (%f %f %f) (%f %f %f)\n"

                    //    , dp.x(),dp.y(),dp.z()

                    //    , avg_rho.x(),avg_rho.y(),avg_rho.z()

                    //    , grad_p_source_term.x(),grad_p_source_term.y(),grad_p_source_term.z()

                    //    );

                    //grad_p[id_a] = grad_p_source_term;

                    grad_p[id_a] = -grad_p_source_term;

                    // clang-format on

                });

        });


        buf_cell_min.complete_event_state(e);

        buf_cell_max.complete_event_state(e);

        buf_rho.complete_event_state(e);

        buf_rho_xm.complete_event_state(e);

        buf_rho_ym.complete_event_state(e);

        buf_rho_zm.complete_event_state(e);

        buf_p.complete_event_state(e);

        buf_p_xm.complete_event_state(e);

        buf_p_ym.complete_event_state(e);

        buf_p_zm.complete_event_state(e);


        forces_buf.complete_event_state(e);

    });


    scheduler().for_each_patchdata_nonempty([&](Patch p, PatchDataLayer &pdat) {

        MergedPDat &mpdat = storage.merged_patchdata_ghost.get().get(p.id_patch);


        sham::DeviceBuffer<TgridVec> &buf_cell_min = mpdat.pdat.get_field_buf_ref<TgridVec>(0);

        sham::DeviceBuffer<TgridVec> &buf_cell_max = mpdat.pdat.get_field_buf_ref<TgridVec>(1);


        sham::DeviceBuffer<Tvec> &forces_buf = storage.forces.get().get_buf_check(p.id_patch);


        sham::DeviceBuffer<Tscal> &buf_rho = mpdat.pdat.get_field_buf_ref<Tscal>(irho_interf);


        Tscal coord_conv_fact = solver_config.grid_coord_to_pos_fact;


        sham::DeviceQueue &q = shamsys::instance::get_compute_scheduler().get_queue();


        sham::EventList depends_list;

        auto cell_min = buf_cell_min.get_read_access(depends_list);

        auto cell_max = buf_cell_max.get_read_access(depends_list);

        auto forces   = forces_buf.get_write_access(depends_list);

        auto rho      = buf_rho.get_read_access(depends_list);


        auto e = q.submit(depends_list, [&](sycl::handler &cgh) {

            shambase::parallel_for(cgh, pdat.get_obj_cnt(), "add ext force", [=](u64 id_a) {

                Tvec block_min    = cell_min[id_a].template convert<Tscal>();

                Tvec block_max    = cell_max[id_a].template convert<Tscal>();

                Tvec delta_cell   = (block_max - block_min) / Block::side_size;

                Tvec delta_cell_h = delta_cell * Tscal(0.5);


                Block::for_each_cell_in_block(delta_cell, [=](u32 lid, Tvec delta) {

                    auto get_ext_force = [](Tvec r) {

                        Tscal d = sycl::length(r);

                        return r / (d * d * d + 1e-5);

                    };


                    // forces[id_a * Block::block_size + lid] +=

                    //     get_ext_force(block_min + delta + delta_cell_h);

                });

            });

        });


        buf_cell_min.complete_event_state(e);

        buf_cell_max.complete_event_state(e);

        forces_buf.complete_event_state(e);

        buf_rho.complete_event_state(e);


        if (storage.forces.get().get_field(p.id_patch).has_nan()) {

            logger::err_ln("[Zeus]", "nan detected in forces");

            throw shambase::make_except_with_loc<std::runtime_error>("detected nan");

        }

        // logger::raw_ln(storage.forces.get().get_field(p.id_patch).compute_max());

    });

}


template<class Tvec, class TgridVec>


void shammodels::zeus::modules::SourceStep<Tvec, TgridVec>::apply_force(Tscal dt) {

    StackEntry stack_loc{};


    using namespace shamrock::patch;

    using namespace shamrock;

    using namespace shammath;

    using MergedPDat = shamrock::MergedPatchData;


    using Flagger = FaceFlagger<Tvec, TgridVec>;


    using Block = typename Config::AMRBlock;


    shamrock::patch::PatchDataLayerLayout &ghost_layout

        = shambase::get_check_ref(storage.ghost_layout.get());

    u32 ivel_interf = ghost_layout.get_field_idx<Tvec>("vel");


    scheduler().for_each_patchdata_nonempty([&](Patch p, PatchDataLayer &pdat) {

        MergedPDat &mpdat = storage.merged_patchdata_ghost.get().get(p.id_patch);


        sham::DeviceBuffer<Tvec> &forces_buf = storage.forces.get().get_buf_check(p.id_patch);

        sham::DeviceBuffer<Tvec> &vel_buf    = mpdat.pdat.get_field_buf_ref<Tvec>(ivel_interf);


        sham::DeviceQueue &q = shamsys::instance::get_compute_scheduler().get_queue();


        sham::EventList depends_list;


        auto forces = forces_buf.get_read_access(depends_list);

        auto vel    = vel_buf.get_write_access(depends_list);


        auto e = q.submit(depends_list, [&](sycl::handler &cgh) {

            shambase::parallel_for(

                cgh, mpdat.total_elements * Block::block_size, "add ext force", [=](u64 id_a) {

                    vel[id_a] += dt * forces[id_a];

                });

        });


        forces_buf.complete_event_state(e);

        vel_buf.complete_event_state(e);


        // logger::raw_ln(storage.forces.get().get_field(p.id_patch).compute_max());

    });


    storage.forces.reset();

}


template<class Tvec, class TgridVec>


void shammodels::zeus::modules::SourceStep<Tvec, TgridVec>::compute_AV() {

    StackEntry stack_loc{};


    using namespace shamrock::patch;

    using namespace shamrock;

    using namespace shammath;

    using MergedPDat = shamrock::MergedPatchData;


    using Block = typename Config::AMRBlock;


    ComputeField<Tvec> &vel_n    = storage.vel_n.get();

    ComputeField<Tvec> &vel_n_xp = storage.vel_n_xp.get();

    ComputeField<Tvec> &vel_n_yp = storage.vel_n_yp.get();

    ComputeField<Tvec> &vel_n_zp = storage.vel_n_zp.get();


    shamrock::SchedulerUtility utility(scheduler());

    storage.q_AV.set(utility.make_compute_field<Tvec>("q_AV", Block::block_size, [&](u64 id) {

        return storage.merged_patchdata_ghost.get().get(id).total_elements;

    }));


    shamrock::patch::PatchDataLayerLayout &ghost_layout

        = shambase::get_check_ref(storage.ghost_layout.get());

    u32 irho_interf = ghost_layout.get_field_idx<Tscal>("rho");

    u32 ivel_interf = ghost_layout.get_field_idx<Tvec>("vel");


    scheduler().for_each_patchdata_nonempty([&](Patch p, PatchDataLayer &pdat) {

        MergedPDat &mpdat = storage.merged_patchdata_ghost.get().get(p.id_patch);


        sham::DeviceBuffer<TgridVec> &buf_cell_min = mpdat.pdat.get_field_buf_ref<TgridVec>(0);

        sham::DeviceBuffer<TgridVec> &buf_cell_max = mpdat.pdat.get_field_buf_ref<TgridVec>(1);


        Tscal coord_conv_fact = solver_config.grid_coord_to_pos_fact / Block::Nside;


        sham::DeviceBuffer<Tscal> &buf_rho = mpdat.pdat.get_field_buf_ref<Tscal>(irho_interf);


        sham::DeviceBuffer<Tvec> &buf_vel    = vel_n.get_buf_check(p.id_patch);

        sham::DeviceBuffer<Tvec> &buf_vel_xp = vel_n_xp.get_buf_check(p.id_patch);

        sham::DeviceBuffer<Tvec> &buf_vel_yp = vel_n_yp.get_buf_check(p.id_patch);

        sham::DeviceBuffer<Tvec> &buf_vel_zp = vel_n_zp.get_buf_check(p.id_patch);


        sham::DeviceBuffer<Tvec> &q_AV_buf = storage.q_AV.get().get_buf_check(p.id_patch);


        sham::DeviceQueue &q = shamsys::instance::get_compute_scheduler().get_queue();


        sham::EventList depends_list;


        auto cell_min = buf_cell_min.get_read_access(depends_list);

        auto cell_max = buf_cell_max.get_read_access(depends_list);

        auto rho      = buf_rho.get_read_access(depends_list);

        auto vel      = buf_vel.get_read_access(depends_list);

        auto vel_xp   = buf_vel_xp.get_read_access(depends_list);

        auto vel_yp   = buf_vel_yp.get_read_access(depends_list);

        auto vel_zp   = buf_vel_zp.get_read_access(depends_list);

        auto q_AV     = q_AV_buf.get_write_access(depends_list);


        auto e = q.submit(depends_list, [&](sycl::handler &cgh) {

            shambase::parallel_for(

                cgh, mpdat.total_elements * Block::block_size, "compute AV", [=](u64 id_a) {

                    u32 block_id = id_a / Block::block_size;

                    Tvec d_cell

                        = (cell_max[block_id] - cell_min[block_id]).template convert<Tscal>()

                          * coord_conv_fact;


                    // clang-format off

                    Tscal rho_i_j_k   = rho[id_a];


                    Tvec vel_i_j_k = vel[id_a];

                    Tvec vel_ip1_j_k = vel_xp[id_a];

                    Tvec vel_i_jp1_k = vel_yp[id_a];

                    Tvec vel_i_j_kp1 = vel_zp[id_a];


                    Tvec dv = {

                        vel_ip1_j_k.x() - vel_i_j_k.x(),

                        vel_i_jp1_k.y() - vel_i_j_k.y(),

                        vel_i_j_kp1.z() - vel_i_j_k.z()

                    };


                    dv = sham::negative_part(dv);


                    constexpr Tscal C2 = 3;


                    q_AV[id_a] = C2*rho_i_j_k*(dv*dv);

                    // clang-format on

                });

        });


        buf_cell_min.complete_event_state(e);

        buf_cell_max.complete_event_state(e);

        buf_rho.complete_event_state(e);

        buf_vel.complete_event_state(e);

        buf_vel_xp.complete_event_state(e);

        buf_vel_yp.complete_event_state(e);

        buf_vel_zp.complete_event_state(e);

        q_AV_buf.complete_event_state(e);

    });

}


template<class Tvec, class TgridVec>

void shammodels::zeus::modules::SourceStep<Tvec, TgridVec>::apply_AV(Tscal dt) {

    StackEntry stack_loc{};


    using namespace shamrock::patch;

    using namespace shamrock;

    using namespace shammath;

    using MergedPDat = shamrock::MergedPatchData;


    using Block = typename Config::AMRBlock;


    ComputeField<Tvec> &q_AV_n    = storage.q_AV.get();

    ComputeField<Tvec> &q_AV_n_xm = storage.q_AV_n_xm.get();

    ComputeField<Tvec> &q_AV_n_ym = storage.q_AV_n_ym.get();

    ComputeField<Tvec> &q_AV_n_zm = storage.q_AV_n_zm.get();


    ComputeField<Tscal> &rho_xm = storage.rho_n_xm.get();

    ComputeField<Tscal> &rho_ym = storage.rho_n_ym.get();

    ComputeField<Tscal> &rho_zm = storage.rho_n_zm.get();


    ComputeField<Tvec> &vel_n    = storage.vel_n.get();

    ComputeField<Tvec> &vel_n_xp = storage.vel_n_xp.get();

    ComputeField<Tvec> &vel_n_yp = storage.vel_n_yp.get();

    ComputeField<Tvec> &vel_n_zp = storage.vel_n_zp.get();


    shamrock::patch::PatchDataLayerLayout &ghost_layout

        = shambase::get_check_ref(storage.ghost_layout.get());

    u32 irho_interf  = ghost_layout.get_field_idx<Tscal>("rho");

    u32 ieint_interf = ghost_layout.get_field_idx<Tscal>("eint");

    u32 ivel_interf  = ghost_layout.get_field_idx<Tvec>("vel");


    scheduler().for_each_patchdata_nonempty([&](Patch p, PatchDataLayer &pdat) {

        MergedPDat &mpdat = storage.merged_patchdata_ghost.get().get(p.id_patch);


        sham::DeviceBuffer<TgridVec> &buf_cell_min = mpdat.pdat.get_field_buf_ref<TgridVec>(0);

        sham::DeviceBuffer<TgridVec> &buf_cell_max = mpdat.pdat.get_field_buf_ref<TgridVec>(1);


        Tscal coord_conv_fact = solver_config.grid_coord_to_pos_fact / Block::Nside;


        sham::DeviceBuffer<Tscal> &buf_rho = mpdat.pdat.get_field_buf_ref<Tscal>(irho_interf);

        sham::DeviceBuffer<Tvec> &buf_vel  = mpdat.pdat.get_field_buf_ref<Tvec>(ivel_interf);


        sham::DeviceBuffer<Tvec> &buf_vel_xp = vel_n_xp.get_buf_check(p.id_patch);

        sham::DeviceBuffer<Tvec> &buf_vel_yp = vel_n_yp.get_buf_check(p.id_patch);

        sham::DeviceBuffer<Tvec> &buf_vel_zp = vel_n_zp.get_buf_check(p.id_patch);


        sham::DeviceBuffer<Tscal> &buf_rho_xm = rho_xm.get_buf_check(p.id_patch);

        sham::DeviceBuffer<Tscal> &buf_rho_ym = rho_ym.get_buf_check(p.id_patch);

        sham::DeviceBuffer<Tscal> &buf_rho_zm = rho_zm.get_buf_check(p.id_patch);


        sham::DeviceBuffer<Tvec> &q_AV_buf      = storage.q_AV.get().get_buf_check(p.id_patch);

        sham::DeviceBuffer<Tvec> &buf_q_AV_n_xm = q_AV_n_xm.get_buf_check(p.id_patch);

        sham::DeviceBuffer<Tvec> &buf_q_AV_n_ym = q_AV_n_ym.get_buf_check(p.id_patch);

        sham::DeviceBuffer<Tvec> &buf_q_AV_n_zm = q_AV_n_zm.get_buf_check(p.id_patch);


        sham::DeviceQueue &q = shamsys::instance::get_compute_scheduler().get_queue();


        sham::EventList depends_list;


        auto cell_min = buf_cell_min.get_read_access(depends_list);

        auto cell_max = buf_cell_max.get_read_access(depends_list);

        auto rho      = buf_rho.get_read_access(depends_list);

        auto rho_xm   = buf_rho_xm.get_read_access(depends_list);

        auto rho_ym   = buf_rho_ym.get_read_access(depends_list);

        auto rho_zm   = buf_rho_zm.get_read_access(depends_list);

        auto q_AV     = q_AV_buf.get_read_access(depends_list);

        auto q_AV_xm  = buf_q_AV_n_xm.get_read_access(depends_list);

        auto q_AV_ym  = buf_q_AV_n_ym.get_read_access(depends_list);

        auto q_AV_zm  = buf_q_AV_n_zm.get_read_access(depends_list);

        auto vel      = buf_vel.get_write_access(depends_list);


        auto e = q.submit(depends_list, [&](sycl::handler &cgh) {

            shambase::parallel_for(

                cgh, mpdat.total_elements * Block::block_size, "add vel AV", [=](u64 id_a) {

                    u32 block_id = id_a / Block::block_size;

                    Tvec d_cell

                        = (cell_max[block_id] - cell_min[block_id]).template convert<Tscal>()

                          * coord_conv_fact;


                    // clang-format off

                    Tscal rho_i_j_k   = rho[id_a];

                    Tscal rho_im1_j_k = rho_xm[id_a];

                    Tscal rho_i_jm1_k = rho_ym[id_a];

                    Tscal rho_i_j_km1 = rho_zm[id_a];


                    Tvec q_i_j_k   = q_AV[id_a];

                    Tvec q_im1_j_k = q_AV_xm[id_a];

                    Tvec q_i_jm1_k = q_AV_ym[id_a];

                    Tvec q_i_j_km1 = q_AV_zm[id_a];


                    Tvec avg_rho =

                        Tvec{

                            rho_i_j_k + rho_im1_j_k,

                            rho_i_j_k + rho_i_jm1_k,

                            rho_i_j_k + rho_i_j_km1

                            } * Tscal{0.5};


                    Tvec dq = {

                        q_i_j_k.x()-q_im1_j_k.x(),

                        q_i_j_k.y()-q_i_jm1_k.y(),

                        q_i_j_k.z()-q_i_j_km1.z()

                    };


                    vel[id_a] += - dt*(dq)/ (avg_rho * d_cell);

                    // clang-format on

                });

        });


        buf_cell_min.complete_event_state(e);

        buf_cell_max.complete_event_state(e);

        buf_rho.complete_event_state(e);

        buf_rho_xm.complete_event_state(e);

        buf_rho_ym.complete_event_state(e);

        buf_rho_zm.complete_event_state(e);

        q_AV_buf.complete_event_state(e);

        buf_q_AV_n_xm.complete_event_state(e);

        buf_q_AV_n_ym.complete_event_state(e);

        buf_q_AV_n_zm.complete_event_state(e);

        buf_vel.complete_event_state(e);

    });


    scheduler().for_each_patchdata_nonempty([&](Patch p, PatchDataLayer &pdat) {

        MergedPDat &mpdat = storage.merged_patchdata_ghost.get().get(p.id_patch);


        sham::DeviceBuffer<TgridVec> &buf_cell_min = mpdat.pdat.get_field_buf_ref<TgridVec>(0);

        sham::DeviceBuffer<TgridVec> &buf_cell_max = mpdat.pdat.get_field_buf_ref<TgridVec>(1);


        Tscal coord_conv_fact = solver_config.grid_coord_to_pos_fact / Block::Nside;


        sham::DeviceBuffer<Tscal> &buf_eint = mpdat.pdat.get_field_buf_ref<Tscal>(ieint_interf);


        sham::DeviceBuffer<Tvec> &buf_vel    = vel_n.get_buf_check(p.id_patch);

        sham::DeviceBuffer<Tvec> &buf_vel_xp = vel_n_xp.get_buf_check(p.id_patch);

        sham::DeviceBuffer<Tvec> &buf_vel_yp = vel_n_yp.get_buf_check(p.id_patch);

        sham::DeviceBuffer<Tvec> &buf_vel_zp = vel_n_zp.get_buf_check(p.id_patch);


        sham::DeviceBuffer<Tvec> &q_AV_buf      = storage.q_AV.get().get_buf_check(p.id_patch);

        sham::DeviceBuffer<Tvec> &buf_q_AV_n_xm = q_AV_n_xm.get_buf_check(p.id_patch);

        sham::DeviceBuffer<Tvec> &buf_q_AV_n_ym = q_AV_n_ym.get_buf_check(p.id_patch);

        sham::DeviceBuffer<Tvec> &buf_q_AV_n_zm = q_AV_n_zm.get_buf_check(p.id_patch);


        sham::DeviceQueue &q = shamsys::instance::get_compute_scheduler().get_queue();


        sham::EventList depends_list;

        auto cell_min = buf_cell_min.get_read_access(depends_list);

        auto cell_max = buf_cell_max.get_read_access(depends_list);

        auto vel      = buf_vel.get_read_access(depends_list);

        auto vel_xp   = buf_vel_xp.get_read_access(depends_list);

        auto vel_yp   = buf_vel_yp.get_read_access(depends_list);

        auto vel_zp   = buf_vel_zp.get_read_access(depends_list);

        auto q_AV     = q_AV_buf.get_read_access(depends_list);

        auto q_AV_xm  = buf_q_AV_n_xm.get_read_access(depends_list);

        auto q_AV_ym  = buf_q_AV_n_ym.get_read_access(depends_list);

        auto q_AV_zm  = buf_q_AV_n_zm.get_read_access(depends_list);

        auto eint     = buf_eint.get_write_access(depends_list);


        auto e = q.submit(depends_list, [&](sycl::handler &cgh) {

            shambase::parallel_for(

                cgh, pdat.get_obj_cnt() * Block::block_size, "add eint AV", [=](u64 id_a) {

                    u32 block_id = id_a / Block::block_size;

                    Tvec d_cell

                        = (cell_max[block_id] - cell_min[block_id]).template convert<Tscal>()

                          * coord_conv_fact;


                    // clang-format off

                    Tvec vel_i_j_k = vel[id_a];

                    Tvec vel_ip1_j_k = vel_xp[id_a];

                    Tvec vel_i_jp1_k = vel_yp[id_a];

                    Tvec vel_i_j_kp1 = vel_zp[id_a];


                    Tvec q_i_j_k   = q_AV[id_a];


                    Tvec dv = {

                        vel_ip1_j_k.x() - vel_i_j_k.x(),

                        vel_i_jp1_k.y() - vel_i_j_k.y(),

                        vel_i_j_kp1.z() - vel_i_j_k.z()

                    };


                    eint[id_a] += -dt*sycl::dot(q_i_j_k,dv/ d_cell);

                    // clang-format on

                });

        });


        buf_cell_min.complete_event_state(e);

        buf_cell_max.complete_event_state(e);

        buf_vel.complete_event_state(e);

        buf_vel_xp.complete_event_state(e);

        buf_vel_yp.complete_event_state(e);

        buf_vel_zp.complete_event_state(e);

        q_AV_buf.complete_event_state(e);

        buf_q_AV_n_xm.complete_event_state(e);

        buf_q_AV_n_ym.complete_event_state(e);

        buf_q_AV_n_zm.complete_event_state(e);

        buf_eint.complete_event_state(e);

    });

}


template<class Tvec, class TgridVec>

void shammodels::zeus::modules::SourceStep<Tvec, TgridVec>::compute_div_v() {

    StackEntry stack_loc{};

    using namespace shamrock::patch;

    using namespace shamrock;

    using namespace shammath;

    using MergedPDat = shamrock::MergedPatchData;


    using Flagger = FaceFlagger<Tvec, TgridVec>;


    using Block = typename Config::AMRBlock;


    shamrock::SchedulerUtility utility(scheduler());

    storage.div_v_n.set(

        utility.make_compute_field<Tscal>("div_v_n", Block::block_size, [&](u64 id) {

            return storage.merged_patchdata_ghost.get().get(id).total_elements;

        }));


    ComputeField<Tvec> &vel_n    = storage.vel_n.get();

    ComputeField<Tvec> &vel_n_xp = storage.vel_n_xp.get();

    ComputeField<Tvec> &vel_n_yp = storage.vel_n_yp.get();

    ComputeField<Tvec> &vel_n_zp = storage.vel_n_zp.get();


    ComputeField<Tscal> &div_v = storage.div_v_n.get();


    scheduler().for_each_patchdata_nonempty([&](Patch p, PatchDataLayer &pdat) {

        MergedPDat &mpdat = storage.merged_patchdata_ghost.get().get(p.id_patch);


        sham::DeviceBuffer<TgridVec> &buf_cell_min = mpdat.pdat.get_field_buf_ref<TgridVec>(0);

        sham::DeviceBuffer<TgridVec> &buf_cell_max = mpdat.pdat.get_field_buf_ref<TgridVec>(1);


        Tscal coord_conv_fact = solver_config.grid_coord_to_pos_fact / Block::Nside;


        sham::DeviceBuffer<Tvec> &buf_vel    = vel_n.get_buf_check(p.id_patch);

        sham::DeviceBuffer<Tvec> &buf_vel_xp = vel_n_xp.get_buf_check(p.id_patch);

        sham::DeviceBuffer<Tvec> &buf_vel_yp = vel_n_yp.get_buf_check(p.id_patch);

        sham::DeviceBuffer<Tvec> &buf_vel_zp = vel_n_zp.get_buf_check(p.id_patch);


        sham::DeviceBuffer<Tscal> &buf_div_v = div_v.get_buf_check(p.id_patch);


        sham::DeviceQueue &q = shamsys::instance::get_compute_scheduler().get_queue();


        sham::EventList depends_list;

        auto cell_min = buf_cell_min.get_read_access(depends_list);

        auto cell_max = buf_cell_max.get_read_access(depends_list);


        auto vel    = buf_vel.get_read_access(depends_list);

        auto vel_xp = buf_vel_xp.get_read_access(depends_list);

        auto vel_yp = buf_vel_yp.get_read_access(depends_list);

        auto vel_zp = buf_vel_zp.get_read_access(depends_list);


        auto divv = buf_div_v.get_write_access(depends_list);


        auto e = q.submit(depends_list, [&](sycl::handler &cgh) {

            shambase::parallel_for(

                cgh, pdat.get_obj_cnt() * Block::block_size, "compute divv", [=](u64 id_a) {

                    u32 block_id = id_a / Block::block_size;

                    Tvec d_cell

                        = (cell_max[block_id] - cell_min[block_id]).template convert<Tscal>()

                          * coord_conv_fact;


                    // clang-format off

                    Tvec vel_i_j_k = vel[id_a];

                    Tvec vel_ip1_j_k = vel_xp[id_a];

                    Tvec vel_i_jp1_k = vel_yp[id_a];

                    Tvec vel_i_j_kp1 = vel_zp[id_a];


                    Tvec dv = {

                        vel_ip1_j_k.x() - vel_i_j_k.x(),

                        vel_i_jp1_k.y() - vel_i_j_k.y(),

                        vel_i_j_kp1.z() - vel_i_j_k.z()

                    };


                    divv[id_a] += sycl::dot(dv,Tvec{1,1,1}/ d_cell);

                    // clang-format on

                });

        });


        buf_cell_min.complete_event_state(e);

        buf_cell_max.complete_event_state(e);

        buf_vel.complete_event_state(e);

        buf_vel_xp.complete_event_state(e);

        buf_vel_yp.complete_event_state(e);

        buf_vel_zp.complete_event_state(e);

        buf_div_v.complete_event_state(e);

    });

}


template<class Tvec, class TgridVec>

void shammodels::zeus::modules::SourceStep<Tvec, TgridVec>::update_eint_eos(Tscal dt) {

    StackEntry stack_loc{};


    using namespace shamrock::patch;

    using namespace shamrock;

    using namespace shammath;

    using MergedPDat = shamrock::MergedPatchData;


    using Block = typename Config::AMRBlock;


    ComputeField<Tscal> &div_v = storage.div_v_n.get();


    shamrock::patch::PatchDataLayerLayout &ghost_layout

        = shambase::get_check_ref(storage.ghost_layout.get());

    u32 irho_interf  = ghost_layout.get_field_idx<Tscal>("rho");

    u32 ieint_interf = ghost_layout.get_field_idx<Tscal>("eint");

    u32 ivel_interf  = ghost_layout.get_field_idx<Tvec>("vel");


    scheduler().for_each_patchdata_nonempty([&](Patch p, PatchDataLayer &pdat) {

        MergedPDat &mpdat = storage.merged_patchdata_ghost.get().get(p.id_patch);


        sham::DeviceBuffer<TgridVec> &buf_cell_min = mpdat.pdat.get_field_buf_ref<TgridVec>(0);

        sham::DeviceBuffer<TgridVec> &buf_cell_max = mpdat.pdat.get_field_buf_ref<TgridVec>(1);


        Tscal coord_conv_fact = solver_config.grid_coord_to_pos_fact / Block::Nside;


        sham::DeviceBuffer<Tscal> &buf_eint = mpdat.pdat.get_field_buf_ref<Tscal>(ieint_interf);


        sham::DeviceBuffer<Tscal> &buf_divv = div_v.get_buf_check(p.id_patch);


        sham::DeviceQueue &q = shamsys::instance::get_compute_scheduler().get_queue();


        sham::EventList depends_list;

        auto cell_min = buf_cell_min.get_read_access(depends_list);

        auto cell_max = buf_cell_max.get_read_access(depends_list);


        auto divv = buf_divv.get_read_access(depends_list);

        auto eint = buf_eint.get_write_access(depends_list);


        auto e = q.submit(depends_list, [&](sycl::handler &cgh) {

            Tscal fact = (dt / 2.) * (solver_config.eos_gamma - 1);


            shambase::parallel_for(

                cgh, pdat.get_obj_cnt() * Block::block_size, "evolve eint", [=](u64 id_a) {

                    u32 block_id = id_a / Block::block_size;

                    Tvec d_cell

                        = (cell_max[block_id] - cell_min[block_id]).template convert<Tscal>()

                          * coord_conv_fact;


                    Tscal factdivv = divv[id_a] * fact;


                    eint[id_a] *= (1 - factdivv) / (1 + factdivv);

                });

        });


        buf_cell_min.complete_event_state(e);

        buf_cell_max.complete_event_state(e);

        buf_divv.complete_event_state(e);

        buf_eint.complete_event_state(e);

    });

}


template class shammodels::zeus::modules::SourceStep<f64_3, i64_3>;

FaceFlagger.hpp

InterfacesUtility.hpp

SchedulerUtility.hpp

SourceStep.hpp

ValueLoader.hpp

u32
std::uint32_t u32
32 bit unsigned integer
Definition aliases_int.hpp:27

u64
std::uint64_t u64
64 bit unsigned integer
Definition aliases_int.hpp:26

sham::DeviceBuffer
A buffer allocated in USM (Unified Shared Memory)
Definition DeviceBuffer.hpp:106

sham::DeviceBuffer::complete_event_state
void complete_event_state(sycl::event e) const
Complete the event state of the buffer.
Definition DeviceBuffer.hpp:368

sham::DeviceBuffer::get_write_access
T * get_write_access(sham::EventList &depends_list, SourceLocation src_loc=SourceLocation{})
Get a read-write pointer to the buffer's data.
Definition DeviceBuffer.hpp:349

sham::DeviceBuffer::get_read_access
const T * get_read_access(sham::EventList &depends_list, SourceLocation src_loc=SourceLocation{}) const
Get a read-only pointer to the buffer's data.
Definition DeviceBuffer.hpp:331

sham::DeviceQueue
A SYCL queue associated with a device and a context.
Definition DeviceQueue.hpp:32

sham::DeviceQueue::submit
sycl::event submit(Fct &&fct)
Submits a kernel to the SYCL queue.
Definition DeviceQueue.hpp:101

sham::DeviceScheduler::get_queue
DeviceQueue & get_queue(u32 id=0)
Get a reference to a DeviceQueue.
Definition DeviceScheduler.cpp:57

sham::EventList
Class to manage a list of SYCL events.
Definition EventList.hpp:31

shammath::SPHKernelGen
Definition sphkernels.hpp:2286

shammodels::zeus::modules::FaceFlagger
flag faces with a lookup index for the orientation
Definition FaceFlagger.hpp:39

shammodels::zeus::modules::SourceStep
Definition SourceStep.hpp:26

shammodels::zeus::modules::SourceStep::compute_forces
void compute_forces()
compute general forces (pressure + external and store them into SolverStorage::forces)
Definition SourceStep.cpp:25

shammodels::zeus::modules::SourceStep::apply_force
void apply_force(Tscal dt)
apply the generalized forces
Definition SourceStep.cpp:205

shammodels::zeus::modules::SourceStep::compute_AV
void compute_AV()
Compute the values of the artificial viscosity terms ( equations 33,34)
Definition SourceStep.cpp:251

shamrock::ComputeField
Definition ComputeField.hpp:31

shamrock::MergedPatchData
Definition InterfacesUtility.hpp:37

shamrock::SchedulerUtility
Definition SchedulerUtility.hpp:28

shamrock::SchedulerUtility::make_compute_field
ComputeField< T > make_compute_field(std::string new_name, u32 nvar)
create a compute field and init it to zeros
Definition SchedulerUtility.hpp:227

shamrock::patch::PatchDataLayerLayout
Definition PatchDataLayerLayout.hpp:66

shamrock::patch::PatchDataLayerLayout::get_field_idx
u32 get_field_idx(const std::string &field_name) const
Get the field id if matching name & type.
Definition PatchDataLayerLayout.hpp:349

shamrock::patch::PatchDataLayer
PatchDataLayer container class, the layout is described in patchdata_layout.
Definition PatchDataLayer.hpp:35

log.hpp

shambase::throw_with_loc
void throw_with_loc(std::string message, SourceLocation loc=SourceLocation{})
Throw an exception and append the source location to it.
Definition exception.hpp:132

shambase::get_check_ref
T & get_check_ref(const std::unique_ptr< T > &ptr, SourceLocation loc=SourceLocation())
Takes a std::unique_ptr and returns a reference to the object it holds. It throws a std::runtime_erro...
Definition memory.hpp:110

shammath
namespace for math utility
Definition AABB.hpp:26

shamrock
namespace for the main framework
Definition __init__.py:1

shambase::details::BasicStackEntry
Definition stacktrace.hpp:106

shammodels::amr::AMRBlock
utility class to handle AMR blocks
Definition AMRBlock.hpp:35

shamrock::patch::Patch
Patch object that contain generic patch information.
Definition Patch.hpp:33