【GAMES101】作业6(提高)含BVH与SAH加速查找算法(SVH)和快速排序算法

【GAMES101】作业6(提高)含BVH与SAH加速查找算法(SVH)和快速排序算法,第1张

目录
  • 1. 作业描述
  • 2. 代码中BVH的建立过程
  • 3. 解
    • 3.1 Render
    • 3.2 Intersection
    • 3.3 IntersectP
    • 3.4 getIntersection
  • 4. SAH算法
    • 4.1 算法描述
    • 4.2 代码实现
      • 4.2.1 recursiveSAH
      • 4.2.2 computeSize
      • 4.2.3 注意
  • 5. 快速排序(Quicksort)
  • 6. 效果
  • 7. 附件

1. 作业描述

在之前的编程练习中,我们实现了基础的光线追踪算法,具体而言是光线传输、光线与三角形求交。我们采用了这样的方法寻找光线与场景的交点:遍历场景中的所有物体,判断光线是否与它相交。在场景中的物体数量不大时,该做法可以取得良好的结果,但当物体数量增多、模型变得更加复杂,该做法将会变得非常低效。因此,我们需要加速结构来加速求交过程。在本次练习中,我们重点关注物体划分算法 Bounding Volume Hierarchy (BVH)。本练习要求你实现 Ray-Bounding Volume 求交与 BVH 查找。

首先,你需要从上一次编程练习中引用以下函数:

• Render() in Renderer.cpp: 将你的光线生成过程粘贴到此处,并且按照新框架更新相应调用的格式。
• Triangle::getIntersection in Triangle.hpp: 将你的光线-三角形相交函数粘贴到此处,并且按照新框架更新相应相交信息的格式。

在本次编程练习中,你需要实现以下函数:

• IntersectP(const Ray& ray, const Vector3f& invDir, const std::array& dirIsNeg) in the Bounds3.hpp: 这个函数的 作用是判断包围盒 BoundingBox 与光线是否相交,你需要按照课程介绍的算法实现求交过程。
• getIntersection(BVHBuildNode* node, const Ray ray)in BVH.cpp: 建 立 BVH 之后,我们可以用它加速求交过程。该过程递归进行,你将在其中调用你实现的 Bounds3::IntersectP.

2. 代码中BVH的建立过程

在进行本次作业之前,提前了解代码中BVH的建立过程将会更有助于完成我们的任务,首先看到一开始的入口函数Scene类的buildBVH,这个函数创建了一个BVHAccel类对象,加入所有物体,并把划分方法设置为Naive简单模式,最后保存到场景中

void Scene::buildBVH() {
    printf(" - Generating BVH...\n\n");
    this->bvh = new BVHAccel(objects, 1, BVHAccel::SplitMethod::NAIVE);
}

接下来看到BVHAccel的构建函数,看看它是怎么初始化的,可以看到,它在创建的同时开始了计时,并进入recursiveBuild函数开始了递归构建BVH树的过程

BVHAccel::BVHAccel(std::vector<Object*> p, int maxPrimsInNode,
                   SplitMethod splitMethod)
    : maxPrimsInNode(std::min(255, maxPrimsInNode)), splitMethod(splitMethod),
      primitives(std::move(p))
{
    time_t start, stop;
    time(&start);
    if (primitives.empty())
        return;

    root = recursiveBuild(primitives);

    time(&stop);
    double diff = difftime(stop, start);
    int hrs = (int)diff / 3600;
    int mins = ((int)diff / 60) - (hrs * 60);
    int secs = (int)diff - (hrs * 3600) - (mins * 60);

    printf(
        "\rBVH Generation complete: \nTime Taken: %i hrs, %i mins, %i secs\n\n",
        hrs, mins, secs);
}

在recursiveBuild函数内部,首先是创建一个节点,然后遍历每个物体的getBounds方法获取包围它们的AABB的边界,然后通过Union函数把这些AABB合为一个大的AABB作为节点

BVHBuildNode* BVHAccel::recursiveBuild(std::vector<Object*> objects)
{
    BVHBuildNode* node = new BVHBuildNode();

    // Compute bounds of all primitives in BVH node
    Bounds3 bounds;
    for (int i = 0; i < objects.size(); ++i)
        bounds = Union(bounds, objects[i]->getBounds());
    ...

创建完节点后,我们要根据当前AABB内物体的个数来决定划分的方法,如果只有一个物体,那么它就作为叶节点,并把它的子节点设为空

	...
    if (objects.size() == 1) {
        // Create leaf _BVHBuildNode_
        node->bounds = objects[0]->getBounds();
        node->object = objects[0];
        node->left = nullptr;
        node->right = nullptr;
        return node;
    }
    ...

如果是有两个物体,那么就就将这两个物体分别放入两个子节点中进行遍历,这样就保证了每个节点最多只有一个物体了

    ...
    else if (objects.size() == 2) {
        node->left = recursiveBuild(std::vector{objects[0]});
        node->right = recursiveBuild(std::vector{objects[1]});

        node->bounds = Union(node->left->bounds, node->right->bounds);
        return node;
    }
    ...

如果大于两个物体,那么就要思考如何划分当前的BVH了,这里的做法是遍历物体,通过getBounds()的Centroid()方法找到所有物体的中心,并通过Union函数找到它们覆盖的范围,然后通过maxExtent()方法判断到底是哪个轴覆盖的范围大,返回0,就是x轴范围大,返回1就是y轴大,2就是z轴大

	...
    else {
        Bounds3 centroidBounds;
        int target = objects.size() / 2;
        for (int i = 0; i < objects.size(); ++i)
            centroidBounds =
                Union(centroidBounds, objects[i]->getBounds().Centroid());
        int dim = centroidBounds.maxExtent();
        ...

判断完后,根据不同的情况,将物体根据中心坐标分别按照z、y、z轴排序,

        ...
        switch (dim) {
        case 0:
            std::sort(objects.begin(), objects.end(), [](auto f1, auto f2) {
                return f1->getBounds().Centroid().x <
                       f2->getBounds().Centroid().x;
            });
            break;
        case 1:
            std::sort(objects.begin(), objects.end(), [](auto f1, auto f2) {
                return f1->getBounds().Centroid().y <
                       f2->getBounds().Centroid().y;
            });
            break;
        case 2:
            std::sort(objects.begin(), objects.end(), [](auto f1, auto f2) {
                return f1->getBounds().Centroid().z <
                       f2->getBounds().Centroid().z;
            });
            break;
        }
			...

排序完后将物体对半划分,分别放入两个子节点中进行递归,直到只剩一个物体为止,最后还要将当前节点的AABB赋值为两个子节点的Union,这就是代码中BVH划分的简单方法的全程

			...
        auto beginning = objects.begin();
        auto middling = objects.begin() + (objects.size() / 2);
        auto ending = objects.end();

        auto leftshapes = std::vector<Object*>(beginning, middling);
        auto rightshapes = std::vector<Object*>(middling, ending);

        assert(objects.size() == (leftshapes.size() + rightshapes.size()));

        node->left = recursiveBuild(leftshapes);
        node->right = recursiveBuild(rightshapes);

        node->bounds = Union(node->left->bounds, node->right->bounds);
    }

    return node;
}
3. 解 3.1 Render

首先是render函数和getIntersection函数的填写,基本只用把上次作业的代码复制过来就行了,需要注意的一点是,castRay函数被转移到了Scene类里面,还要把之前计算的光线通过定义ray类对象传入函数

void Renderer::Render(const Scene& scene)
{
    std::vector<Vector3f> framebuffer(scene.width * scene.height);

    float scale = tan(deg2rad(scene.fov * 0.5));
    float imageAspectRatio = scene.width / (float)scene.height;
    Vector3f eye_pos(-1, 5, 10);
    int m = 0;
    for (uint32_t j = 0; j < scene.height; ++j) {
        for (uint32_t i = 0; i < scene.width; ++i) {
            // generate primary ray direction
            float x = (2 * (i + 0.5) / (float)scene.width - 1) *
                      imageAspectRatio * scale;
            float y = (1 - 2 * (j + 0.5) / (float)scene.height) * scale;
            Vector3f dir = Vector3f(x, y, -1); // Don't forget to normalize this direction!
            dir = normalize(dir);
            Ray ray(eye_pos, dir, 0);
            framebuffer[m++] = scene.castRay(ray, 0);
        	...
3.2 Intersection

在Intersection函数里面计算了三角形与光线的交点,其实基本计算过程都给出了,我们要做的就是把计算结果放入Intersection类对象,这个类包含了以下几种属性:

①happened:true为相交
②obj:相交的物体
③normal:相交点的法向量
④coords:相交点坐标
⑤m:相交点表面材质

只要注意把这些属性赋值正确就行

inline Intersection Triangle::getIntersection(Ray ray)
{
    Intersection inter;

    if (dotProduct(ray.direction, normal) > 0)
        return inter;
    double u, v, t_tmp = 0;
    Vector3f pvec = crossProduct(ray.direction, e2);
    double det = dotProduct(e1, pvec);
    if (fabs(det) < EPSILON)
        return inter;

    double det_inv = 1. / det;
    Vector3f tvec = ray.origin - v0;
    u = dotProduct(tvec, pvec) * det_inv;
    if (u < 0 || u > 1)
        return inter;
    Vector3f qvec = crossProduct(tvec, e1);
    v = dotProduct(ray.direction, qvec) * det_inv;
    if (v < 0 || u + v > 1)
        return inter;
    t_tmp = dotProduct(e2, qvec) * det_inv;

    // TODO find ray triangle intersection
    inter.happened = true;
    inter.obj = this;
    inter.distance = t_tmp;
    inter.normal = normal;
    inter.coords = ray(t_tmp);
    inter.m = this->m;

    return inter;
}
3.3 IntersectP

这个函数的作用是判断光线与AABB是否有交点,方便后续判断(如果没有交点,自然就不用继续对其子节点进行继续判断了)

这里我用到是课上推导的判断条件:

  • texit为负,说明AABB在光线的后面,不相交
  • tenter<0且texit>=0,说明光线在AABB内,一定相交
  • 若算得的tenter

需要注意的是,一开始是用的默认光线方向为正的方法计算,所以如果光线方向为负的话算得的tmin和tmax就反了,这里需要通过判断光线方向的正负来纠正算得的tmin和tmax

inline bool Bounds3::IntersectP(const Ray& ray, const Vector3f& invDir) const
{
    // invDir: ray direction(x,y,z), invDir=(1.0/x,1.0/y,1.0/z), use this because Multiply is faster that Division
    // dirIsNeg: ray direction(x,y,z), dirIsNeg=[int(x>0),int(y>0),int(z>0)], use this to simplify your logic
    // TODO test if ray bound intersects
    Vector3f tmin = (pMin - ray.origin) * invDir;
    Vector3f tmax = (pMax - ray.origin) * invDir;
    Vector3f dir = ray.direction;
    if(dir.x < 0)
        std::swap(tmin.x, tmax.x);
    if(dir.y < 0)
        std::swap(tmin.y, tmax.y);
    if(dir.z < 0)
        std::swap(tmin.z, tmax.z);
    float ten, tex;
    tex = fmin(tmax.x, fmin(tmax.y, tmax.z));
    ten = fmax(tmin.x, fmax(tmin.y, tmin.z));
    if(ten < tex && ten > 0)
        return true;
    return false;
}

3.4 getIntersection

这个函数的作用是获取光线与BVH的交点,而且根据作业的提示,是递归求交,所以这里我的实现思路是:若光线与这个AABB没有交点就直接返回,否则只有当前节点没有子节点了再进行求交,如果有子节点就继续对两个子节点进行递归

Intersection BVHAccel::getIntersection(BVHBuildNode* node, const Ray& ray) const
{
    // TODO Traverse the BVH to find intersection
    Intersection intersect, intersectl, intersectr;
    if(!node->bounds.IntersectP(ray, ray.direction_inv))
        return intersect;
    if(node->left == nullptr && node->right == nullptr){
        intersect = node->object->getIntersection(ray);
        return intersect;
    }
    intersectl = getIntersection(node->left,ray);
    intersectr = getIntersection(node->right,ray);
    return intersectl.distance < intersectr.distance ? intersectl : intersectr;
}
4. SAH算法 4.1 算法描述

作业给的SAH参考资料过于简略,所以这部分的内容还参考了:SAH算法

在建立BVH树的时候,框架代码里面的方法逻辑是比较粗暴的。

简单来说就是判断节点的包围盒在哪个轴上覆盖的范围大,然后根据对应轴坐标对所有物体排个序,然后取中间点作为分界,有点简单粗暴。下面我们介绍一种比较好的划分办法-SAH算法

直观的来说 SAH算法奖励三角形多的小节点,避免三角形少的大节点。看下图我们直观的就可以看出第三种划分方式是最好的。
SAH算法对于不同的划分办法会计算其cost,选取最优的那一种来划分

度量办法:

  • C(A, B) 光线与这个节点相交的成本
  • t_traversal 是光线与中间节点相交的成本
  • p_A and p_B 是光线通过包围盒A与包围盒B的概率(这个概率指A或B包围盒的表面积/整个包围盒的表面积,这也就是SAH,Surface area Heuristic名称的由来)
  • N_A and N_B 是包围盒A和包围盒B中物体数量
  • t_intersect 是对一个物体的光线相交计算成本

假设costs t_traversal = 1 and t_intersect = 2

对于我们之前提到的那个例子 我们可以定量的计算这三种划分方式的开销 如下图

4.2 代码实现 4.2.1 recursiveSAH

首先,SAH对于物体数量为1和2的节点的处理方法基本与基础BVH划分方法相同,只有一个物体了就设置当前为叶节点,只有两个时就把两个物体分别给到两个子节点进行递归处理

BVHBuildNode* BVHAccel::recursiveSAH(std::vector<Object*> objects){
    BVHBuildNode* node = new BVHBuildNode();

    // Compute bounds of all primitives in BVH node
    Bounds3 bounds;
    for (int i = 0; i < objects.size(); ++i)
        bounds = Union(bounds, objects[i]->getBounds());
    if (objects.size() == 1) {
        // Create leaf _BVHBuildNode_
        node->bounds = objects[0]->getBounds();
        node->object = objects[0];
        node->left = nullptr;
        node->right = nullptr;
        return node;
    }
    else if (objects.size() == 2) {
        node->left = recursiveSAH(std::vector{objects[0]});
        node->right = recursiveSAH(std::vector{objects[1]});
        node->bounds = Union(node->left->bounds, node->right->bounds);
        return node;
    }
    ...

对于两个以上物体的节点,还需要分两种情况讨论,这里认为物体数量小于12时,对半分的效率要大于用SAH查找划分的效率

    ...
    else {
        auto beginning = objects.begin();
        auto ending = objects.end();
        if(objects.size() < 12){
            auto middling = objects.begin() +objects.size() / 2;
            auto leftshapes = std::vector<Object*>(beginning, middling);
            auto rightshapes = std::vector<Object*>(middling, ending);
            node->left = recursiveSAH(leftshapes);
            node->right = recursiveSAH(rightshapes);
            node->bounds = Union(node->left->bounds, node->right->bounds);
        }
        ...

如果物体数量大于12时,则正式开始SAH算法,首先分三种dim情况讨论,就是分别基于x、y、z轴来划分

        ...
        else {
            int bestChoice = 0;
            double minCost = std::numeric_limits<double >::max();
            int bestDim = 0;
            for(int dim = 0; dim < 3; dim++){
                switch (dim) {
                    case 0:
                        std::sort(objects.begin(), objects.end(), [](auto f1, auto f2) {
                            return f1->getBounds().Centroid().x <
                                   f2->getBounds().Centroid().x;
                        });
                        break;
                    case 1:
                        std::sort(objects.begin(), objects.end(), [](auto f1, auto f2) {
                            return f1->getBounds().Centroid().y <
                                   f2->getBounds().Centroid().y;
                        });
                        break;
                    case 2:
                        std::sort(objects.begin(), objects.end(), [](auto f1, auto f2) {
                            return f1->getBounds().Centroid().z <
                                   f2->getBounds().Centroid().z;
                        });
                        break;
                }
                ...

确定了划分轴以后该怎么确定分界线最好呢?这里遍历了5种选择,分别是在包围盒1/6到5/6处进行划分

                ...
                auto l = (float)objects.size();
                float nums[] = {1.0/6, 2.0/6, 3.0/6, 4.0/6, 5.0/6};
                for(int i = 0; i < 5; i++)
                    nums[i] *= l;
                ...

确定了分界线后,就按照之前提到的SAH公式来进行花费的计算

				...
                for(int i = 0; i < 5; i++){
                    auto middling = objects.begin() + (int)nums[i];
                    auto leftshapes = std::vector<Object*>(beginning, middling);
                    auto rightshapes = std::vector<Object*>(middling, ending);
                    double leftBoxSize = computeSize(leftshapes);
                    double rightBoxSize = computeSize(rightshapes);
                    double cost = 2.f + (leftBoxSize * leftshapes.size() + rightBoxSize * rightshapes.size()) / bounds.SurfaceArea();
                    ...

算完花费以后判断是否是当前最小的花费,是的话就记录分界线bestChoice和划分轴bestDim

                    ...
                    if(cost < minCost){   
                        bestChoice = (int)nums[i];
                        bestDim = dim;
                    }
                }
            }
            ...

这样,在遍历完所有情况以后整理结果,根据最后的bestDim将物体按照对应的轴排序(不再对z轴排序是因为遍历结束时就是按照z轴排序的),然后按照分界线将左右两组物体放进两个子节点中进行递归,这就是SAH的全部流程

            ...
            if(bestDim == 0)
                std::sort(objects.begin(), objects.end(), [](auto f1, auto f2) {
                    return f1->getBounds().Centroid().x <
                        f2->getBounds().Centroid().x;
                });
            if(bestDim == 1)
                std::sort(objects.begin(), objects.end(), [](auto f1, auto f2) {
                    return f1->getBounds().Centroid().y <
                        f2->getBounds().Centroid().y;
                });
            auto middling = objects.begin() + bestChoice;
            auto leftshapes = std::vector<Object*>(beginning, middling);
            auto rightshapes = std::vector<Object*>(middling, ending);
            node->left = recursiveSAH(leftshapes);
            node->right = recursiveSAH(rightshapes);
            node->bounds = Union(node->left->bounds, node->right->bounds);
        }
        return node;
    }
}

4.2.2 computeSize

在SAH的公式中提到的自定义computeSize函数就是求被物体组成的包围盒的面积

double BVHAccel::computeSize(std::vector<Object*> objects){
    Bounds3 centroidBounds;
    for (int i = 0; i < objects.size(); ++i)
        centroidBounds =
            Union(centroidBounds, objects[i]->getBounds());
    return centroidBounds.SurfaceArea();
}
4.2.3 注意

别忘了在BVHAccel构建函数的入口处添加对加速方法的判断

	if(splitMethod == BVHAccel::SplitMethod::NAIVE)
        root = recursiveBuild(primitives);
    else
        root = recursiveSAH(primitives);
5. 快速排序(Quicksort)

(ps:该部分只是对老师上课提到的内容的补充,不作要求,感兴趣的朋友可以了解一下)

快速排序是对冒泡算法的一种改进:
任意选取一个数据(通常选用数组的第一个数)作为关键数据,然后将所有比它小的数都放到它左边,所有比它大的数都放到它右边,这个过程称为一趟快速排序。

假设一开始序列{xi}是:5,3,7,6,4,1,0,2,9,10,8。
此时,ref=5,i=1,j=10,从后往前找,第一个比5小的数是x8=2。
此时i=1,j=8,从前往后找,第一个比5大的数是x3=7,因此序列为:5,3,2,6,4,1,0,7,9,10,8。
此时,i=3,j=8,从第8位往前找,第一个比5小的数是x7=0。
此时,i=3,j=7,从第3位往后找,第一个比5大的数是x4=6,因此:5,3,2,0,4,1,6,7,9,10,8。
此时,i=4,j=7,从第7位往前找,第一个比5小的数是x6=1。
此时,i=4,j=6,从第4位往后找,直到第6位才有比5大的数,这时,i=j=6,ref成为一条分界线,它之前的数都比它小,之后的数都比它大,因此最后:1,3,2,0,4,5,6,7,9,10,8
对于前后两部分数,可以采用同样的方法来排序

这里给出一个按z轴排序的例子:

void BVHAccel::quicksort_z(int first, int last, int target, std::vector<Object*> &objects){
    int i = first + 1, j = last;
    while (true) {
		while (j > first && objects[j]->getBounds().Centroid().z >= objects[first]->getBounds().Centroid().z)
			j--;
		while (i < last && objects[i]->getBounds().Centroid().z <= objects[first]->getBounds().Centroid().z)
			i++;
		if (i >= j) 
			break;
		std::swap(objects[i],objects[j]);
	}
	std::swap(objects[j], objects[first]);
    if(j > target)
        quicksort_x(first, j - 1, target, objects);
    if(j < target)
        quicksort_x(j + 1, last, target, objects);
}
BVHBuildNode* BVHAccel::recursiveBuild(std::vector<Object*> objects)
{
    BVHBuildNode* node = new BVHBuildNode();

    // Compute bounds of all primitives in BVH node
    Bounds3 bounds;
    for (int i = 0; i < objects.size(); ++i)
        bounds = Union(bounds, objects[i]->getBounds());
    if (objects.size() == 1) {
        // Create leaf _BVHBuildNode_
        node->bounds = objects[0]->getBounds();
        node->object = objects[0];
        node->left = nullptr;
        node->right = nullptr;
        return node;
    }
    else if (objects.size() == 2) {
        node->left = recursiveBuild(std::vector{objects[0]});
        node->right = recursiveBuild(std::vector{objects[1]});

        node->bounds = Union(node->left->bounds, node->right->bounds);
        return node;
    }
    else {
        Bounds3 centroidBounds;
        int target = objects.size() / 2;
        for (int i = 0; i < objects.size(); ++i)
            centroidBounds =
                Union(centroidBounds, objects[i]->getBounds().Centroid());
        int dim = centroidBounds.maxExtent();
        switch (dim) {
        case 0:
            quicksort_x(0, objects.size(), objects.size() / 2, objects);
            break;
        case 1:
            quicksort_y(0, objects.size(), objects.size() / 2, objects);
            break;
        case 2:
            quicksort_z(0, objects.size(), objects.size() / 2, objects);
            break;
        }
		...
6. 效果

基本与实例一致

NAIVE耗时:

SVH耗时:

可见,SVH还是对BVH的加速作用有效果的,可能在物体分布的更不均匀的情况下效果能更好。

7. 附件

附上源代码,有兴趣的朋友可以自己尝试一下效果:
【GAMES101】作业6

欢迎分享,转载请注明来源:内存溢出

原文地址: https://outofmemory.cn/langs/733677.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-04-27
下一篇 2022-04-27

发表评论

登录后才能评论

评论列表(0条)

保存