三维模型相机视角投影详细介绍及python程序解析

2023-12-10 大全 28 作者：考证青年

本文章来自于专栏《三维模型处理基础》的系列文章，专栏地址为：。

三维模型在相机视角中投影是指模拟相机观察到的模型图像，其成像效果与相机位置姿态（外参）和相机参数（内参）密切相关。三维点云或模型向固定平面进行投影的原理及其详细程序请参考博文《三维点云投影（一）》、《三维点云投影（二）》，地址分别为“”、“”。这种平面投影是直接进行投影，通常不存在畸变，属于正交投影。本节所介绍的视角投影则属于一种透视变换，更加接近真实成像结果。

正交投影和透视投影是计算机图形学中常用的两种投影方式。正交投影，也称为平行投影，是指从一个方向上垂直地投射到平面上，类似于我们看物体时所使用的方法。在正交投影中，物体的所有线段都是平行的，没有近大远小的效果，因此适合于制作平面化的图像，比如建筑图纸、工程制图等。透视投影则是一种更加真实和逼真的投影方式，它模拟了人眼在看远近不同的物体时所产生的远近感。在透视投影中，与观察者距离较远的物体看起来比较小，而距离较近的物体则看起来比较大。透视投影通常应用于视觉效果比较重要的情景，比如电影、游戏、虚拟现实等。需要注意的是，在计算机图形学中，正交投影和透视投影都是用投影矩阵来实现的。而具体使用哪种投影方式取决于应用场景和需求。

在计算机图形学领域，三维模型的投影和旋转是非常重要的基础操作。通过投影，我们可以将三维模型映射到二维平面上，从而方便进行可视化和分析。而旋转则可以改变模型的角度和姿态，使其在不同的视角下展示。下文也会将结合详细的程序来对比两种方法的投影或成像结果。文中所涉及的详细示例程序下载地址为“”，或者在“乐乐感知学堂”內回复“3d处理基础”即可。

1 环境准备

首先，我们需要安装一些必要的库。在这篇文章中，我们将使用以下库进行三维模型的投影和旋转：

（1）cv2：用于图像处理和显示

（2）：用于加载和处理三维模型

（3）numpy：用于进行数值计算和矩阵操作

（4）：用于可视化和操作点云数据

（5）：用于渲染三维模型

其中，是本节示例程序中的核心，后续博文还将介绍基于等库进行渲染投影。你可以通过pip命令来安装这些库：

pip install opencv-python trimesh numpy open3d pyrender

2 示例模型加载与可视化

本节示例模型为一个近似三棱柱，近似为一系列直立的三角形从左向右（x方向）堆叠而成，其侧面近似为三角形，底面为矩形。示例模型动画如下图所示，默认不加载图像贴图。

图1 示例模型动画

中示例模型显示结果如下图所示，默认会显示贴图效果，即OBJ文件中的RGB信息（与点云顶点坐标位于同一行，并且已经归一化），后续博文会详细介绍三维模型的贴图方法。这里在软件中显示出了坐标轴，x轴方向朝右，y轴方向朝上，z轴方向朝外，三个坐标轴方向满足右手定则。可以看到，当前为三维模型的俯视图。大多数软件和程序可视化三维模型时都会默认切换到俯视图视角。这相当于在模型正上方放置一个相机观察到的图像，或者相当于我们从顶部观察图像。相机朝向默认为z轴负方向。

图2 可视化效果（含坐标轴与纹理）

我们使用库加载示例模型。假设我们的模型文件为'model.obj'，你可以将其替换成你自己的模型文件路径。

mesh = trimesh.load('model.obj', force='mesh')
mesh.show()

3 相机设置

投影是将三维模型映射到二维平面上的过程，我们将采用透视投影的方式进行投影。在进行投影之前，我们需要设置相机的参数，包括焦距、图像宽度和高度等。这些参数会影响最终投影结果的大小和比例。在示例中，我们假设相机的焦距为800和600，图像的宽度和高度也为800和600。

w, h = 800, 600  # 图像的宽度和高度
fx, fy = 800, 600  # 相机焦距

假设模型在宽度和高度方向上的实际尺寸为W和H，D表示相机距模型的距离。焦距和像距之间有如下近似关系。假设w=fx, 那么D=W；假设h=fy, 那么D=H。也就是说相机放置距离与视野范围相等（且平移到中心位置）时，即可看全整个视野。

w : W = fx : D
h : H = fy : D

相机的投影模型是什么_投影角度怎么设置_

上述关系如下图所示。

图3 成像示意图

在理想情况下，上述设置可看到整个视野。但是模型自身形状也会对光线形成阻挡。以下图为例，在没有阻挡的情况下，相机可直接看到模型底部AB。但由于模型顶部CD对光线形成了阻挡，这导致实际模型并不能被观察完整。

图4 视线阻挡

为了使视野可看到更多内容，即增大H和W，我们需要增大距离D或者减小焦距f。这说明距离越远或者焦距越小，则视野越大。下文示例程序中设置了比例因子ratio，可使得视野按照长边距离进行等比例放大。Ratio为0.7和1.0的模型俯视投影图分别如下图所示。显然，Ratio为1.0时投影成像发生了阻挡。

图5 ratio分别为0.7和1.0时的效果图

相机姿态位置采用维度为3x4的矩阵来进行表示，即旋转和平移矩阵（RT），如下所示。矩阵前3列（旋转矩阵R）表示相机姿态，用于控制成像所在平面，最后一列（平移矩阵T）则表示相机放置的位置坐标（x, y, z）。会在最后一行补充[0, 0, 0, 1]使矩阵转换为方阵，维度为4x4，进而可通过矩阵变换实现平移功能（原始待变换坐标x、y、z需要表示为x、y、z、1）。

RT =[R T]=[X Y Z camera_position]
[[r11, r12, r13, x],
[r21, r22, r23, y],
[r31, r32, r33, z]]

4 俯视图

相机默认位置在模型中央上方，并且相机默认朝向为z轴负方向，因而可得到俯视图。因此，旋转矩阵为单位矩阵，即不需要对相机姿态进行旋转操作。我们可以通过平移矩阵控制相机位置，相机放置在模型xy平面中心，并且位于模型顶端。x方向的中心位置为d[0]*ratio/2，y方向中心位置为0，z方向位置由上述内参计算得到。程序中我们将相机位姿矩阵RT设置如下：

camera_pose = np.array([[1.0, 0.0, 0.0, d[0]*ratio/2],#相机x方向的位置[0.0, 1.0, 0.0, 0.0],  # 设置相机位置为 (d[0]*0.7/2, 0, max(d[0], d[1]))[0.0, 0.0, 1.0, max(d[0], d[1])],[0.0, 0.0, 0.0, 1.0]
])

构建场景：接下来，我们使用库构建一个场景。场景中包含了三维模型和相机。

scene = Scene(ambient_light=np.array([1.0, 1.0, 1.0, 1.0]), bg_color=[1,0,0,1])
# 添加模型到场景中
scene_mesh = Mesh.from_trimesh(mesh)
scene.add(scene_mesh)
# 添加相机到场景中
camera_pose = np.array([[1.0, 0.0, 0.0, d[0]*0.7/2],  # 模型x方向中心位置[0.0, 1.0, 0.0, 0.0],[0.0, 0.0, 1.0, max(d[0], d[1])],[0.0, 0.0, 0.0, 1.0]
])
camera_intrinsics = IntrinsicsCamera(fx=fx, fy=fy, cx=w/2, cy=h/2)
scene.add(camera_intrinsics, pose=camera_pose)

渲染图像：最后，我们使用类对场景进行渲染，并得到投影后的图像。

renderer = OffscreenRenderer(w, h)
color_image, _ = renderer.render(scene)

示例模型俯视图成像结果如下图所示。详细示例程序下载地址为“”，或者在”乐乐感知学堂“內回复”3d处理基础“即可。

图6 俯视图

5 左视图

假设三维模型的原始坐标系为x、y、z。三维模型坐标系x轴方向朝右，y轴方向朝里，z轴方向朝上，三个坐标轴方向满足右手定则。左视图成像时，相机从左侧看向右侧，因此其z轴方向朝左，与相机朝向相反，即z=-x（[-1, 0, 0]）。假设将高度方向作为y轴，那么y=z（[0, 0, 1]）。根据右手定则，相机x轴方向朝里，即x=-y（[0, -1, 0]）。因此，相机姿态矩阵R计算结果为

R = [[0, 0, -1],
[-1, 0, 0],
[0, 1, 0]]。

R的列向量分别对应x轴、y轴和z轴。原始坐标系和变换后坐标系示意图如下。

图7 左视图坐标系变换

左视图示例程序中将相机放置在x轴上，平移T矩阵设置为 [-max(d[1], d[2]), 0.0, 0.0]。矩阵的坐标位置可通过上述介绍的相机内参变换关系计算得到。因此，相机位姿矩阵RT设置如下：

camera_pose = np.array([[0.0, 0.0, -1.0, -max(d[1], d[2])],  # 设置相机位置[-1.0, 0.0, 0.0, 0.0],[0.0, 1.0, 0.0, 0.0],[0.0, 0.0, 0.0, 1.0]])

示例模型左视图成像结果如下图所示。详细示例程序下载地址为“”，或者在“乐乐感知学堂”內回复“3d处理基础”即可。

图8 示例模型左视图

6 旋转投影

原始坐标方向为x轴朝右、y轴朝里、z轴朝上，左视图中x轴朝外、y轴朝上、z轴朝右。相机放置在z轴正方向，并看向z轴负方向。根据前文所述，相机位姿旋转矩阵R的实际意义表示了相机的朝向，可通过旋转操作得到。

下图中展示了3种可将原始坐标系转换为左视图坐标系的方案，分别为：

（1）绕x轴逆时针旋转90°，再绕y轴顺时针旋转90°。

（2）绕y轴顺时针旋转90°，再绕z轴顺时针旋转90°

（3）绕z轴顺时针旋转90°，再绕x轴逆时针旋转90°

图8 三种旋转过程示意图

根据旋转角度可计算得到旋转矩阵，详细计算原理和过程请参考博文《点云旋转平移（一）—基础知识介绍》和《点云旋转平移（三）— 点云旋转》，地址分别为“”和“”。中提供了相应函数，关键程序如下所示。详细示例程序下载地址为“”，或者在“乐乐感知学堂”內回复“3d处理基础”即可。

pcd = o3d.geometry.PointCloud()
# 左视图
R = pcd.get_rotation_matrix_from_xyz((np.pi/2, -np.pi/2, 0))  # 绕x轴逆时针旋转90°，再绕y轴顺时针旋转90
R = pcd.get_rotation_matrix_from_xyz((0, -np.pi/2, -np.pi/2)) # 绕y轴顺时针旋转90°，再绕z轴顺时针旋转90°
R = pcd.get_rotation_matrix_from_zyx((-np.pi/2, 0, np.pi/2))  # 绕z轴顺时针旋转90°，再绕x轴顺时针旋转90°
print('R: ', R)

计算结果与上一节完全一致，验证了我们的描述过程。这里需要注意旋转方向。一般情况下，逆时针旋转角度为正，顺时针旋转角度为负。方向判断可通过右手定则。拇指方向沿着旋转轴正方向，当旋转方向与四指弯曲方向一致时，其为逆时针方向；当旋转方向与四指弯曲方向相反时，其为顺时针方向。

7 方向向量投影

根据上文描述，旋转矩阵关键设置来源于相机朝向，即变换后的z轴方向。假设新的z轴用向量n1来表示，在左视图中n1可表示为[-1, 0, 0]。原始坐标系的z轴用向量n0来表示，取值为[0, 0, 1]。我们的目标是将向量n0旋转到n1，那么旋转轴向量通过向量叉乘即可得到。在中，旋转轴向量的模长为旋转角度，即n0和n1之间的夹角，并且根据旋转轴向量可求得旋转矩阵，过程如下所示。

# 默认z轴方向
n0 = np.array([0, 0, 1])
# 计算旋转角度
the = np.arccos(np.dot(n0, n1) /  np.linalg.norm(n0) / np.linalg.norm(n1))
# 根据向量叉乘计算旋转轴
r_axis = np.cross(n0, n1)
# open3d中旋转向量的模长表示旋转角度
r_axis = r_axis / np.linalg.norm(r_axis) * the# 计算旋转矩阵
pcd = o3d.geometry.PointCloud()
R = pcd.get_rotation_matrix_from_axis_angle(r_axis.T)
pcd.rotate(R)

将z轴调整好之后，我们可以通过控制绕z轴的旋转来控制成像平面的角度。以左视图为例，我们需要绕z轴顺时针旋转90°，并得到相应的旋转矩阵。上述两个旋转矩阵相乘即可得到最终RT矩阵。关键程序如下所示，详细示例程序下载地址为“”，或者在“乐乐感知学堂”內回复“3d处理基础”即可。

# 绕z轴再次旋转
rz = pcd.get_rotation_matrix_from_xyz((0, 0, theta))
R = R.dot(rz)
print('R2: ', R)

8 参考文献

（1）官方文档：

（2）官方文档：

（3）官方文档：

（4）官方文档：

本文介绍了如何使用进行三维模型的投影和旋转。通过使用开源库，我们可以方便地对模型进行可视化和分析。投影可以将三维模型映射到二维平面上，便于观察和处理。旋转可以改变模型的角度和姿态，从不同的视角来观察模型。希望本文能够对你理解三维图形学领域的投影和旋转有所帮助。

tags: 三维模型相机矩阵变换旋转变换旋转图形

三维模型相机视角投影详细介绍及python程序解析

1.8安装相机SDK及测试

使用halcon提供的OpenFramegrabber方法访问各种工业相机

Opencv 相机内参标定及使用

【学习笔记】手把手教你使用Autoware标定SICK-2D激光雷达和相机

2.1. Neural 3D shape representation

使用 Python SDK 调试大恒相机记录

利用区块链等技术，加强对交通运输信用信息的归集共享和分析应用

印尼西爪哇梳邦县发生山体滑坡已经导致2人死亡

【SpringBoot笔记10】Spring中Bean的6种作用域

ARS548 ARS549RDI 80GHZ毫米波雷达达学习笔记（一)

叠氮PEG修饰二硒化钨 (N3-WSe2；azide

ATFX：黑海运粮遭俄暂停，小麦期货开盘跳涨

关于我们

最火推荐

小编推荐

联系我们

复制成功

三维模型相机视角投影详细介绍及python程序解析

1.8安装相机SDK及测试

使用halcon提供的OpenFramegrabber方法访问各种工业相机

Opencv 相机内参标定及使用

【学习笔记】手把手教你使用Autoware标定SICK-2D激光雷达和相机

2.1. Neural 3D shape representation

使用 Python SDK 调试大恒相机记录

利用区块链等技术，加强对交通运输信用信息的归集共享和分析应用

印尼西爪哇梳邦县发生山体滑坡 已经导致2人死亡

【SpringBoot笔记10】Spring中Bean的6种作用域

ARS548 ARS549RDI 80GHZ毫米波雷达达学习笔记（一)

叠氮PEG修饰二硒化钨 (N3-WSe2；azide

ATFX：黑海运粮遭俄暂停，小麦期货开盘跳涨

关于我们

最火推荐

小编推荐

联系我们

复制成功

印尼西爪哇梳邦县发生山体滑坡已经导致2人死亡