三维投影总结：数学原理、投影几何、OpenGL教程、我的方法

日期：2021-12-21 栏目：程序人生浏览：次

如果要得到pose视图，除非有精密的测量方法，否则进行大量的样本采集时很耗时耗力的。可以采取一些取巧的方法，正如A Survey on Partial of 3d shapes，描述的，可以利用已得到的3D模型，利用投影的方法（page10-透视投影或者正射投影）,自动得到精确的3D单向视图。

其中的遇到了好几个难题：透视投影的视角问题；单侧面的曲面补全问题（曲面插值问题）；pose特征的描述性问题。

一篇文章看完视觉及相关通略。

先普及一下基础知识：

一：图像处理、计算机图形学、计算机视觉和模式识别领域的区别和联系

三者之间既有区别，又有联系。原文链接：

计算机图形学是给定关于景象结构、表面反射特性、光源配置及相机模型的信息，生成图像。而计算机视觉是给定图象，推断景象特性实现的是从模型到图像的变换，也就是说从图象数据提取信息，包括景象的三维结构，运动检测，识别物体等。模式识别则是从特征空间到类别空间的变换。研究内容包括特征提取（ PCA，LDA，LFA，Kernel，Mean Shift，SIFT，ISOMAP，LLE）；特征选择；分类器设计（SVM，AdaBoost）等。

总之，计算机图形学是计算机视觉的逆问题，两者从最初相互独立的*行发展到最*的融合是一大趋势。图像模式的分类是计算机视觉中的一个重要问题，模式识别中的许多方法可以应用于计算机视觉中。

图形学讲的是图形，也就是图形的构造方式，是一种从无到有的概念，从数据得到图像。数字图像处理是对已有的图像进行变换、分析、重构，得到的仍是图像。PR本质就是分类，根据常识或样本或二者结合进行分类，可以对图像进行分类，从图像得到数据。

三维投影总结：数学原理、投影几何、OpenGL教程、我的方法

Computer Graphics和Computer Vision是同一过程的两个方向。Computer Graphics将抽象的语义信息转化成图像，Computer Vision从图像中提取抽象的语义信息。Image Processing探索的是从一个图像或者一组图像之间的互相转化和关系，与语义信息无关。

先说区别：
        Computer Graphics，简称 CG 。输入的是对虚拟场景的描述，通常为多边形数组，而每个多边形由三个顶点组成，每个顶点包括三维坐标、贴图坐标、rgb颜色等。输出的是图像，即二维像素数组。
        Computer Vision，简称 CV。输入的是图像或图像序列，通常来自相机或usb摄像头。输出的是对于图像序列对应的真实世界的理解，比如检测人脸、识别车牌。
       Digital Image Processing，简称 DIP。输入的是图像，输出的也是图像。Photoshop中对一副图像应用滤镜就是典型的一种图像处理。常见操作有模糊、灰度化、增强对比度等。

可以简单地理解为：图像学更侧重于图像的字母表和语法部分；而计算机视觉更侧重于图像从语法到语义的部分；而数字图像处理侧重于图像的状态空间转化过程及总结其一般规律。

再说联系：
CG 中也会用到 DIP，现今的三维游戏为了增加表现力都会叠加全屏的后期特效，原理就是 DIP，只是将计算量放在了显卡端。CV 更是大量依赖 DIP 来打杂活，比如对需要识别的照片进行预处理。最后还要提到*年来的热点——增强现实（AR），它既需要 CG，又需要 CV，当然也不会漏掉 DIP。它用 DIP 进行预处理，用 CV 进行跟踪物体的识别与姿态获取，用 CG 进行虚拟三维物体的叠加。

简单点说吧，1 计算机视觉，里面人工智能的东西更多一些，不仅仅是图像处理的知识，还涵盖了人工智能，机器学*等领域知识；2，计算机图形学，主要涉及图形成像及游戏类开发，如opengl等，还有就是视频渲染等；3，图像处理，这个主要针对图像图像的基本处理，如图像检索或则图像识别，压缩，复原等等操作。以上只是本人字面理解

转载注明出处：https://www.heiqu.com/zwjyyx.html

三维投影总结：数学原理、投影几何、OpenGL教程、我的方法

相关推荐