如果要得到pose视图,除非有精密的测量方法,否则进行大量的样本采集时很耗时耗力的。可以采取一些取巧的方法,正如A Survey on Partial of 3d shapes,描述的,可以利用已得到的3D模型,利用投影的方法 (page10-透视投影或者正射投影),自动得到精确的3D单向视图。
其中的遇到了好几个难题:透视投影的视角问题;单侧面的曲面补全问题(曲面插值问题);pose特征的描述性问题。
一篇文章看完视觉及相关通略。
先普及一下基础知识:
一:图像处理、计算机图形学、计算机视觉和模式识别领域的区别和联系
三者之间既有区别,又有联系。 原文链接:
计算机图形学是给定关于景象结构、表面反射特性、光源配置及相机模型的信息,生成图像。 而计算机视觉是给定图象,推断景象特性实现的是从模型到图像的变换,也就是说从图象数据提取信息,包括景象的三维结构,运动检测,识别物体等。 模式识别则是从特征空间到类别空间的变换。研究内容包括特征提取( PCA,LDA,LFA,Kernel,Mean Shift,SIFT,ISOMAP,LLE);特征选择;分类器设计(SVM,AdaBoost)等。总之,计算机图形学是计算机视觉的逆问题,两者从最初相互独立的*行发展到最*的融合是一大趋势。图像模式的分类是计算机视觉中的一个重要问题,模式识别中的许多方法可以应用于计算机视觉中。
图形学讲的是图形,也就是图形的构造方式,是一种从无到有的概念,从数据得到图像。数字图像处理是对已有的图像进行变换、分析、重构,得到的仍是图像。PR本质就是分类,根据常识或样本或二者结合进行分类,可以对图像进行分类,从图像得到数据。
Computer Graphics和Computer Vision是同一过程的两个方向。Computer
Graphics将抽象的语义信息转化成图像,Computer Vision从图像中提取抽象的语义信息。Image Processing探索的是从一个图像或者一组图像之间的互相转化和关系,与语义信息无关。
先说区别:
Computer Graphics,简称 CG 。输入的是对虚拟场景的描述,通常为多边形数组,而每个多边形由三个顶点组成,每个顶点包括三维坐标、贴图坐标、rgb颜色等。输出的是图像,即二维像素数组。
Computer Vision,简称 CV。输入的是图像或图像序列,通常来自相机或usb摄像头。输出的是对于图像序列对应的真实世界的理解,比如检测人脸、识别车牌。
Digital Image Processing,简称 DIP。输入的是图像,输出的也是图像。Photoshop中对一副图像应用滤镜就是典型的一种图像处理。常见操作有模糊、灰度化、增强对比度等。
可以简单地理解为:图像学更侧重于图像的字母表和语法部分;而计算机视觉更侧重于图像从语法到语义的部分;而数字图像处理侧重于图像的状态空间转化过程及总结其一般规律。
再说联系:
CG 中也会用到 DIP,现今的三维游戏为了增加表现力都会叠加全屏的后期特效,原理就是 DIP,只是将计算量放在了显卡端。CV 更是大量依赖 DIP 来打杂活,比如对需要识别的照片进行预处理。最后还要提到*年来的热点——增强现实(AR),它既需要 CG,又需要 CV,当然也不会漏掉 DIP。它用 DIP 进行预处理,用 CV 进行跟踪物体的识别与姿态获取,用 CG 进行虚拟三维物体的叠加。
简单点说吧,1 计算机视觉,里面人工智能的东西更多一些,不仅仅是图像处理的知识,还涵盖了人工智能,机器学*等领域知识;2,计算机图形学,主要涉及图形成像及游戏类开发,如opengl等,还有就是视频渲染等;3,图像处理,这个主要针对图像图像的基本处理,如图像检索或则图像识别,压缩,复原等等操作。以上只是本人字面理解