博客年龄:17年0个月
访问:?
文章:156篇

个人描述

刘里远,四川籍,1964年生,博士,副教授.......。先后就读川北医学院儿科专业、佳木斯大学基础医学院生理专业、北京体育大学运动生理专业、北京大学医学部生理专业。发表论文近五十篇,著书五部,获国家专利五项。现为北京师范大学生命科学学院生理教研室教师,教授《人体及动物生理学》、《神经生物学》、《科学思想》等课程。曾当过三年基层临床内科/儿科医生,在简单的条件下,常常同时独立救治三十名左右病人的急重病,积累了丰富的经验和胆略,深受患者爱戴。近二十年来,一直从事中医经络实质及针刺效应机制研究,在《古典经络学与现代经络学》一书中,全面总结了古典经络理论,纠正了现行经脉循行路线的大量错误,阐明了古典经络包括血管系统和非血管系统两大类型。现已揭示出经络实质的整体面貌,即皮肤交感神经――立毛肌分布线。相关三篇重要文章先后在国际一流英文杂志发表,标志着中医经络研究的重大突破。 对科学发展史和科学思想有全面的知识,对中国传统思想有独到的研究和精深的见解。在《中西自然科学思想》一书中,系统论述了人类历史上伟大科学家和哲学家的卓越思想精华。特别阐述了孔子、老子、庄子、《黄帝内经》、《易经》等鲜为人知的伟大思想和卓越成就。编写《青年必知科学历程手册》,以修补教条主义科学教育的缺陷,展现真实具体、形象生动的科学知识,成为近年国内科普畅销书。近十年研究物种进化,创立一个全新进化理论,以取代达尔文的变异与自然选择学说。本研究坚决放弃以变异为基础的同一祖先模式,确立不同低等物种的杂交,通过基因组合,产生复杂高级的生命形式。完成英文巨著《新物种进化论》,在德国出版。 微信/QQ:413552970

关于照片的立体感、分辩率等 (黄尔文专题集)

2008-02-15 08:25 阅读(?)评论(0)

 关于单张照片的立体感及其它

黄尔文

   大约在40年前,偶然得到一本讲油画技巧的美院教材,第一章第一节讲的是透视关系,所举的例子是两幅世界名画:俄罗斯列宾的《出征的哥萨克》,意大利达芬奇的《最后的晚餐》。我很惊讶列宾对立体感的精确描绘,以至于古人类学家可以利用这幅画来研究古代哥萨克人颅骨的形状;我也非常佩服达芬奇利用中央视点將耶稣置于最引人瞩目的位置而利用边缘视点將犹大从众门徒中区别出来的技法,那种对比所产生的奇异力量竟然能够震撼观画者的心灵。从那天起,我第一次听说了“立体感”,透视,投影,视点(看图像时眼睛的位置)等字眼。虽然几年后我开始频繁接触由投影所产生的图像,但从理论上学习画法几何已经是十几年以后的事情了。从那以后,直到现在,看图,画图,识别其立体状态,精确到百分之一甚至千分之一毫米,就成了我的职业和谋生手段。读过我前面文章的朋友,一定知道我所说的图是什么图了——机械工程用的图,而不是美术或摄影所得到的图。论及二者的异同,它们全都是为了表达外部对象的立体形状。要说差异,透视关系,投影方法虽有不同,但在根本上又完全一致,而最大的差异在精确度方面:机械图比摄影绘画能够更精确地描述一个物体的真实形状。前面这段话已经回答了单张照片的立体感问题,但仅仅是个引言。

    在进一步叙述之前,有必要对一个概念的应用条件作一些解释。用来表达这个概念的是“重合”这两个字。从字面上讲,重合可以理解成是几何学中的一些点线面的简单重叠,外形的叠加,堆砌,但如果用于比较测量现实生活中的某些东西,比如两幅图像是否相同,看他们的外形边缘是否能够完全重叠在一起,将会感到非常困难,即使把两张叠在一起的纸用剪刀一次剪成某种图形,它们也不可能绝对重合。你说眼睛看上去重合了,我说精确测量不重合。你说在微米级重合了,我说纳米级不重合,在分子原子质子层面上不重合。这是因为,世界上本没有绝对的东西,只有相对的东西。几何学中的点线面在现实生活中也是不存在的。你见过没有面积无穷小的点吗?你见过没有宽度没有厚度或没有截面积的一条线吗?你又见过只有广度但没有厚度的面吗?没有!它们只存在于人们的抽象思维之中,只用于理论上的比较,推导,换算。如果要把它们运用到现实生活中,就必须注意它们的运用条件,即注意它们的相对性:给那些点线面单位和数量级,给比较的对象一个用来比较的精度范围,忽略远远超出精度范围的误差(比如超出1-2个数量级),就像我们机械行业规定一个公差一样,这样就产生出一个相对重合的概念。而我们所说的完全重合,也无非是指精确度非常高的,例如对一般影像图形,能达到毫米级或更高精确度的重合,并不是指那种排斥一切条件仅仅存在于理论之中的绝对重合。这里,毫米级或更高精确度的级别当然也是相对被测物体的总长度或高度而言(一般比总尺寸小1-2个数量级即可满足普通测量要求)。

  下面让我们做两个试验:

  第一个试验:(参考图1)

   取一张白纸,在上面画一个正方形,再画上几根等距平行线,距离不妨取15毫米左右,与上下边平行。从垂直方向看这个正方形,只要距离足够远,所看到的图形,和画出的图形,大体上一致,边长相等,平行线平行,且平行线之间的距离相等。但如果我们不取垂直方向,而是倾斜一个角度,比如从底边的正下方向某个角度去看这个正方形,在距离较远的情况下,所看到的正方形变成了长方形,左右竖着的两边变短了,那些平行线之间的距离变小了。如果原先两根平行线距离为S,现在的距离s=Scosa,这里,a是看图时眼睛倾斜于纸面的角度。由于a大于0小于90度,cosa总是大于0小于1,所以,s总是小于S。但是,必须注意到,虽然两根平行线之间的距离发生了变化,但各平行线之间,仍是等距离的,就是说,当第1根线和第2根线之间距离是Scosa,第2根线和第3根线之间距离也是Scosa。它们之间的差为零。综合我们这个实验的结果:第一,随着视角的变化,我们所看到的平面上的正方形出现了等比例变化,比例系数为cosa。

  第二个试验:(参考图2)

  仍取一张白纸,但这次要长方形,长边1.3米左右,短边不限。在纸上画和短边平行的等距平行线,距离仍取16毫米左右,然后使纸上的平行线朝外,將纸卷成直径400毫米的圆筒形,使端线对齐,用胶水粘合。这样就制成了一个外表有许多与轴线平行且距离相等的平行线的空间立体圆柱。从垂直方向看这个圆柱,并且不改变观察位置,只要距离足够远,所看到的图形为矩形,上边仍有许多平行线,但平行线之间除与中轴线左右对称的两条线之间的距离外,其余中轴线左边或右边的任意两线之间的距离并不相等,越靠近边缘部分的两条线,其距离越近,最后两条线,几乎重叠为一条线。从数学角度,要推导出观察时计算平行线之距离的关系式并不非常困难,除了视角曲率半径这两个假想中的常量,大体上需要引进有关平行线位置的参数。由于平行线所在的位置从观测的方向坐标,并不相同,因此所得的数值并不相等,而且其中不存在等比例关系。详细讨论这些关系式,超出了本文预定的范围,这里只需简单代入几个数据就可以说明问题:假定我们所做的圆柱半径200毫米,视角4.5度。那么4.5度圆心角所夹圆上一段弧所对应的弦长近似为为15.72毫米,这也是我们从较远距离看圆柱体中部两条被4.5度等分后中部平行线之间的距离,而我们所看到的圆柱体边缘部分两条平行线之间的距离仅有0.62毫米。中心与边缘的差值达到15.07毫米,误差达到厘米级。 

  现在,让我们再次作出假设:周虎照是根据年画虎这个平面图片拍摄出来的,他的所有的照片都是对着年画拍出的,只不过拍摄的角度不同,距离不同,所以得到的照片有很大差异,看上去各不相同。但是,根据我们前面做的第一个实验,平面上的图形如果因视角发生变化,所得到的照片上的图形是一种等比例变化,其比例系数为cosa。因此,我们只要对照片通过旋转——排除相机拍摄时镜头旋转的误差;放大和缩小——排除相机拍摄时的距离误差;最后,乘以比例系数,然后作单方向整体拉伸,——排除相机拍摄时的角度(视角)误差,就可以使所有照片中的老虎和年画也包括它们之间“完全重合”。这里,“完全重合”,当然是指前面所说的精确度比较高的,整体的,除轮廓之外在所有斑纹和细节上都必需的重合。但迄今为止,打虎派列举了那末多“证据”,除了指证有一张照片和年画虎达到了“完全重合”的标准,其他没有任何实例证据能够说明同组拍摄的其它某张照片能和年画达到“完全重合”。而这些照片之间,即使是刘老师所列举出的39,40两张拍照时间只相差26秒的照片,也不能做到整体上的“完全重合”,只能是局部重合局部不重合。因此,我们前面所作的假定就是虚假的,不真实的,是错误的。所作出的推论只能是周虎照的拍摄对象不是年画。同时也可作出推论,年画来源于周虎照中的某一张,即达到“完全重合”标准的那一张。

  这样一来,是否同时也推翻了利用照片局部重合局部不重合判断老虎是活的是立体的并且在动的方法在理论上的依据?答案是否定的。

  这里,让我们先假定周虎照中的老虎是一只立体老虎,它的背部浑圆,曲率半径200毫米。照片是从20米距离拍摄的,拍摄时镜头上下移位1.6米。这里的拍摄距离20米取自国防科大论文,1.6米略大于论文中的1.5米,两个数据未经过本人验证,不代表原照片的拍摄条件,主要是为计算和叙述方便,对最后结果没有影响。

   由arctg1.6/20约等于4.5度及前面试验2中的计算数据可知,我们的视角出现4.5度偏差时,我们所观察的老虎身体上部轮廓线附近只产生0.62毫米的位移(图3),老虎背部的斑纹由于被视觉压缩的缘故,在背部曲面上,给我们的视觉所产生的尺寸变化也很小,因此,这一部分的“重合”相对身体前面要容易,使这一部分“重合”后产生的误差足够小,能满足我们的观测要求。而在身体前面,根据我们在实验中的数据,视角的偏差,引起了平行线15.69毫米的位移,这就好像我们在观察实验中的圆筒时,视点不动,分别盯住中心和边缘的两条线,把圆筒旋转了4.5度,其结果,边上第二条线转到原先第一条线的位置,代替了原先的轮廓线,上下仅移动0.62毫米,而中部那条线在上下方向的移动已经达到了厘米级(15.69毫米),比边缘部分的0.62毫米至少大数十倍,这也说明,使边缘部分重合时要求的精确度误差比中部要小数十倍,这是因为重合的精度只是针对与视线垂直的两维平面,而边缘部分平行线间实际的距离主要分布在纵深方向,处于三维空间,两维方向的误差对他们影响很小,因此,只要重合时的精确度比空间实际的距离足够小,重合在精确度方面就是可信的,就不会影响到观测结果,但如果要从边缘部分微小的位移量求解纵深方向的实际距离,在未知曲线方程的条件下,问题变得十分困难,首先是对取点时的精确度要求数十倍地提高——这是另外的话题。现在仍然换成观测老虎。使老虎轮廓线以及背部斑纹重合的精度要求低得多,但要使老虎身体前面(迎向照相机镜头一面)的斑纹和背部斑纹以及轮廓线同时重合就做不到。正因为是一只立体老虎,镜头视角的变化使前面(大体上相当于圆柱体对称中心线的部位)出现了15.69毫米的位移,给人的感觉就像斑纹被拉长了一样,这是一个无法忽略的误差,但也正因为这一点,可以用来判断老虎的立体性质。例如,对39,40两张数码照片的处理就出现了类似情况。背部轮廓线及附近的斑纹可以重合,身前的斑纹不可重合,等比例单方向拉伸这张照片,身前的斑纹接近重合,不仅背部轮廓,斑纹完全不可重合,其它部位几乎完全乱套,这是对立体图像按平面图像处理的必然结果,也从反面证明照片中是一只立体老虎。

   让我们再次回到我们做过的试验2当中。在试验时,根据我们的观察,得到了一个结果:除去对称因素,那些平行线之间的距离并不相等,其中的变化不存在比例关系。请看下面一组数据:0.62,1.85,3.06,4.26,5.49,6.52....14.73,15.11,15.4,15.6,15.69...

   这是用作图法精确画出半径200毫米的圆,然后用4.5度圆心角等分这个圆,从交点引出平行线(代表我们制作的圆筒上的平行线),然后从最高点开始,直到圆柱中心,测量相邻平行线之间的距离所得到的结果。

   可以直观地看出,在任意相邻两组数字之间,找不到一个可以被称之为“比例系数”的常数,使之满足等比例线性变换的条件。这是空间曲面上的点和线投影到平面上的必然结果。用数学的语言,这些点和面之间的关系是一种非线性函数关系。非线性函数的求解一般分为可变换成线性和不能变换成线性两大类。第一种类型可以通过变量变换成线性模型, 然后按线性模型加以解决;另一种类型的非线性模型是用任何变量变换办法都不能直接化为线性模型求算参数,必须采用其它方法求解,例如使用非线性回归解析方法去确定它们之间的复杂关系。我们实验一中的例子,其数据之间是简单的线性关系,也是比较容易处理的;实验二尽管也很简单,其中的数据之间的关系已经比较复杂,是典型的非线性函数关系,如果不能透彻理解这种关系,较难通过变量变换成线性模型求解;而实际生活中许多物体外形极其复杂,可能是球面连着柱面,柱面又与S形面相连,如果把这些曲面投影到一张图上,影像之间的关系是一种非常复杂的非线性函数关系,不能直接变换成线性模型,如果没有充分的分析,或使它们回归原始的函数关系,根本不能还原它们的原始形态。

   下面,让我们简略讨论一下国防科大的论文。今天去了打虎派的大本营,看到了被奉为至宝的影印版,尽管很不清晰,还是可以看到“一个比例系数”“线性”这些字眼。而这些字眼出现在介绍所谓“三维重建”的数学方法的内容里,并贯穿了整个重建过程。

   论文指出,“本文采用...线性算法”,“线性方程”,并利用“归一化线性算法通过对匹配点平移和尺度变换进行数据归一化”。

   这里,所谓的“匹配点”,是从研究对象“老虎,树杈”上取点,然后在另一张(或多张)照片上找到相匹配的点。这个过程和我们在前面两个试验里画那些平行线作用略有相同。我们的试验目的,是要找到视角发生变化之后,在空间平面和曲面上绘出的平行线(原始点位)投射到屏幕或照片上形成两维图像时它们的间距发生变化的规律,得出了:空间平面上的平行线间距发生线性变化,空间曲面上的平行线间距发生非线性变化。而论文作者,在选取了为数并不很多的“匹配点”之后,在没有对“匹配点”发生位移的差异以及原因作出进一步分析以便判断所属类型是否可以通过变量变换成线性模型的情况下,就开始用线性化的方法去处理一个可能非常复杂的空间曲面,套用RANSAC的线性方法,建立方程,进行数据归一化,求取它们的坐标,并建立了一个“基础矩阵”,再用线性方程组求出新的坐标,进行“重建”。这个“归一化”的过程给人的感觉就好像用我们在实验1里得到的COSa去处理试验2中所有的平行线间距,把我们的圆环在粘合处撕开,展开成一幅平面图形,使它们看上去距离相等,这实际上是对空间数据进行了平面化处理,事后的“显著性检验”模拟试验的参照物则全是表面形状为一次曲线的桌椅类器具,让人不得不怀疑论文作者选择的“算法”不符合实际,引进的误差过大,有张冠李戴之嫌。由于“算法”是这篇论文的基础,这也就让人有理由怀疑国防科大这篇论文是一座华而不实的建立在沙滩上的楼房。

   我的讨论文章从古哥萨克人的头颅说起,涉及到一系列颇有争议的话题,现在终于到了该结束的时候。

   任何一张照片,尽管已经被压缩成两维图像,但其中包含的立体信息,是不应当被忽略的,更不应当用简单化的手法去对待。“三维重建”这个字眼非常令人神往。它的本意,应当是挖掘两维图像中的立体信息,重建其栩栩如生的三维模型。如果我们的研究对象果然是一只平面老虎,在老虎身体上所取的匹配点之间出现的位移和尺寸变化就必然符合线性变换规律,最后得到的应当是在三维空间中的一张厚度近乎为零的纸板,而不是一个纵深0.1米的“定论”;但如果我们的研究对象是一只真正的老虎,老虎身体上匹配点之间出现的位移就必然不符合线性变换规律,那就应当使用非线性回归解析方法,增加取点,不是8个,15个,可能是80个,180个,1800个,以便加大研究力度,探寻发生位移和尺寸变化的规律,直到找出能够代表该区域空间曲面的函数,再扩大研究范围,将一条条曲线相连,将一片片区域相连,最后得到的就应当是犹如浮雕般的一只立体老虎。对那些搞航测,做学问,身负国家安全重任的研究者,这样说,是否能够得到一些启发呢?

(2008年1月29日整理)

 

  

关于单张照片的立体感及其他(续)

黄尔文

  在上一篇文章中,我们说到“三维重建”的本意,应当是挖掘两维图像中的立体信息,重建其栩栩如生的三维模型。并且提到了非线性回归解析方法,以及取点的数量问题。对华南虎照的三维重建为什么必须采用这种方法,这种方法与国防科大论文中的方法有哪些异同,为什么会涉及到取点的数量?这是本文要讨论的基本问题,但为了避免陷入到过于高深的数学问题当中,我们还是沿用前文采用的方法,从简单实例入手,叙述基本原理,了解结论,而把专业的东西留给专业人士去解决。

  图1中部黄色矩形及上面的暗色线是我们在上一篇文章中试验2中得到的圆柱面和圆心角平分线平分圆柱面得到的投影。圆柱及分角的条件没有变化,这里仍然代表一个被4.5度平分的空间曲面。在黄色矩形中,水平方向为X坐标,在例图中尺寸数据与曲面纵深无关,因此不再表述。垂直方向为y坐标,用来表达在图像上取点后,视角发生变化观察点出现的位移,只考虑绝对值;垂直于xy平面为z坐标,其数值与曲面的纵深有关,用来计算曲面纵深,数值也取绝对值。

  现在,我们开始用一种特殊的方法取点。也许是我孤陋寡闻,这种方法未见于我能查找到的任何数学著作,我称之为逐点分析累进式取点法。

  就好像在老虎照片上虎的轮廓部位取点一样,在黄色矩形上边框与中心线的交点处取第1点(实际操作时可以在初步分析后从任意部位开始取点,这里只为叙述方便),并投影至圆上。将圆顺时针旋转4.5度——代表视角发生4.5度变化,将圆上的点投回黄色矩形内,我们得到了第二点。将圆转回原位,并将第二点投到圆上,在圆上得到第2点,再将圆旋转4.5度,第2点转到了第3点的位置,其屏幕上的投影为第三点,再将圆转回原位,得到了圆上的第3点,…….,以此类推,我们可以在屏幕和圆上得到相匹配的第四点,第4点,第五点,第5点…….直到取够需要的点数。这里我们只需取20点就够了。实际上,不待我们取够20点,就会发现,我们在屏幕上所取得的点全都落在了黄色矩形从上文图2中保留下来的暗色线上,而在圆上的取点全部是平分圆心角用的4.5度与圆的交点。这样,我们的作图就相当简单,比如矩形,只要在暗色线上取点就够了。那么,在实际分析照片中图像的立体形状时,是不是也同样简单?当然也同样简单!

  在分析的照片上取第一点,然后在参照的照片上找到匹配点,测量匹配点发生的位移,记录数值,标回原始照片,得到第二点。在参照的照片中找到第二点的匹配点,测量匹配点发生的位移,记录,再标回原始照片,得到第三点.….。

  可是,这样做有用吗?非常有用!我们要知道的不就是图像中曲面的纵深吗?用图中给出的公式计算记录下来各点发生位移的数据Y1,Y2,Y3,Y4,…,Y19,Y20,求出各段对应的纵深 Z1,Z2,Z3….,Z19,Z20,然后简单求和(实际分析时会遇到代数和问题,我们的例子中用不到),得出的就是我们想要知道的纵深的近似值。同时,有了这Y1,Y2, Z1,Z2,我们可以在一个新的坐标系中标出它们的坐标,然后将标出的点平滑相连接,就会“重建”一个在平面照片中不可见的空间曲面。就像图1中右边那一段曲线一样。

  这里,有心的读者一般会问,你公式中的S是从哪里来的?因为,尽管视角的变化可以从分析中得出,但照片中曲面的曲率半径是未知的,在半径未知的情况下,视角所夹弦长自然也就是未知的,用未知的东西证明已知的东西,岂非要用循环论证?所以这个问题问得非常好。回答是:S是从测量中得出的,是我们记录所测量匹配点位移数据中的一个最大值。

  为什么要取这个数值,而不取平均值或其他什么数值?

  因为这个数值(最大位移的起始点与终点之间)代表了曲面迎向相机镜头的部位,是照片中曲面上的某一段与照片原始平面基本平行的部位,是曲面的最前面纵深接近零的部位,就像我们图例中圆的中部被分角线切割了的那一段一样,这个距离最接近弦长,如果忽略测量误差取点误差,可以说,它就等于弦长,因此,我们在未知曲率半径的情况下,通过测量,得到了S。

  下面,用这种方法计算一下我们在圆柱图形中得到的有关数据,反求出纵深,并“重建”一段空间曲线,来进行一次简单验证。

数据与计算结果简表     Z=√S2-y2

序号

位移量

序号

对应纵深

Y1

0.62

Z1

15.678

Y2

1.85

Z2

15.581

Y3

3.06

Z3

15.389

Y4

4.26

Z4

15.101

Y5

5.49

Z5

14.70

Y6

6.52

Z6

14.271

Y7

7.67

Z7

13.687

Y8

8.72

Z8

13.044

Y9

9.72

Z9

12.317

Y10

10.66

Z10

11.512

Y11

11.53

Z11

10.641

Y12

12.33

Z12

9.703

Y13

13.06

Z13

8.696

Y14

13.70

Z14

7.648

Y15

14.26

Z15

6.544

Y16

14.73

Z16

5.404

Y17

15.11

Z17

4.227

Y18

15.4

Z18

3.003

Y19

15.6

Z19

1.678

Y20

15.69

Z20

0

位移总量

199.98

总纵深

198.824

左列有关Y的数据来源于前文图2;右列数据经计算得到。

  验证的结果见数据与计算结果简表,所求出的曲面纵深198.824,与我们已知的200毫米仅相差1.176毫米,不到真实尺寸的千分之六,其中包含着作图和测量误差,也存在部分计算误差,系统误差只存在因弦长小于弧长而造成的累积误差,实际上可以忽略不计;而位移总量更接近真实数字,说明了函数的连续性,这就证明我们的方法是正确可行的,同时,从图1中右方的视图据计算数据得到的坐标点平滑连接所得的部分曲线来看,“重建”的结果也可以被接受。

  从上述方法中还可以看出,取点的方法特别重要。匹配点发生的位移在不同部位有不同的含义,不可被平均化处理。如果用其它取点方法,比如平均取点,在对数据进行平均化处理,会出现什么结果,这是下面要讨论的。

  图2,按照每20毫米取点,投到圆上,得到匹配点的投影。首先发现,圆旋转4.5度后,各投影点位移对应的弦长是分离的,没有首尾相连。图中圆上一段段互不相连的红线即可直观看出。因此用求每一段纵深的数值再取代数和的方法不能求出曲面纵深。用Z=√S2-y2求解也失去了意义,因为各段纵深是中断的,中断部分缺少条件无法直接求取纵深,因此,要求解整个曲面的纵深,只能采用线性方法。经计算, 10点的算术平均值为11.76,与最大值相比,由ArcCOS11.76/15.69求出假想平面倾斜的角度为41.41度,在取点的200毫米范围里,可以得到一个斜置的平面,在图中用红线段ab表示,其纵深为156.57毫米,与200毫米相差甚多,超过了20%,是根本无法接受的。所建立的一个假想中的空间平面,与实际空间曲面的形状相去甚远,也根本谈不上什么“三维重建”。

  需要特别指出的是,一般情况下,用这种方法,边缘部分取点和观察都比较困难,要进行平均化处理,边缘部分的最小位移(我们计算中直接引进的0.62)往往忽略不计,如果没有经过先期分析,取点间隔又过大,找不到最大位移点(我们计算中采用的15.69),这样求取假想平面倾斜角时,分子的位移的平均值会加大,分母的最大位移会减小,若落在在13/14附近,计算出的倾斜角只有20度左右,纵深约65毫米,如果取点大部分集中在图形中部,间隔又过大,求出的平面甚至可以近似于垂直水平面,计算出的纵深接近为零。

  这样的计算方法和计算结果当然更加不能被接受。

  注意到国防科大的几个学者在《“华南虎”照片的摄像测量研究》一文(下称“论文”) 中,所介绍的方法与本文在前面提出的方法(大体可归入非线性回归求解立体图形的范畴)有明显的不同,所采用的线性方法与本文后半部分所用的第二种方法部分类同。从论文图4图5所展示的虎体特征点的选取与分布来看,大部分点位分布于腰腹和头部,而在文中完全没有涉及由于影像曲面部位由“朝向”形成的最大位移一类概念,对数据的处理以精确与平均为手段,以“归一”到某一“比例系数”为目标,所取的点极有可能仅仅是原始照片上的点,未能真实反映或在计算中切断了照片上的点和照片中影像上的点的联系, 未能揭示照片中影像所具有的空间曲面的性质和函数关系,因此本文作者认为:第一,论文的计算结果必然引进了重大系统误差,因此,所得出的老虎身上“各点位于一个与像面基本平行的平面上”,以及与“拟合平面”“最大距离0.06M”的结论不真实,不可为各方采信;第二,论文从始至终反复提及“三维重建”,结论前也冠以“重建结果”,名不副实,属于虚假的套语,应从文中删除;第三,论文作者应对其计算方法包括采用的原理重新进行显著性检验,并向公众做出通俗性说明。

  由于论文在引言中即已明确指出所研究的题目属于“社会热点问题”,要通过定量的分析“解算目标在三维空间场景中的形状位置姿态等参数”,确定“虎照是平面模板虎还是立体虎成像”,在文中多次强调“准确性”,“求解精度”,给人以科学严谨的印象,在结论中又明确提出要“为有关方面最终确定‘华南虎事件’提供一个科学的参考”,而文章作者的署名下有“国防科技大学….”字样,文中又未提及文章是属于几个个人的研究成果还是职务成果,因此,发表后由于所具有的特殊学术和社会背景,被媒体随意解读,甚至流传至国外,造成重大社会影响。因此,不能将论文看成是纯粹的学术论文,而应从社会责任的高度考察其计算原理和方法的科学性准确性,同时也要求其结论的真实性和正确性。

  想起二战期间一段历史:诺曼底登陆前,英军为了造成登陆的主攻方向是加莱的假象,使希特勒相信盟军在英格兰东南集结了约40个师组成的第一集团军群,在英格兰东南部地区建立了大量假的物资囤积处、假机场、假飞机、假坦克,假大炮,有的是帆布的,有的是橡胶的,也有的还真就是画出来的!然后让历尽辛苦突破盟军空中防线的德军侦察机侦察照相。结果希特勒在关键时刻不敢下决心增兵诺曼底,丧失了最初的有利战机。如果当时纳粹德国的情报分析人员能够从侦察机拍的照片中分析出大量假装备,盟军在诺曼底的死伤恐怕不止12.2万这个数字,二战的结束也不知要延缓多少年!

  设想在战时,军方侦察机拍下敌军大量的真装备:飞机,坦克,导弹,装甲运兵车,可是分析人员分析照片后认为那些飞机机头机翼和起落架全在一个平面,是在帆布上画出来的,那些坦克的尺寸不对,是用橡皮吹起来的,会产生一种什么样的后果!

  最后,让我们回到文章标题的“单张照片”这四个字中。单张照片有些像我们用单眼视物留在视网膜上的影像。如果角度取得好,会有大量物体纵深方向的影像信息被压缩到视网膜这个两维图像上,但如果不辅以另一眼,在对纵深的深度的判断上就会有所欠缺,就好像如果我们要利用一张照片重建一个三维模型,将无法准确地计算纵深究竟有多深一样。但是,人的眼睛总有一眼为“主眼”,这一点,和三维重建又有些相似,我们只能以一张照片为主,参照另一张拍摄角度不同的照片重建起栩栩如生的三维图像,如果我们把两张照片上的所有东西全都堆积到同一张照片上,会得到什么样一个模型?

  有单就有双,双总是针对单而言,单又是双的基础。大概就是这么一个意思吧。

(2008.2.11)

 

关于文章涉及的“分辨率”和“清晰度”的讨论(一)

黄尔文

      刘老师在文章里本来就使用过“高辨”和“高清”,只不过质疑者不能精确理解在不同语言环境下两个概念的差别罢了。真正的“高分辨率”是指在单位面积下保存有更多的真实有效像素,因此能够更真实更清晰地表现物体的细小差异,如毛发,胡须,皮毛,以及皮毛的质感。“清晰度”则是从单一真实有效像素出发,以是否可以辨认为判断标准,所以“高清晰”无疑可以辨认更细小的物体。“分辨率”与“清晰度”之间有密不可分的关系,就好比物理上的重量和比重的关系。没有了重量,何来比重?有了比重,可以测算重量。

    下面讨论年画。

    年画老虎的胡须很清晰,达到了高清晰的标准。年画老虎耳朵里的毛很清晰,也达到了高清晰的标准。但是从胡须到耳朵这个纵深里,所表现的其它虎毛并不非常清晰,远远达不到胡须和耳朵毛的清晰程度,甚至有的相当模糊。这里提到了“纵深”两个字。很明显,年画虎面朝前,胡须自然在虎头的前部,耳朵位于虎头部后上方,因此,从虎须到耳毛之间必然有一个垂直于画面的距离,这个距离,就是纵深二字的含义。这里,我不直接说“景深”是因为我所选取的“纵深”在这张照片中小于“景深”。什么是“景深”?这是摄影者常用

的术语,是指拍照片对焦距时,可以获得清晰成像的那一段距离,一般光圈大“景深”小,光圈小“景深”大。但对年画虎来说,既然前部虎须后部耳毛达到了高清晰的程度,说明它们处于景深有效范围之内,而在这个范围之内的其它虎毛至少应当同样清晰,或者更清晰,因为聚焦平面必然落于这个范围之内,而聚焦平面上的物体成像应当是最清晰的,对这一点,任何照相机都不可选择,即用单一照相机不可能拍出前后清晰中段不清晰的效果,这是由光学成像原理决定的。然而,据说是拍自德国老虎的年画虎,却违反了光学透镜成象原理,在前后高清晰的中段,出现了不清晰的效果,例如老虎鼻子旁边的脸颊,就十分不清晰,放大后,只看见有如油画画布上凃出的色彩有异的斑块,看不见一根清晰度相仿于虎须的虎毛,而那里本应当是最清晰的毫发毕现的部位。就凭这一点,也可以判定:年画虎是一个虚假的高清晰。

 

关于文章涉及的“分辨率”和“清晰度”的讨论(二)

黄尔文

      我没有研读过影像学的基本著作,手头也没有那种东西。对分辨率和清晰度的理解主要出于对物理学中光学成像原理的理解。我理解的分辨率是“在单位面积下保存的真实有效像素的数量”。什么是真实有效像素?是可以被区别被分辨能够真实反映并清晰地表现构成影像的基本元素。也可以理解为边界特征明显,能够区别于其它影像单元的基本单元,即最基本的点,以及由这些点构成的线和面。而在单位面积下所保存的真实有效像素的数量就是分辨率。很明显,单位面积里所保存的像素越多,影像就越清晰,保存的越少,影像就越模糊。

    例如,在边长1厘米的正方形里,如果只有4个有效点,这4个点要扩散成圆,覆盖整个正方形,圆的直径要大于7毫米,但如果在同一个正方形里,有400个点,点的扩散形成的圆直径只要0.7毫米,就可以覆盖整个正方形。因此,分辨率越高,越能真实地反映出点的特征,这里,由点扩散成圆是一种直观的说法,用圆的直径大小(包括圆的面积)来表示产生模糊的原因和程度。实际情况当然要复杂得多。但要建立数学模型,进行定量的分析,并对图像进行高级处理(特指用计算机的处理),去掉或改变那些圆的重叠部分,插入能真实表达点的特征的某些函数,用这些插值重建点的边界,提高图像的清晰度,类似的方法肯定是第一步,只不过这第一步可能已经运用于某些软件当中,许多使用软件的人未必清楚罢了。

    再说清晰度。“从单一真实有效像素出发,以是否可以辨认为判断标准”这句话不是一个定义。单一真实有效像素,必然是边界清晰,能够真实反映外部物体的影像的最小单位,这些最小单位与它们相邻单位共同构成了整幅的画面:线条,阴影,色彩,过渡区,影像的各种细节,等等。如果这种能够真实反映了外部物体的色彩且边界清晰的单位足够小,所构成的整幅画面的所有细节就必然清晰,而这种能够被识别的单位不够小,所构成的整幅画面也相对模糊,所有的细节都同样模糊。因此,我们可以给清晰度下一个定义:清晰度是能够显示影像最小细节的能力大小的指标,以人的视觉可否辨认为主要判断标准。

    从这里可以看出:“分辨率”与“清晰度”之间有密不可分的关系,在本质上也是相同的,是说的同一种现象,只不过表达方式和识别标准有差异,适用对象也有不同。因此,在同等条件下,分辨率越高,清晰度也就越高;分辨率越低,清晰度也就越低,这是毫无疑问的。

    那么,能不能说:我用高分辨率的相机拍下来一张模模糊糊的照片,因此照片分辨率高,图像清晰度低,并由此来否认“分辨率”与“清晰度”本质上的“同一性”?首先,使用高分辨率的相机所得到的相片未必就是高分辨率的。如果拍照时焦距没有对好,拍摄的物体未处于聚焦平面上,物体通过相机镜头投射到底板(视屏)的像素会位移,重叠,变形,真实的像素便得不到得到保存,因此只能说“你的高分辨率被人为地破坏了,你用高分辨率的机子拍出一张模模糊糊分辨率很低的相片。”

    还有一种说法:化妆品广告中的某些女性照片是高分辨率的照片,但经过“磨砂”处理,她们的脸上很光滑,但清晰度很低!

    所谓的“磨砂”处理,就是人为地消除图像某些区域中原始像素的边界,降低色彩的对比度,使你在视觉上无法看到一些细小的地方存在的缺陷,但这同样是人为地破坏了原始像素的真实性,看他们的头发,首饰,衣物等部位,特别注意那些细小的地方,仍然能够判断这是一张被处理过的高清晰照片。同样,在顺光条件下拍摄出的一些常被用来表现少女的清纯,被称之为“高调”的照片,手法类似,不能用于否认清晰度和分辨率的同一性。不赘述。

    既然说到清晰度,最后分析一下网上流传的一种很奇怪的说法:清晰照片只能PS出模糊照片,模糊照片源于清晰照片,具体一点,这里最清晰的照片说的是德国虎,清晰照片是年画虎,模糊照片是周照虎。因此得出周照虎只能PS于年画虎,年画虎PS于德国虎的结论。

    先说一下模糊照片能否PS出清晰照片。这里PS是广义的“用计算机对数码照片进行处理",而不仅仅局限于Potoshop一种软件。

    我用过一种软件名叫Focus Magic,中文名可译为“焦距魔法师”。如果你拍出一张照片,因为焦距没有对好而有些模糊,可以用这个软件处理一下,调整一下数码照片的焦距,效果很明显,这么一来,你也做了一次试验,用一张模糊照片PS出了一张清晰照片。

    如果是在辩论,我已然取胜!你只不过在动物园里见了几只白天鹅,就下结论“天下所有天鹅全是白的”,我告诉你:“诺,这不是一只黑天鹅?”但这种取胜或许有些胜之不武,只讲了一种情况,焦距没对好,没有说到其它多种情况,比如照片原始图片很小,经过放大后出现的模糊。所以,还得多说几句:

    用计算机处理放大后的图像的模糊,其原理和Focus Magic差不多,都是插值问题,即前面所说的“插入能真实表达点的特征的某些函数,用这些插值重建点的边界,提高图像的清晰度”。当然,要做这些事情就凭炮制了第一张年画虎的小商人恐怕不行。他的本事充其量就是用画笔手工添几根虎须,粘一对耳朵,处理一下底板。但注意到网上流传这样一种说法:所谓提供底片的外国公司几年前就已经被世界上一家著名的软件公司收购,他们要制作出比年画虎德国虎更清晰的照片都是有可能的。计算机软件的功能之强大超过了大多数打虎派人士包括那些才掌握一点摄影入门知识就急于以专家权威口吻说话的人的想象。

    那个外国软件公司如果真的介入这次事件倒是完全可以理解的。他们以他们民族和国家利益为出发点针对中国采取的任何行为都可以理解,他们先进高超的科技手段也足以让他们的对手尊敬。

    就像索罗斯当年配合意识形态和其他多领域的攻击,用金融战打垮了苏联,使一个超级大国分裂成十几个小国。就像卡尔格什曼当年通过提供资金、活动场所等手段,支持政治反对派推翻查韦斯政权及其政党联盟,包括向反对派政党、非政府组织、媒体、研究机构、大学、工会和企业主提供资金、培训人员、提出建议、进行领导等,对查韦斯政权实行“静悄悄的干涉”计划。这些人是为他们的国家利益而战,就凭这一点,我们难道不应当尊重他们吗?

    可悲的是那些浑浑噩噩的中国人,是那些为虎作伥的中国人,是那些一心想要出卖祖国唯恐天下不乱的中国人,面对现在错综复杂的国际局势,我们难道还不应当警醒吗?

  最后修改于 2008-04-27 11:56    阅读(?)评论(0)
作者已禁止网友对该文进行评论