| Xiaodi's profileFilestorm's purgatoryPhotosBlogNetwork | Help |
|
|
10/6/2009 一则翻译最近对Homunculus的中文翻译感到颇为棘手。“小人”明显不妥;“微人”也不形象;“人造人”这种明显带有小日本风格的翻译大概也说不通。直译“何蒙库鲁斯”就更山寨了。 想破头的时候翻wiki,却一下子看到很有意思的传说。 =====以下内容转自wikipedia===== 何蒙库鲁兹(Homunculus),或称“精子微人”,意指欧洲的炼金术师创造出的人工生命,也指这种创造人工生命的工作本身。 其制作方法是、在烧瓶中放入人类的精液以及各种草药、马粪并且密封,通过马粪的发酵作用来进行保温。经过四十天后,烧瓶中就会出现透明的具有人类形状的物体。但是此时它因为还没有肉体,需要加入活人的血液,并在四十个星期里保持马的胎内温度进行培养。这期间内,每天都要保证加入新鲜的血液。如果把它拿出烧瓶,或是停止新鲜血液的供应,则会立即死亡。(在有的传说中,烧瓶也一定要使用水银烧瓶)。经过这些工作完成的生命,外表和人类儿童基本一样,但是身体比人类要小很多。何蒙库鲁兹自降生起就具备了各种各样的知识。 据说欧洲文艺复兴时期的炼金术师帕拉塞尔苏斯曾经成功地制造过何蒙库鲁兹。但是在他死后,再也没有第二个成功制作出何蒙库鲁兹的人了。 之后18~19世纪的德国的文学家约翰・沃尔夫冈・冯・歌德,在自己创造的歌剧‘浮士德’第二部第二幕中也涉及到了何蒙库鲁兹相关的题材。在现代的诸多创作中(特别是在日本),何蒙库鲁兹也成为了很多漫画以及游戏的故事题材。 基督教因为认为这种创造人工生命的技术是属于作为创造主的神・耶和华的领域,人类不应随意涉足其中而忌讳这种传说。 =====转载毕===== 另据wiki说,创造了Homunculus的Paracelsus拥有贤者之石。其父名叫Wilhelm Bombast von Hohenheim。 霍恩海姆,烧瓶中的小人,贤者之石,炼金术……这些东西竟然真的有历史记载!! 写到这里我觉得我整个人都钢炼了。 9/30/2009 失去之后才知道可惜…… Candes走了,我才又一次(已经不知道是第几次了)发现他的研究是如此高瞻远瞩。现在愈发后悔为什么当初没在Candes家做一个学期的rotation呢……竟然跑去训猴…… 所幸的是,还和他的一个学生保持着联系,希望可以从他那学来一点精髓的思想。 最近两周不得不看大量传统CV的工作,95%的papers是把一个视觉问题转化为一个优化问题然后用通用的优化算法求解。这种文章看一两篇(如果纯考虑应用的方法论,不如直接去看LeCun或Bengio的那些framework文章)还能忍,看多了智力实在下降得快* 必须不断找机会聆听智者的教诲,才能在初秋时节感受到春风拂面,让自己那变得越来越糟糕的思路化腐朽为神奇。 *想起鸟笼山剿匪记的对白:“大王,您不是一直嫌自己智力太高么,那就得多看看电视” 9/16/2009 The Quest for Consciousness - 1 好久没更新blog了,对不住各位读者~ 最近在筹划许多"BIG plans",待我慢慢道来,其中之一就是参与翻译Christof Koch那本很有意思的著作:The Quest for Consciousness 这书讲的是一个关于“意识”的故事。简单地说,生物学家一直搞不明白我们的七情六欲是如何从大脑神经的物理结构中产生的——当然,更大胆的人也许会问,七情六欲有没有可能根本不是从脑神经结构中产生的?对于这样一个棘手的问题,Christof并没有直接找到一个脑区说,我们的灵魂就来自这里——相对地,而是通过展示大量正常大脑和不正常大脑的行为、结构依据,来试图寻找意识的各个部分,是如何工作,以及如何相互分离的。 在翻译的过程中,我会陆陆续续在这里放上一些有趣的片段,这样即使不是神经科学专业的朋友们,也可以得到一些茶余饭后有趣的谈资——其实科学在早年,本来就是为达官贵人们茶余饭后时聊天提供谈资而应运而生的。。。 另外说说目前我知道的的出版方面的消息。翻译本将由上海科学技术出版社出版。翻译工作是由复旦的顾凡及老师和我负责。顺便赞一下顾凡及老师。前几天和他email了几次探讨关于翻译风格的统一这样的问题,深深感受到老一辈知识分子的风骨十分可敬。相信我们这次一定能把这本有趣的名著原汁原味地呈献给大家。 哦,另外,本书目前拟定价35块RMB。考虑到美国原版定价是45刀,AMAZON上也要卖32刀,这个价位相当厚道了。(虽然这么便宜意味着我能拿到的稿费也少得可怜——不过服务大众这种东西我本来也没想着挣钱。再说我以前参与编写的各种正式的和非正式的出版物,每次都要我倒贴钱进去,只要不亏我就满足了) 不了解我的朋友们可能会问我的动机。其实很简单,没打算拿这个玩意儿挣钱,也没打算,就是提升一下相关方面的重视程度。且不说做人工智能的同行们经常在神经科学上一缪千里(比如以为Brain-inspired computation就是选择Gabor或者DoG作为线性滤波器)。一些非本专业的朋友们也经常会问我一些常识性错误的问题。比如以下这几个典型陈述: 1. 正常人的大脑只利用了10%左右。 正确答案:正常人的大脑没有一块儿肉是闲着的,就像身体的每一个器官,缺了哪块儿都会出毛病。 2. 爱因斯坦的大脑结构和一般人不一样。 正确答案:爱因斯坦的大脑被切片研究过,但是在结构上,没有发现任何正常人有区别的地方。 3. 失忆症就像旧电视——使劲拍一下就会忘了自己的名字,再使劲拍一下就会想起来。 正确答案:失忆有很多种,的确有可能通过猛击破坏某个脑区从而“失去曾经拥有的记忆”(相对来说,还有另外一种“失去产生新的记忆”的能力)。但是失忆很难逆转的。而且就算是修复也不是靠猛击…… 还有很多类似的谬误不一而足,欢迎楼下同学补充。 上面提到的这些问题,在Quest for Consciousness中,都可以找到各种有趣的故事来解释——比如通过某个小日本拿冬天冻在房檐上的冰锥戳眼睛自杀未遂却产生了第二人格,来解释左脑右脑的分工问题。 然而,本书与描述飞碟、外星人、史前文明、超能力等小说的不同之处在于,每个case study都是在很严格的科学环境下进行的。都是有据可查的(不少故事都是nature science上的文章) 工作时间到了,今天先讲到这里。待续…… 9/3/2009 书读百遍,其义自现研究需要,晚上祭起信息论[1]重读。 已经不知道是多少次,觉得自己“足够认真地”看这本皱皱巴巴的书了。可是每次读过,却总能有新的体会。 想起两个月前和老张的通信[2]:“比如你刚学信息论的时候,总是摸不透熵是何物。只有你不断去用时才会理解。” 其实,我想补充的是,就算是已经完成了好几个和熵直接相关的理论,我还是没摸透熵是何物。 P.B. Shelley说得对[3],Claude Shannon stood alone illuminating an age unworthy of him. 这里需要顺便指出一下带着实际问题学习理论知识的重要性。 如果没有实际问题支撑,各种定理公式流于形式。就好比我现在很难说在对单神经建模,到底应该用分类器更合理还是看成有噪音的信道更合理。在每次将实际问题代入抽象的模型时,我们总会无可避免地加入各种先验假设。而假设的合理性必须基于对模型入木三分的理解。而且,假设的合理性直接决定了模型的性能。 回顾国内教育的矛盾之处往往在于,教书人盲目地强调基础有多重要,恨不得你本科四年学四年基础,以为这样就可以制造内力雄厚的全才。但是说实话如果你不是天才也不是自闭症患者,几乎是没有可能直接在抽象的学习中把基础的每个犄角旮旯都摸透。更谈不上理解基础理论背后的假设,及其在具体模型中的意义了。 -----reference----- [1] Elements in Information Theory [2] Personal communication [3] A Defence of Poetry - Percy Bysshe Shelley 8/28/2009 电生理前几天刚做了第一个电生理实验,正在处理数据。 所谓电生理,就是研究生理放电现象——具体说,就是神经的活动。 为什么要揭示神经活动呢?是因为神经的活动,体现了智能的计算本质。 而了解了智能的计算本质之后,我们就应该能有机会设计出人造的类似物。 把神经网络当成电路,我们用一根导体电极靠近单个神经,就可以在胞外(或胞内)测到相应的电位变化。继而根据生理物理学的一些知识,推断出该神经元的状态。 所幸的是,单个神经元的状态空间相对比较简单。于是用如此朴素的方法,我们就已经可以大概获得一些信息了。然而不幸的是,整个大脑总共有100兆个这样的简单单元。这样的比例已经不能说是“管中窥豹”的尺度了,而应该说是“见一叶落而知岁之将暮”。 为了捕捉那“一叶落”,我们有时会潜到大脑的深处。 - 深度? - 12540 - 继续前进100 - 现在深度12640,发现有响应,开始记录 - 响应逐渐增强,可能是组织纤维回弹 - 组织纤维回弹,为避免损伤探头,后退30 - 原响应消失,前进100 - 出现两个新的信号源,前进50看能否接近其中一个 …… 恰如其分地说,我们就是大海捞针一般地在“脑海”中探寻。 能否找到大脑在进行人脸识别计算时的线索? 能否找到那传说中的祖母细胞? 能否观一叶而知天命? 现在要给答案,还早。 7/21/2009 The vision of the vision扯蛋分两种,有的人聚在一起,无论一开始是商量多么正经的事儿,不消五分钟,肯定岔开到十万八千里外。另一些人,无论话茬子来自什么鸡毛蒜皮的事儿,到最后都会莫名其妙地落到学术问题上。 周末林达华过来玩,于是我们之间的讨论自然而然地就是后者了 其实我现在已经不做一般意义上的computer vision了(见过哪个搞EECS的天天训猴?),平日打交道的同学、同事们大都是生化、电生理出身。以至于近半年来,绝少有和人讨论机器视觉相关问题的机会。这次我俩算上晚饭时间,总共海聊了7个小时,感觉极爽——而且dahua还带来了Miami一线的报道(CVPR 2009),有不少有意思的消息。 也许好久没想CV的事儿了,今天送走dahua之后,感觉脑内热度完全没有消退的意思。现在脑子里全是些CV的事儿——当然,也许是因为这才是我做电生理(electrophysiology)的主要动力吧。 视觉到底应该关注什么?虽然CV一直在说,我们要做新问题,但是我以为,对所谓的“新问题”用照猫画虎的方法按照解决旧问题的思路写一篇实验报告——这样的风气是难以让人满意的。我们需要的不是新的问题,而是新的解决问题的思路,方法,以及手段。归结下来,是新的表达(representation) David Marr在世的时候就一直在说,表达是视觉计算的核心。无数的electrophysiology,psychology也都在暗示我们需要有更高级的表达以完成高级的任务。可是这么多年下来,sift / histogram / gabor几乎变成了computer vision的全部表达——对于绝大部分算法,在这些表达之后的计算过程我们只能称之为inference——因为这些后续计算都是为了解决一个高度局限的实际问题出发,而非如人的视觉系统那样,为了解决普适的视觉欠定问题,而以数据驱动的方式演化出来。 正如dahua指出的那样,现在做visual representation是最吃力不讨好的工作。对此,我深有同感,并且也愈发感觉到自己从Computer Vision界转而投身到Computation & Neural System,一心做“表达”的必要性。 结尾处插播一则关于会议见闻的见闻: 据说Ma Yi关于sparsity和人脸识别结合的工作竟然被普遍认为是“新工作”。这着实让我非常震惊。其实自从08年,他就一直在忙和这个事儿。光我这儿就已经从无数人嘴里听到无数好评,(而且我也给无数人推荐了这个工作),好像有内部消息说该文章在conference上一直走背字,以至直到CVPR 09才终于有了机会在conference上好好宣传一下。 顺便指出,sparsity的核心,我认为依然是一个“表达”的问题。虽然目前从各个学科,我们已经积累了无数的侧面依据,但最多我也只能朦胧地问:难道sparsity是视觉神经计算的本质?(One ring that rules them all?) 5/18/2009 Alright, another dilapidated computer vision conference! 刚刚拿到ICCV审稿意见。我以前觉得这会又不是年年开,应该能比CVPR好点吧,但是今年的抽样一下就驱散了我那天真的错觉。 三个审稿人,一人完全服,俩人有意见。说实话我真的是挺好奇,这回憋了一年写出来一篇文章堪称呕血之作,他们能挑出什么骨头。 一篇文章最核心的几个硬指标应该有:宏观观点上的新方向,细节技术上的新突破,甚至benchmark的提升…… 如果拿CNS publication来说,我当然还有很多需要做的工作。可我这回投的是ICCV啊!考虑到会议档次,真的很难想象文章的核心思想及主要结果会被提出什么“意见”。 但是,果然还是有意见。俩人的意见加起来有: 1. 你文章的英语水平不行,hard to read! 2. 你的工作都被别人做过啦! 3. 你的工作和Xiaodi Hou相关! 虽说我对自己文章的文法很自信,但咱毕竟不是native speaker,也许会被土生土长的老美看出来。可是……是最后帮我从头到尾改文法的老板,可是隔三差五在CNS写perspective的主儿啊!! 相反对比一下那俩reviewer写出来的支离破碎的意见,我不得不以小人之心地怀疑这两位应该不是native,并且除了标准computer vision conference junk paper之外,他们应该也没有读过English as a language. 至于第二点,我的体会就像是玩RPG游戏的时候,你在未达成某个条件(比如没有打败某个小怪,或者没有得到某个宝物)的时候去找一个NPC说话,他通常会用一个驴唇不对马嘴的理由拒掉你。而这时候也一样。 第一个人白纸黑字地说,你用A方法做B事情这件事儿,早就被人做过啦!然后扔给我一篇1988年的文献。 如果我有机会rebuttal,我特别想白纸黑字地对他说,首先,我没用A方法,其次,我没做B这个事儿。 合着我文章他压根没看,那么多实验,那么多理论,跟88年的古文一毛钱关系都没有。你怎么能睁着眼睛说瞎话呢? 退一万步,我给你找个理由,我在理论推导中用了一个小概念,也许看上去和88年的那文章有点像,但是那也只不过是“络”和“铬”的关系而已 另外一人还举出Xiaodi Hou以前的某篇文章,说你地工作是这个文章的follow up。这就好像说,在Shannon 1948年之后,任何提及了 概率函数的log期望 的文章,都应该被认为是Shannon工作的follow up。 我心中还暗喜一下,Xiaodi Hou在你心目中地位这么高呢~ 但是作为一个principled scientific researcher,我是绝对不会在没有足够充分理由的情况下,去写一个新的理论。换句话说,如果非要说我的文章是Xiaodi Hou某文章的follow up,那么我这个follow up绝对是充分必要而且有重大意义的。 提到信息论,我还得顺便说一下,其中一个人审稿人竟然还在challenge我信息论的某个公式。这一徒劳的举动一下就暴露了他连熵的定义域都有基本错误——建议重修概率论。 至于文章本身,某个reviewer给了这样一句: Although the simple code may work, ... 于是我不得不很负责任地指出,这不是MAY work, 是HAS worked! 这样的理由,实在是和“莫须有”颇有几分神似。 也罢。反正我也不需要精忠报CV的这个国。你们一趟浑水爱怎么折腾怎么折腾去吧! 5/1/2009 Every model is wrong, some are useful简短截说。感觉很多人都有一个误区,以为模型推导部分越复杂、越华丽、字数越多、公式越厚就越强大。 其实,我们几乎所有对自然企图建模的企图,自打一开始就是错的。但是之所以某些模型被人用了几十年上百年还经久不衰,是因为他们在适用范围内的近似都是合理的。 从Boltzmann到Hodgkin,后人拿起他们的模型,最应该把玩的,不是后验地感叹这些模型如何解决了实际问题,而是仔细体会这些模型的前提假设中所蕴含了何等高超的智慧。 试想一下如果对每一个问题,一上来不管三七二十一先例行公事地把顶层的理论框架按照最“标准”的方式写出来,那就完全是在画地为牢了。可惜不幸的是,部分会议的部分reviewers根本没有这样的觉悟,习惯性地指出“不常见”假设(Gaussian这样的假设虽然可能跟一个具体模型差的驴唇不对马嘴,但是因为大家都在用,所以一般没人challenge)中的特例,是他们义不容辞的责任。 若是长此以往,真的很担心那些以这种方式选出来文章的出版物,会不会死于平庸。 后记,和XL同学聊天,听到一句经典,补在这里: It's not your algorithms that work, but your hypotheses that work. 3/12/2009 同学们,大家好以前就知道我不适合教书,一没耐性二没有连续性思维。
但是今天还是在老板有预谋的夸奖和劝诱下,我还是从了:做下个学期的TA——而且还没钱!!(因为现在已经在拿系里的fellowship,说是有规定最多就给这么多)
看样子下学期的偷懒计划泡汤了,我的qual啊……
不行,得跟老板说说,不给钱给qual也行! 3/7/2009 太不专业了今天看JPEG 1991年的文章,一眼发现Fig2最后一图的格子没对齐,线宽也不统一。
sigh... 太不专业了~
说起来我最近对格式的统一越来越敏感。刚发现LaTeX里面如果想敲signum函数,需要\rm{sgn}()才能达到和\sin() 或者\arg() 统一的字体。以前都是土鳖地用\textrm{sgn}()。可是编译以后放大PDF仔细看会发现实际上这两者不是同一个字体,其中一个g有尾巴,另一个没有……
还有,argmin()应该是这样输入:\operatornamewithlimits{argmax}_{your condition}而不能\arg \min_{your condition}。否则优化条件是以max为中心对齐,并且arg和max中间存在一个空格。遗憾的是,翻翻IEEE的proceedings,好多人都用错了。希望看到这篇blog的同学们今后能避免TeX时代的错别字 3/4/2009 关于做研究的风格其实只要你做research,都会渐渐有自己的风格。
CV圈子里,我就想起啥说啥了:
有的是概念流,比如Poggio, Koch, Adelson
有的是统计流,比如Perona及其弟子, Zisserman及其弟子
有的是图模型流,比如Jordan及其弟子
还有自然流van Hateren,心理流,神经流,工程流,应用流,暴力流,人肉流,A+B流,parameter tuning流……(越往后越不敢列举人名)
甚至就连读周围朋友们的文章,也都有挺强烈的个性在里面——不过以下朋友的工作我其实也就读过两三篇。要以偏概全你们别跟我急。
LC的文章总让我眼前一亮。立意新颖,细节处理也有如教科书。
LDH的文章里,总能看到一种generalization不同模型的倾向。
ZDL的文章喜欢通过形而上的思考和探讨来解决普适的问题。
其他朋友的文章没怎么看过,点评欠奉……
然后再看看本人的研究,六个字概括一下:简单粗暴猥琐
首先因为我没有闲心,没有恒心,更没有能力编写大型工程代码,所以我的算法实现(MATLAB)从来都是极短的:CVPR-07 5行,ACMMM-07>300行(这个最麻烦),NIPS-08 20行,并且最近正在准备的文章更是将这种草履虫编程风格猥琐地发挥到了极致。
其次因为我的研究纯粹走野路子,关于Machine Learning方面上得台盘的算法,我掰手指头一数发现几乎自己根本没几个熟悉的——不瞒您说,SVM上周六人生第一次摸;adaBoost也没用过;什么谱聚类核方法图模型,甚至连Markov Chain,我都没亲手做过哪怕一个实验。就瞅这功底怎么才能做研究?所以我搞的玩意儿,一概不怎么需要调参数:一方面我也承认,无参模型的确挺酷的,另一方面是,给我个带好多参数的模型我估计我deadline之前也很难调出什么名堂。
至于猥琐,在条件允许的情况下,我一般不跟人光明正大地拼benchmark——倒不是说拼不过,主要原因是懒。因为要拼benchmark就得读好些文章,还必须精读,而让人不爽的是,那些benchmark分数高的文章又通常是参数多的一塌糊涂,字里行间还加两个小阴招提升性能,不知道的话很容易被打败。而且一提到benchmark就离不开跑实验,于是乎又得多写N行代码。对于benchmark,一般的策略(我还没实践过)是:“比我漂亮的没我聪明,比我聪明的没我漂亮”。但是,我更喜欢给一个新的应用,然后说:这件事儿别人做不了但是我能做。自然这里面就没有benchmark的烦恼了。
不知道这次的工作,到底能将上面六个字发挥到什么地步呢——目前看来都满足得一塌糊涂。
敬请各位CV领域的同学朋友们期待一下本年度最新的山寨理论,简单粗暴猥琐。 2/18/2009 What makes a good computational model欢迎转载,转载注明出处。 想写点什么,但是把题目写完后,隐隐觉得自己有僭越之嫌。希望不要有好事者闲的蛋疼站出来跟我较真……本文仅作为私下交流之用。看完有收获的心里赞我两句,没收获的心里骂我两声即可,千万别再浪费时间跟我这儿矫情。另外,我文中可能会提到一些方法和框架都是随口编的,没打算暗指任何人已经发表的任何paper。如真需要指的话我会明说。
本文中可能会拿三流和一流工作打比方。这里需要澄清,三流工作也经常能在一流会议上见到,反之亦然。所以请不要总拿一两个类似XX牛会上发表的XX文章这样的例子来混淆自己——这道理再明显不过了,连韩国也不是没好人嘛。 选择合适的问题而非方法 这种文章为什么烂呢?因为它的科学贡献太低了!大家用脚趾头思考一下都知道这算法肯定能在这个数据集上跑,一个好的结果(如果不是出乎意料地好)通常是由调参数来实现的,而且严格说来,很多人的参数选择实际上是在作弊——这就不深讲了。这样的文章我管它叫“实验报告”。 在我认识的同龄人里,让我感觉最突出的一个问题是:不少人在做一个问题之前,想用什么方法是已经预先定好了的。比如“我打算用小波做人脸识别”,或者“我打算用HMAX做segmentation”,若是依据这样的想法迈出第一步,我们实际上就已经抹杀了“建模”的大半乐趣。我以为,所谓计算模型之类的东西,之所以刺激,是因为方法不限。我们可以极尽龌龊地尝试新思路新方法。想象一下在创造力的比赛中,一开场就把自己的自由度砍掉一大半,这不是找死么……
什么是精彩的结果 把计算当成一门实验科学,我们也完全处在一个“寻找反直觉、反现行框架的现象”的过程中。
2/15/2009 梦见跟老板预约面谈……最近总做恶梦。
今天早上梦见跟老板预约面谈,惊醒。
到现在还有点后怕,赶紧窜到实验室看paper。
倒不是说我根本不干活怕被人发现,而是一直觉得,每次拜见老板总不能空着个手吧,那多不好意思啊……
可惜最近一个多月的干货不多,担心要是哪天真来一场清汤寡水的面谈就囧了。
顺便发一下CV的牢骚,最近看了一些十年前左右的ICCV/CVPR文章,开始渐渐理解为什么这些会的名声那么大了。
可是最近几年,整个CV的干货都不多,放眼望去全是一群搞优化的在打补丁,活像windows update一样,时不时蹦出个窗口说一些你根本不知道也不感兴趣的某个更新已经成功安装。 2/13/2009 你才是做幻灯片的,你全家都是做幻灯片的绝对不能再这样下去了,必须想想办法,每周至少5次presentation绝对不是个事儿。。。我读的是PhD不是PrD。 顺便说一下,今天presentation的内容是nature neuroscience 07的一篇文章,读到最后发现整个文章在数据统计方面的逻辑简直是一塌糊涂。这一点Vul在他著名的Voodoo paper中已经指出了,简单地说,你掷骰子,统计骰子点数大于3的全部事件,求平均,然后你惊奇地发现这个数比3大很多(比如,是5)。 总结一下,你处理数据的手段必须和你得到数据的手段统计上独立,否则逻辑就有问题。我相信不光是social neuroscientists,一些做computer vision / machine learning的家伙们也在干这种事情,要么每年怎么能出版那么多文章呢。。。
Emmanuel要走了,只能扼腕叹一下学校之间挖墙脚还真是激烈。不过至少我们也从烂校挖来了Doris,下学期的实验室有着落了。 1/29/2009 做神经的神棍据说人快死的时候眼里能看到特殊的幻觉图形。那是心眼里的世界么?
也许夏天到来之前,我可以给它一个令人信服的计算模型。对玄学的数学解释总让人觉得很激动。
感谢yyf的讨论。 1/20/2009 工程以懒为本不是不承认Hubel & Wiesel的历史意义,但是越来越反感Computer Vision言必称希腊,动不动就拿半个世纪前的生物模型说事的文章。尤其是越来越多相左的线索,让我担心打着"biologically plausible"的工程师么继续做下去真的会南辕北辙。
某些学科之所以迟迟不进步的原因,是没人能把正确的、先进的理论做的像那些古老、著名、但实际错误的理论一样浅显易懂。话说回来,工程以懒为本,而不是以正确为本。搞模型的工程师们向来都是能将就就将就。除非符合真理的模型能让他们更懒。
(BTW,一个错误的模型会在结果上带来更多麻烦,所以模型本身再简洁也不会削减麻烦程度)
要怪只能怪后人的智力太渺小,半个世纪竟然没有人能提出更美更简洁(而且更正确)的模型。 1/19/2009 世界真奇妙 II上一篇一待就是一个星期。
主要是最近7天做了4个不同内容的presentation,过的过于充实,现在回来看发现之前想说的大概都还给wiki了……
趁着没忘干净,补充几点,
先说听觉。大家都知道,我们耳蜗里有一滩水。骨头的机械振动在水里泛起涟漪,带动水里的纤毛机械振动,频率的分析也是基于这样的结构在不同空间位置进行的。
跟进化有什么关系?
在水里的时候,鱼可以靠体线感受水压的变化。但是陆地上气体的压力变化却很难捕捉(显然武侠小说那帮皮肤过于敏感的家伙是进化到另一个境界了,暂且不说他们)。如何在空气中进化出高精度且鲁棒的感受器?
两条路:首先,两栖类进化出了一个装水的袋子,可以感觉较低频率的声音;其次,他们的皮肤也可以靠大地当做介质传导声波。这两条路后来分别得到了进化。至于孰优孰劣,我们主要考虑信道的传输效能。证明就不写了,在同等失真率的情况下,能比的就剩下频谱域了。所以横向来看,在大家爬上陆地后,一个比较显著进化的趋势是高频听觉信号的感知。
主要依赖大地当媒介的生物们比如蛇蜥蜴,只对低频信号较为敏感,所以他们的听觉信号处理能力也是相对较弱的。但是我们也不能说让猫狗听交响乐就能听出什么新东西——因为sensation并不是perception。我愿意花五毛钱打赌说狗听觉的feature combination没有人类复杂,信心来自人类发明并使用语言这一点。
再往高进化的一大标尺是胎儿的相对质量。从软壳蛋到硬壳蛋再到“内置”蛋,这样做好处多多,别的不说,光成活率就不知道上升了多少。要从神经系统来讲,我觉得得从早期调控说起。但是这块内容大家还在争。反对者们的一个论点是,基因所承载的信息量那么少,神经元那么多,到底怎么“宏观调控”才能让这么大一个系统正常工作?
虽然我挺信基因调控的说,但是在想到一个好的论点反驳持不同政见者之前,先按下不表。。。
还有个比较好玩儿的事儿,恐惧症。比如有人怕猫,有人怕老鼠,有人怕蜘蛛,有人怕毛毛虫,当然还有不少人怕老虎。那天吃饭谈到这个事儿,某同学坦白自己有强烈的Arachnophobia。我很不合时宜地接茬道,Oh, gorillas have arachnophobia, too...
不过,说真的,这个话题相当有意思。如果我下学期闲下来了,可以研究一下蜘蛛恐惧症。 1/10/2009 世界真奇妙 1关于脊索动物的进化(数据来自Wiki,外加注解):
脊索动物门分头索、尾索和脊椎三个亚门。
从脊索动物开始,地球生物进化出了相对集中的神经系统。从最初的脊索开始,为了支撑更大的身体,骨头逐渐包裹住了神经电缆,形成真正的脊椎。
因为分类还存在争议,接下来暂时不过多讨论下门、总纲等分类概念,重点在进化本身上
脊椎动物里,首先发生进化的是嘴巴结构。是的,所谓下颌骨就是这时候进化出来的。
比如有一种相对低等的鳗,叫lamprey(据说是葡萄牙美食之一)嘴巴很像Dune系列里面的沙虫,甚是吓人。但是从进化角度说,这样的嘴巴功能相对有限。
于是从鳗到鱼,生物第一次有了下巴。
最开始出现的是盾皮鱼,一种目前已经灭绝的生物。这种鱼脸上身上都贴着硬皮——看着想象图让我想起中世纪的战马。因为有了下巴,他们就可以咬——大部分盾皮鱼类都是强大的捕食者。
但是盾皮的结构太过厚重,所以渐渐地就出现了软骨鱼,比如我们今天见到的鲨鱼。在进化上看,鲨鱼依然是很弱的一种生物,比如我们可以指责“鲨鱼弱得连鱼鳔都没长”,并且他的视力也很差,主要靠化学和电信号来捕猎。BTW,Adolph实验室里有一个真正的鲨鱼脑子。体积大概比台球小一些。沟壑也很少。
再接下来进化,硬骨鱼出现了。大家平时吃的鲤鱼鲢鱼鲑鱼鲈鱼鲨鱼鲸鱼鱿鱼鲍鱼,大都是硬骨鱼类。想要细分各种鱼类的话,就要看鱼鳍。绝大部分鱼类属于辐鳍鱼——这个分析起来没什么意思。这里我们主要说说另外一纲,肉鳍鱼。腔棘鱼(那种传说中会走路的鱼)就属于这一纲。
再然后,鱼从水里爬上地面,今天能看到的活化石,就是那娃娃鱼。在爬上来之后,需要同步进化的部件还包括眼睛和耳朵。先说视觉,爬上陆地的生物第一次发现原来上面的世界和水里的折射率不一样,于是眼睛的变焦系统被逐渐发展出来。变焦系统一出来,从fovea到feature combination——那一串东西都可以进化出来了
待续。。。
12/26/2008 Boston 的学术游记 part II在Boston见到Lin Dahua,发现我们各自的"grand theory"居然收敛到了一起!很是激动。
Lin谈吐不俗,思维迅速,与他聊天很有飚车的快感。比自己一个人闷头琢磨、或是看书看论文,都要畅快许多。很期待下次再有机会来Boston访问。
遗憾的是时间安排得不太好,结果没见到Liu Ce。可惜可惜!
这几天一直在想热力学统计模型,总觉得冥冥之中,我需要一个退火过程,但是实际开开matlab又顾虑重重,不敢用。
我们总说,用xxx模型解决了xxx问题。但是,真的用Boltzmann就能解释神经现象么?还是说,我们只是在合适的数据尺度上,恰巧做出了一个聪明的近似?如果是后者,那么我们岂不是拿龟壳来预报天气?比如说,我们可以找一万只龟壳来预报,几次试验后,舍弃掉那九千多个“预报不准”的壳,而已。
我现在越来越倾向变成一个"pathetic agnostic"了。 12/9/2008 快报@Vacouver因为还有期末project,现在没时间。
简短总结一下今天的见闻。
最大的两个感想:
Candes很强大,NIPS很抠门。
稍微小一些的感想有:
Charles Kamp做的东西比较有意思。Simoncelli做报告不在状态,希望这只不过是因为感冒造成的。明天等着听Olshausen讲。Tenenbaum的鼻子很有特点。看到几个激动人心的题目,可惜没有一个能解决我想象中该题目能涉及的问题。
在Computation and Neural System Dept的好处是,见了做Computer modeling的和Human modeling的人们,都可以套近乎~
最后就是各位做1分钟presentation的作者们都极端地选择不使用标点符号每个人上去深吸一口气人然后掐了秒表似的用各国方言说绕口令听的人直起鸡皮疙瘩。 |
|
|