Archive for the 'Academic | 学海无涯' Category

四十八分之十八:缺席审判

Sunday, May 2nd, 2010

University of Guelph Arboretum

人生或多或少就是一场缺席审判,网络是加剧这场审判的一大因素,因为它给人不断的错觉

第一个错觉就是拉近了距离
隔着一层东西用IM聊天的时候,我们看不到对方的表情,我们甚至可以硬拗过去尴尬的场面。这个时候对话更那么肆无忌惮,我可以试探你的底线,而你也可以迂回的逃避开去。但其实,心里的距离呢?迄今老爸老妈也没用电脑跟我视频过,家里的那台台式机也只是摆设,他们不觉得一定要天天视频,但他们期望收到我寄回去的照片,还往往还添油加醋的加一些乱七八糟的樱飞燕舞的情节。他们给我的缺席审判,不依靠网络,而依靠他们的跟我心的距离。而网络呢,豆瓣也追随了flickr将双方互相审核的朋友定义变成了自愿的单相思般的标记(tag),在我的词典中,我定义了我们的关系。

第二个错觉就是我们知道的很多
特别是twitter,它把太多的现场太多的第一线赤裸裸未加工的放在你面前,如果,没有经过一个思考的过程,就接受了它的内容,选择站在哪一边,或者受某一方的影响,确实是自身智力和人格的一大侮辱。比如说,关于某个一再更改游戏规则的部门颁布的不出现英文简称的通知,很多人在twitter上面说,那以后我们应该不叫CCTV而叫中国中央电视台,不叫NBA而叫美国男子篮球联赛,不叫CPU而叫中央处理器, 或者黑莓厂RIM要叫“研究不止”(research in motion)公司,甚至,更有讽刺的漫画画着说一场NBA会在不断的报名字之中耽误了所有的精彩。但是,CCTV对应的是央视,而中国中央电视台对应的是China Central Television啊。诚然漫画有夸张和讽刺的作用,但是如果我们误解了这一切的初衷是为了更好的汉语翻译和传承那也是不对的吧。

在过去,我们看到很多精妙的翻译,比如electricity翻译成电,比如gene翻译成基因,比如金融界的四大,花旗汇丰渣打等等。我曾经跟人讨论过这个问题,他说那你告诉我NBA翻译成什么简称好,foursquare那个服务翻译成什么好。对于后者,我想到的只是很一般的签到网,但是真正官方的玩转四方确实也是不错的翻译。在这个年代,读理工科的人不看人文社科文章,读人文社科的人都在看成功学捷径学,我们没有那么深厚的文学修养和汉语修养将英文玩转到汉语。而我们大多用惯了用熟悉的英文翻译,来自五四那个年代,那个有着八股的功底,而又在西学渐进中不断引进新的知识的年代。

我们很少经过大脑就RT了 推荐了一件事情,无论是对于这件事情的出发点还是对于自己的人生智慧,都是一场羞辱吧

第三个错觉就是误解
作为一个观众,看到我自己写的blog,也会觉得,这个人不是我自己吧。我没那么和缓淡定,我没那么纠结孤独,我没那么文艺小资。但是,看到别人的豆瓣共同的爱好,看对方使用的blog和写作风格,看开心网人人网上的分享,我也忍不住给别人贴上小资文艺博士牛角尖等等的标签。但其实,生活往往非常复杂。我甚至很爱复杂这个词,重复是生活的主调,杂乱是生活的必要。

这种误解除了乱贴标签,还有一个表现就是自以为是。在事情发生之前就揣度了对方的反应,在没有经过商量之前就先下好了决定。或许我们看琼瑶太多,受了浪漫的蛊惑,认为一切都会按照剧本浪漫而又苦情的演下去,最后是一个圆满的大结局;又或许我们看阿加莎太多,总觉得阳光下进行的很多事情很多人其实道貌岸然,而人性往往是可鄙可陋可怖的。

学术上也有这种stereotype,某个小组,某个人的研究;某个机构,某个单位的方向,我们都太快作出评断了,而忘了,评断别的任何东西的时候,也评断了自己的水平。

人生,常常你就在自己不察觉之中审判了一个人一件事情,对方,有些时候连解释的机会都没有。在一个不公平的平台,我们总以为我们玩着最公平的游戏。

四十八分之十四:完成考试

Monday, January 4th, 2010

在2009年12月18号上午,终于顺利通过了comprehensive oral defense,特此铭记。

答辩从9点开始(我接到的通知是9点半,不知道谁把它提前了,我完全不知道,幸好我想着早点去准备好投影什么的),委员会听完20多分钟的presentation后开始第一轮提问,先说点优点,比如writing很清晰,结构明晰,表格和总结做得比较好,等等

第一轮提问来得还是很猛烈,有的问题是非常专业的角度,我从来没考虑过;有些问题是很实用的角度,我大概知道我能做到什么做不到什么,有些问题远远超过了writing部分的内容,就是问问基本功

第一轮下来,自己感觉还行,基本都回答上了,老师们也比较肯定。主席问我是不是要一个break,当然就要了一个出来透透气。team里面的人说应该过了,信心比较大。

第二轮问题比较细,也比较难回答,因为大问题往往可以比较笼统,英文表达也比较容易;而细节问题往往很难用英文描述,也往往在这个时候会被抓住漏洞。

第二轮问题完了已经11点过了,被主席“请”出来等结果,那结果讨论也就10来分钟,对我却十分漫长(具体怎么漫长请参考《李献计历险记》)。最后结果是pass,不过多了一个副导师,当然也就是自己想跟的真正懂行的Dawn Parker,非常严厉的老师啊,呵呵

下午,雷厉地买了去美国的灰狗票,去健身房挥洒了一番,神清气爽的。

最后,要感谢andrew,rainbowrain,darktemplar童鞋帮我做修订
也要感谢媛媛师妹,载舟师兄帮我下的文献
最后的最后,对在gtalk,qq,msn上关心的朋友们说一声谢谢

选图攻略

Tuesday, December 1st, 2009

昨天豆瓣上面突然增加了20多个关注着,几乎是一瞬间的事情,就看到gtalk不断提醒我有新的豆瓣邮件
原因是豆瓣老大阿北老师推荐了一张图,其实图不是我做的,只是觉得好玩
然后阿北还搜了原来的出处,原blog还有法语等翻译版本,等我无聊的翻译之后发现原来已经有中文版本了,管他的我也贴吧。

chart suggestions -- a thoughtstarter

今天交了comprehensive exam的文章之后,发现某课程作业包括一个GANTT chart,是一个工程计划表,对于毕业论文或者大项目写作来说,这是一个很好的管理时间和监视进度的方式,适合计划控人员。


图片来自wikipedia

cliche

Friday, November 6th, 2009

convocation 010

cliche这个词应该源自法语吧,如果热爱美剧的人,肯定常常听到这个单词,查字典的话可以看到音标是[kli:ˈʃei],但是日常发音更接近[kruˈʃei]。换到中文的意思故事会一点就是“老黄历”,书面一点就是“陈腔滥调”,台湾一点就是“老套”。

然后最近上课老碰到讨论什么是过时的问题

在某次seminar上面,讨论到什么是 surprising emergency,然后某人说是不是类似 butterfly effect,然后直接被驳回说,那是上个世纪90年代的东东,,,(((Orc

然后讨论到现在的multidisciplinary的研究,另外一个人说今年某个会议上面,说multidisciplinary是05年的事情,现在都讲counterdisplinary…(((Orz

中心句是人真是见异思迁啊

ABM/MAS in LUCC (2)

Wednesday, September 2nd, 2009

这一部分说平台,我主要考虑的是这8个模型Swarm, RePast, MASON, NetLogo, StarLogo, Ascape, CORMAS。

————–需要推荐的文献包括:—————-

  • Tools of the Trade: A Survey of Various Agent Based Modeling Platforms (2009), Journal of Artificial Societies and Social Simulation vol. 12, no. 2 2
  • 这一篇最齐全,最完整,比较了几乎所有的平台的五个性质(编程语言/操作系统/许可类型/主要应用方向/用户支持),并且杂志是网络版本应该是免费的。

  • Agent-Based Simulation Platforms: Review And Development Recommendations. (2006) Simulation, September 2006. pp609-623.
  • 比较了常见的四个模型,最重要是通过一个Stupid model来对比了各个模型的性能。NetLogo和Swarm表现最好,但是当时时间比较早,之后RePast等有了更好的发展。

  • Toward a Graphical ABM Toolkit with GIS Integration. (2005) The Agent 2005 Conference on Generative Social Processes, Models, and Mechanisms, Chicago, Illinois.
  • 这边应该很重要,在地学模型方面,因为他们着重比较了三个平台在GIS方面的图像表达能力的差别,包括空间文件的导入以及输出。因为时空行为的模拟一直是GIS发展的重要方向,也是各大GIS商业软件的开发重点之一。

  • Principles and Concepts of Agent-Based Modelling for Developing Geospatial Simulations. (2006) Working paper 110, Centre for Advanced Spatial Analysis, University College London, September 2006.
  • 这可是UCL的文章,地学计算模拟的翘楚,当年也还申请了的,后面想想伦敦的高物价还是不了了之。此CASA中心在CA/ABM和分形上进步神速,有很强的计算机和数学背景,文章比较了七种平台,特别是他们在geospatial上的能力。

  • Platforms and methods for agent-based modeling. (2002). PNAS 99: 7197-7198.
  • 这个不用说了,PNAS上的牛文也不应该错过

———-这七个平台有分别的介绍如下——————

Swarm最早由Santa Fe Institute开发,是基于Objective-C和Java语言的,可以说是鼻祖系列的开发平台,最早开发是用来模拟生态过程的,在生态系统模拟方面很出名,国内有UrbanSwarm模型是关于城市扩展的。

继承Swarm的最出名的是Repast,全称是The Recursive Porous Agent Simulation Toolkit (Repast)。RePast相对而言是最完整的平台,最初由java写成,功能非常强大齐全,最重要是其对地理数据的处理能力比较强。之后,出现由python写得易用的RePastPy以及Mirrosoft.Net写出的RePast.Net,现在整合成了RePastS(Simphony),可以通过Agent Analysis插件与ArcGIS整合。

MASON的全称是Multi-Agent Simulator Of Neighborhoods/Networks,它由Center for Social Complexity, George Mason University在2003年开发,同样是继承了Swarm和RePast的特性。它的特点是是轻巧快捷并且计算能力强。

————另一个系列就是Logo语言系列的成员————-

这包括NetLogoStarLogo,其最主要的目的是教学和科研目的(pedagogical and research tool)它们分别由Northwestern University, Evanston 的 Center for Connected Learning and Computer-based Modeling 和Massachusetts Institute of Technology 的 Media Laboratory开发。作为教学目的的平台,最明显的是易用性和易学性,其开发语言不开源,基于Java和C,但是语法非常简单,GUI也非常直观易用,利用其网上教程,很快能学会其语言并搭建模型。

可以看到StarLogo的页面里面有一只乌龟,那是由于模型中的agent常常被称作turtle;而NetLogo网站有很多demo模型,其中有个Urban Suite,看了之后有很大启发性;另外SLUCE(Spatial Land Use Change and Ecological Effects at the Rural-Urban Interface)模型也用到了NetLogo开发一个关于Urban Sprawl的模型,一步一步教你搭建,很有用。

————–这一部分的平台其实没有GIS功能—————

Ascape 是由华盛顿的 Brooklings Institute 开发,同样基于Java,也是从Swarm继承而来。

CORMAS 是由法国的 French Agricultural Research Centre for International Development 开发,主要用在自然资源领域。亮点是由SmallTalk语言编写的, 同样是一个简单易学的语言。

————-表格的分割线—————-

PS.为了此表格还专门找了一个插件,叫WP-Table Reloaded

这个表格横向对比了各个平台的基本性能和能力。

SWARM RePast MASON StarLogo NetLogo Ascape CORMAS
Time Early 1990s Early 1999 2003 Early 1990 1999 1997 1996
Language Objective C
Java
Java
Python
Microsoft.Net
Java Proprietary Proprietary Java SmallTalk
Operation
System
Unix/Linux
Mac OSX
Windows
Unix/Linux
Mac OSX
Windows
Unix/Linux
Mac OSX
Windows
Unix/Linux
Mac OSX
Windows
Unix/Linux
Mac OSX
Windows
Unix/Linux
Mac OSX
Windows
Unix/Linux
Mac OSX
Windows
Experience
Requirement
Strong skills
Strong Strong Basic Basic Basic Basic
Event
Driven
yes yes N/A N/A N/A no no
GIS
connection
yes
Kenge
GIS library
yes
(include
ArcGIS)
No No yes
(ESRI
file)
Beta yes (Mapinfo)
Spreadsheet
connection
yes yes No yes N/A
yes yes
Statistics
capacity
statistics
package
Some
statistics
functions
Strong yes yes many
functions
can
store
data
Main
application
Natural
social science
military
commercial
Nearly
all
aspects
Economic
Epidemic
Biology
graphics
maths
physics
social systems
games
Education
academic
Social
and
economic
systems
Economy
ecology
natural
resource
management
Demo
model
A few Many many yes yes 20-30 numerous
Documentation yes yes yes yes yes yes yes
Tutorial yes yes yes yes yes yes yes
Training no no no workshop
class
workshop
class
various
courses
no

ABM/MAS in LUCC (1)

Friday, August 21st, 2009

agent -based model (ABM)/ muti-agent system (MAS)随着计算机模拟能力的提升开始在各个领域中应用,上一周的Nature都有其用在传染病和经济上的文章(与时下的N1H1和recession有很大关系,属于热点问题),我关心的是它在土地利用变化(Land use/cover change LUCC)方面的应用,因为应该是论文的核心内容。之前读过英文文献,整理了一下进展,这次回国的时候找了一些中文的,在此简单整理一下。

简单来说,ABM/MAS代表计算机模拟能力的提高,因为LUCC问题涉及两个最简单的问题,土地利用变化的数量和土地利用变化的位置。最早的模拟,是基于方程的(系统动力学算其中常用的),简单的来说就是假设土地变化的数量是应变量,驱动力是自变量,寻找之间的方程关系。也就是所谓的自上而下。

当然这种方式有很多问题,包括哪里社会经济统计数据应该最为自变量(人口?第一生产力?or etc?);该选用什么方程;得出的方程只是经验上的可靠性;等等等等,而最致命的是光有数量不行还要有空间位置啊,所以就有自下而上;

自下而上的代表就是元胞自动机(Cellular Automata)。最早出现在生存游戏,它可以说是基于规则的变化。每一个元胞有其固定的位置,而其属性的变化受领域属性和变化规则影响。这样就同时解决了位置和数量的问题。而其中最重要的是变化规则,大多用logistic回归/B-P神经网络/支撑向量机(Support Vector Machine SVM)/蚁群算法等来决定转换规则的系数。

但是,上面的方法忽略了LUCC变化中人的主观能动性。也就是说模型需要很多历史数据并且可能只能只在一个区域适用,并且没有考虑真正的人地互动关系。所以开始有人利用agent模拟土地变化中人的作用。其实CA可以说是介于方程式和ABM之间的桥梁,因为其每个元胞类似一个agent只是不能活动;而其变化又是基于方程。

————–案例的分割线———————

国内做Agent的LUCC模拟最长历史的小组应该是黎夏的小组,选的地点在深圳和广州海珠区,从我能找到1999年发表第一篇有agent思想的文章到现在十年间在《遥感学报》《地理学报》《中国科学D辑》(未包括外文)发表了好几篇文章,而每一篇文章都更进一步的完善了其模型(初期有一部分是基于CA的在此不涉及)。

而其中主要有两个问题受到他们关注,其一是LUCC变化与规划,基本框架在1999年《遥感学报》文章[1]中有。主要考虑农地转化成城市用地。其中人口决定了用地的需求,利用一个用在资源研究上的时间模型(Tietenbery Model)决定变化的时间;同时计算地块的农业和城市适宜性,平衡两者间的冲突进行选址。得出结果后验证并设计情景进行模拟,为规划提供指导。

经过在CA上面的试验之后,2006年发表了基于MAS(多智能体)的更进一步的文章。首先,在《地理学报》中[2],考虑了两种智能体(agent),其一是居民,其二是政府;居民考虑的是个人效益最大化,也就是使得环境/通勤/生活便利性/等等达到最大化;而政府职能在于决定地块开发为城市用地与否,居民和政府之间依靠对投标的概率模拟来进行。从而一个地块受到居民偏好/政府接受度/基于logistic的CA共同作用,生成变化的概率乘积。

之后,同年在《中国科学D辑》[3],加入了地产商这个新的智能体,也就是土地开发不只是投标概率还涉及到地产商开发的概率的影响,使得土地开发的流程更符合逻辑。

在2008年的《地理学报》[4]中,智能体做了一点变动,选了政府、居民和农民三类。政府仍然是基于最大空间效率决定发展概率,通过Brown和Moore的模型模拟居民的搬家行为,而农民行为由logistic回归得到。政府和居民/农民之间的互动同样依靠投标模拟。

除了对智能体的选择和其行为的设定外,另一个采用的很好的方法就是验证,除了最基本的点对点的验证,还对景观指数(比如紧凑度,Moran‘s I)和一些指数(农业适用性)进行了对比,所以使得最后在设计情景和验证情景效果上可靠了很多。

在这个组之外,中南大学的一篇硕士论文也采用了类似计算概率的方法对深圳进行了研究[5]

————另一个系列的分割线—————–

这个小组另外一个系列的文章是关于空间地理分异的智能体研究,也就是源自Schelling的隔离(Segregation)模型(在中国做民族隔离模型可能很敏感吧)。包括2007年地理学报[6],计算机仿真[7]和2009年[8]两篇文章。

最初出发点是Beneson的一个居住/搬迁的模型,也就是居民考虑经济和环境压力决定是否搬迁来决定城市空间分异的模型,初步的效果是验证了不同属性的居民(不同收入/教育/年龄/等等水平)在空间分布上有一定的规律。这也是智能体能验证地理学的一些原理的实例(国外有用其验证地理学的杜能环的实例,文章作者也做了类似的模拟[7])。在两年后,居于“宜居城市”和“宜居度”计算方法在广州海珠区进行了实地模拟。在验证的时候,通过插值得到的房价进行了对比,并分区分析了差异原因。

————另一个clique的分割线—————

除了以上这些之外,还有一个就是基于Swarm-java这个agent模拟平台(Platform)做的UrbanSwarm模型的应用,模型应该是基于北大的薛领的博士论文。2003年文章[9]选择的agent是家庭/企业/政府三类,家庭考虑的是Lashmanan-Hansen的购物模型,其迁移考虑Brown/Moore模型,企业考虑利润雇佣和搬迁;政府只要是税收作用;最后除了简单的验证和景观指数验证外,还评价了不同情境的通勤/房租/环境等的影响。2004年的文章[10]对北京进行了模拟,系数通过B-P人工神经网络实现。但是由于我没有搞到薛领的博士论文和UrbanSwarm模型,文章介绍的内容还是比较抽象。

———–人文地理学也可以用智能体的分割线—————–

除了以上的LUCC研究,让我感兴趣的还有智能体在商业街行为者的研究[11]和历史上人口演变的研究[12]两篇文章。虽然说人口流动的模拟越来越多的采用智能体方法,但难能可贵的就是,利用多智能体,能将行为地理学和历史地理学的东西,通过类似动画/模型的方式表现出来,这对于以前大多通过描述和简单的统计的人文地理来说,确实是一大进步,很值得一读的文章(我会被看成quantitative human geography clique吗?好像qualitative都不明白就倾向于quantity了)。

————-无可救药的文献分割线——————

1. 基于遥感与GIS的辅助规划模型:以珠江三角洲可持续土地开发为例 遥感学报 1999 3(3);
2. 基于多智能体的土地利用模拟与规划模型 地理学报 2006 61(10)
3. 基于多智能体系统的空间决策行为及土地利用格局演变模拟 中国科学D辑 2006 36(11)
4. 多智能体城市土地扩张模型及其应用 地理学报 2008 63(8)
5. 基于多智能体与元胞自动机的城市生态用地演变研究 硕士毕业论文 中南大学 黄秀兰
6. 基于多智能体的土地空间分异现象模拟——以城市居住空间演变为例 地理学报 2007 62(6)
7. 基于多智能体的杜能模型仿真研究 计算机仿真 2007 24(11)
8. 基于多智能体居民空间格局演变的真实场景模拟 地理学报 2009 84(6)
9. 城市演化多主体(multi-agent)模拟研究 系统工程理论与实践 2003 (12)
10. 基于agent模型的北京市土地利用变化动态模拟进展 东华理工学院学报 2004 27(1)
11. 多代理人系统在商业街消费者行为模拟中的应用 地理学报 2009 64(4)
12. 2000年来中国人口地理演变的agent模拟分析 地理学报 2008 63(2)