Archive for the 'Academic | 学海无涯' Category

四十八分之十四:完成考试

Monday, January 4th, 2010

在2009年12月18号上午,终于顺利通过了comprehensive oral defense,特此铭记。

答辩从9点开始(我接到的通知是9点半,不知道谁把它提前了,我完全不知道,幸好我想着早点去准备好投影什么的),委员会听完20多分钟的presentation后开始第一轮提问,先说点优点,比如writing很清晰,结构明晰,表格和总结做得比较好,等等

第一轮提问来得还是很猛烈,有的问题是非常专业的角度,我从来没考虑过;有些问题是很实用的角度,我大概知道我能做到什么做不到什么,有些问题远远超过了writing部分的内容,就是问问基本功

第一轮下来,自己感觉还行,基本都回答上了,老师们也比较肯定。主席问我是不是要一个break,当然就要了一个出来透透气。team里面的人说应该过了,信心比较大。

第二轮问题比较细,也比较难回答,因为大问题往往可以比较笼统,英文表达也比较容易;而细节问题往往很难用英文描述,也往往在这个时候会被抓住漏洞。

第二轮问题完了已经11点过了,被主席“请”出来等结果,那结果讨论也就10来分钟,对我却十分漫长(具体怎么漫长请参考《李献计历险记》)。最后结果是pass,不过多了一个副导师,当然也就是自己想跟的真正懂行的Dawn Parker,非常严厉的老师啊,呵呵

下午,雷厉地买了去美国的灰狗票,去健身房挥洒了一番,神清气爽的。

最后,要感谢andrew,rainbowrain,darktemplar童鞋帮我做修订
也要感谢媛媛师妹,载舟师兄帮我下的文献
最后的最后,对在gtalk,qq,msn上关心的朋友们说一声谢谢

选图攻略

Tuesday, December 1st, 2009

昨天豆瓣上面突然增加了20多个关注着,几乎是一瞬间的事情,就看到gtalk不断提醒我有新的豆瓣邮件
原因是豆瓣老大阿北老师推荐了一张图,其实图不是我做的,只是觉得好玩
然后阿北还搜了原来的出处,原blog还有法语等翻译版本,等我无聊的翻译之后发现原来已经有中文版本了,管他的我也贴吧。

chart suggestions -- a thoughtstarter

今天交了comprehensive exam的文章之后,发现某课程作业包括一个GANTT chart,是一个工程计划表,对于毕业论文或者大项目写作来说,这是一个很好的管理时间和监视进度的方式,适合计划控人员。


图片来自wikipedia

cliche

Friday, November 6th, 2009

convocation 010

cliche这个词应该源自法语吧,如果热爱美剧的人,肯定常常听到这个单词,查字典的话可以看到音标是[kli:ˈʃei],但是日常发音更接近[kruˈʃei]。换到中文的意思故事会一点就是“老黄历”,书面一点就是“陈腔滥调”,台湾一点就是“老套”。

然后最近上课老碰到讨论什么是过时的问题

在某次seminar上面,讨论到什么是 surprising emergency,然后某人说是不是类似 butterfly effect,然后直接被驳回说,那是上个世纪90年代的东东,,,(((Orc

然后讨论到现在的multidisciplinary的研究,另外一个人说今年某个会议上面,说multidisciplinary是05年的事情,现在都讲counterdisplinary…(((Orz

中心句是人真是见异思迁啊

ABM/MAS in LUCC (2)

Wednesday, September 2nd, 2009

这一部分说平台,我主要考虑的是这8个模型Swarm, RePast, MASON, NetLogo, StarLogo, Ascape, CORMAS。

————–需要推荐的文献包括:—————-

  • Tools of the Trade: A Survey of Various Agent Based Modeling Platforms (2009), Journal of Artificial Societies and Social Simulation vol. 12, no. 2 2
  • 这一篇最齐全,最完整,比较了几乎所有的平台的五个性质(编程语言/操作系统/许可类型/主要应用方向/用户支持),并且杂志是网络版本应该是免费的。

  • Agent-Based Simulation Platforms: Review And Development Recommendations. (2006) Simulation, September 2006. pp609-623.
  • 比较了常见的四个模型,最重要是通过一个Stupid model来对比了各个模型的性能。NetLogo和Swarm表现最好,但是当时时间比较早,之后RePast等有了更好的发展。

  • Toward a Graphical ABM Toolkit with GIS Integration. (2005) The Agent 2005 Conference on Generative Social Processes, Models, and Mechanisms, Chicago, Illinois.
  • 这边应该很重要,在地学模型方面,因为他们着重比较了三个平台在GIS方面的图像表达能力的差别,包括空间文件的导入以及输出。因为时空行为的模拟一直是GIS发展的重要方向,也是各大GIS商业软件的开发重点之一。

  • Principles and Concepts of Agent-Based Modelling for Developing Geospatial Simulations. (2006) Working paper 110, Centre for Advanced Spatial Analysis, University College London, September 2006.
  • 这可是UCL的文章,地学计算模拟的翘楚,当年也还申请了的,后面想想伦敦的高物价还是不了了之。此CASA中心在CA/ABM和分形上进步神速,有很强的计算机和数学背景,文章比较了七种平台,特别是他们在geospatial上的能力。

  • Platforms and methods for agent-based modeling. (2002). PNAS 99: 7197-7198.
  • 这个不用说了,PNAS上的牛文也不应该错过

———-这七个平台有分别的介绍如下——————

Swarm最早由Santa Fe Institute开发,是基于Objective-C和Java语言的,可以说是鼻祖系列的开发平台,最早开发是用来模拟生态过程的,在生态系统模拟方面很出名,国内有UrbanSwarm模型是关于城市扩展的。

继承Swarm的最出名的是Repast,全称是The Recursive Porous Agent Simulation Toolkit (Repast)。RePast相对而言是最完整的平台,最初由java写成,功能非常强大齐全,最重要是其对地理数据的处理能力比较强。之后,出现由python写得易用的RePastPy以及Mirrosoft.Net写出的RePast.Net,现在整合成了RePastS(Simphony),可以通过Agent Analysis插件与ArcGIS整合。

MASON的全称是Multi-Agent Simulator Of Neighborhoods/Networks,它由Center for Social Complexity, George Mason University在2003年开发,同样是继承了Swarm和RePast的特性。它的特点是是轻巧快捷并且计算能力强。

————另一个系列就是Logo语言系列的成员————-

这包括NetLogoStarLogo,其最主要的目的是教学和科研目的(pedagogical and research tool)它们分别由Northwestern University, Evanston 的 Center for Connected Learning and Computer-based Modeling 和Massachusetts Institute of Technology 的 Media Laboratory开发。作为教学目的的平台,最明显的是易用性和易学性,其开发语言不开源,基于Java和C,但是语法非常简单,GUI也非常直观易用,利用其网上教程,很快能学会其语言并搭建模型。

可以看到StarLogo的页面里面有一只乌龟,那是由于模型中的agent常常被称作turtle;而NetLogo网站有很多demo模型,其中有个Urban Suite,看了之后有很大启发性;另外SLUCE(Spatial Land Use Change and Ecological Effects at the Rural-Urban Interface)模型也用到了NetLogo开发一个关于Urban Sprawl的模型,一步一步教你搭建,很有用。

————–这一部分的平台其实没有GIS功能—————

Ascape 是由华盛顿的 Brooklings Institute 开发,同样基于Java,也是从Swarm继承而来。

CORMAS 是由法国的 French Agricultural Research Centre for International Development 开发,主要用在自然资源领域。亮点是由SmallTalk语言编写的, 同样是一个简单易学的语言。

————-表格的分割线—————-

PS.为了此表格还专门找了一个插件,叫WP-Table Reloaded

这个表格横向对比了各个平台的基本性能和能力。

SWARM RePast MASON StarLogo NetLogo Ascape CORMAS
Time Early 1990s Early 1999 2003 Early 1990 1999 1997 1996
Language Objective C
Java
Java
Python
Microsoft.Net
Java Proprietary Proprietary Java SmallTalk
Operation
System
Unix/Linux
Mac OSX
Windows
Unix/Linux
Mac OSX
Windows
Unix/Linux
Mac OSX
Windows
Unix/Linux
Mac OSX
Windows
Unix/Linux
Mac OSX
Windows
Unix/Linux
Mac OSX
Windows
Unix/Linux
Mac OSX
Windows
Experience
Requirement
Strong skills
Strong Strong Basic Basic Basic Basic
Event
Driven
yes yes N/A N/A N/A no no
GIS
connection
yes
Kenge
GIS library
yes
(include
ArcGIS)
No No yes
(ESRI
file)
Beta yes (Mapinfo)
Spreadsheet
connection
yes yes No yes N/A
yes yes
Statistics
capacity
statistics
package
Some
statistics
functions
Strong yes yes many
functions
can
store
data
Main
application
Natural
social science
military
commercial
Nearly
all
aspects
Economic
Epidemic
Biology
graphics
maths
physics
social systems
games
Education
academic
Social
and
economic
systems
Economy
ecology
natural
resource
management
Demo
model
A few Many many yes yes 20-30 numerous
Documentation yes yes yes yes yes yes yes
Tutorial yes yes yes yes yes yes yes
Training no no no workshop
class
workshop
class
various
courses
no

ABM/MAS in LUCC (1)

Friday, August 21st, 2009

agent -based model (ABM)/ muti-agent system (MAS)随着计算机模拟能力的提升开始在各个领域中应用,上一周的Nature都有其用在传染病和经济上的文章(与时下的N1H1和recession有很大关系,属于热点问题),我关心的是它在土地利用变化(Land use/cover change LUCC)方面的应用,因为应该是论文的核心内容。之前读过英文文献,整理了一下进展,这次回国的时候找了一些中文的,在此简单整理一下。

简单来说,ABM/MAS代表计算机模拟能力的提高,因为LUCC问题涉及两个最简单的问题,土地利用变化的数量和土地利用变化的位置。最早的模拟,是基于方程的(系统动力学算其中常用的),简单的来说就是假设土地变化的数量是应变量,驱动力是自变量,寻找之间的方程关系。也就是所谓的自上而下。

当然这种方式有很多问题,包括哪里社会经济统计数据应该最为自变量(人口?第一生产力?or etc?);该选用什么方程;得出的方程只是经验上的可靠性;等等等等,而最致命的是光有数量不行还要有空间位置啊,所以就有自下而上;

自下而上的代表就是元胞自动机(Cellular Automata)。最早出现在生存游戏,它可以说是基于规则的变化。每一个元胞有其固定的位置,而其属性的变化受领域属性和变化规则影响。这样就同时解决了位置和数量的问题。而其中最重要的是变化规则,大多用logistic回归/B-P神经网络/支撑向量机(Support Vector Machine SVM)/蚁群算法等来决定转换规则的系数。

但是,上面的方法忽略了LUCC变化中人的主观能动性。也就是说模型需要很多历史数据并且可能只能只在一个区域适用,并且没有考虑真正的人地互动关系。所以开始有人利用agent模拟土地变化中人的作用。其实CA可以说是介于方程式和ABM之间的桥梁,因为其每个元胞类似一个agent只是不能活动;而其变化又是基于方程。

————–案例的分割线———————

国内做Agent的LUCC模拟最长历史的小组应该是黎夏的小组,选的地点在深圳和广州海珠区,从我能找到1999年发表第一篇有agent思想的文章到现在十年间在《遥感学报》《地理学报》《中国科学D辑》(未包括外文)发表了好几篇文章,而每一篇文章都更进一步的完善了其模型(初期有一部分是基于CA的在此不涉及)。

而其中主要有两个问题受到他们关注,其一是LUCC变化与规划,基本框架在1999年《遥感学报》文章[1]中有。主要考虑农地转化成城市用地。其中人口决定了用地的需求,利用一个用在资源研究上的时间模型(Tietenbery Model)决定变化的时间;同时计算地块的农业和城市适宜性,平衡两者间的冲突进行选址。得出结果后验证并设计情景进行模拟,为规划提供指导。

经过在CA上面的试验之后,2006年发表了基于MAS(多智能体)的更进一步的文章。首先,在《地理学报》中[2],考虑了两种智能体(agent),其一是居民,其二是政府;居民考虑的是个人效益最大化,也就是使得环境/通勤/生活便利性/等等达到最大化;而政府职能在于决定地块开发为城市用地与否,居民和政府之间依靠对投标的概率模拟来进行。从而一个地块受到居民偏好/政府接受度/基于logistic的CA共同作用,生成变化的概率乘积。

之后,同年在《中国科学D辑》[3],加入了地产商这个新的智能体,也就是土地开发不只是投标概率还涉及到地产商开发的概率的影响,使得土地开发的流程更符合逻辑。

在2008年的《地理学报》[4]中,智能体做了一点变动,选了政府、居民和农民三类。政府仍然是基于最大空间效率决定发展概率,通过Brown和Moore的模型模拟居民的搬家行为,而农民行为由logistic回归得到。政府和居民/农民之间的互动同样依靠投标模拟。

除了对智能体的选择和其行为的设定外,另一个采用的很好的方法就是验证,除了最基本的点对点的验证,还对景观指数(比如紧凑度,Moran‘s I)和一些指数(农业适用性)进行了对比,所以使得最后在设计情景和验证情景效果上可靠了很多。

在这个组之外,中南大学的一篇硕士论文也采用了类似计算概率的方法对深圳进行了研究[5]

————另一个系列的分割线—————–

这个小组另外一个系列的文章是关于空间地理分异的智能体研究,也就是源自Schelling的隔离(Segregation)模型(在中国做民族隔离模型可能很敏感吧)。包括2007年地理学报[6],计算机仿真[7]和2009年[8]两篇文章。

最初出发点是Beneson的一个居住/搬迁的模型,也就是居民考虑经济和环境压力决定是否搬迁来决定城市空间分异的模型,初步的效果是验证了不同属性的居民(不同收入/教育/年龄/等等水平)在空间分布上有一定的规律。这也是智能体能验证地理学的一些原理的实例(国外有用其验证地理学的杜能环的实例,文章作者也做了类似的模拟[7])。在两年后,居于“宜居城市”和“宜居度”计算方法在广州海珠区进行了实地模拟。在验证的时候,通过插值得到的房价进行了对比,并分区分析了差异原因。

————另一个clique的分割线—————

除了以上这些之外,还有一个就是基于Swarm-java这个agent模拟平台(Platform)做的UrbanSwarm模型的应用,模型应该是基于北大的薛领的博士论文。2003年文章[9]选择的agent是家庭/企业/政府三类,家庭考虑的是Lashmanan-Hansen的购物模型,其迁移考虑Brown/Moore模型,企业考虑利润雇佣和搬迁;政府只要是税收作用;最后除了简单的验证和景观指数验证外,还评价了不同情境的通勤/房租/环境等的影响。2004年的文章[10]对北京进行了模拟,系数通过B-P人工神经网络实现。但是由于我没有搞到薛领的博士论文和UrbanSwarm模型,文章介绍的内容还是比较抽象。

———–人文地理学也可以用智能体的分割线—————–

除了以上的LUCC研究,让我感兴趣的还有智能体在商业街行为者的研究[11]和历史上人口演变的研究[12]两篇文章。虽然说人口流动的模拟越来越多的采用智能体方法,但难能可贵的就是,利用多智能体,能将行为地理学和历史地理学的东西,通过类似动画/模型的方式表现出来,这对于以前大多通过描述和简单的统计的人文地理来说,确实是一大进步,很值得一读的文章(我会被看成quantitative human geography clique吗?好像qualitative都不明白就倾向于quantity了)。

————-无可救药的文献分割线——————

1. 基于遥感与GIS的辅助规划模型:以珠江三角洲可持续土地开发为例 遥感学报 1999 3(3);
2. 基于多智能体的土地利用模拟与规划模型 地理学报 2006 61(10)
3. 基于多智能体系统的空间决策行为及土地利用格局演变模拟 中国科学D辑 2006 36(11)
4. 多智能体城市土地扩张模型及其应用 地理学报 2008 63(8)
5. 基于多智能体与元胞自动机的城市生态用地演变研究 硕士毕业论文 中南大学 黄秀兰
6. 基于多智能体的土地空间分异现象模拟——以城市居住空间演变为例 地理学报 2007 62(6)
7. 基于多智能体的杜能模型仿真研究 计算机仿真 2007 24(11)
8. 基于多智能体居民空间格局演变的真实场景模拟 地理学报 2009 84(6)
9. 城市演化多主体(multi-agent)模拟研究 系统工程理论与实践 2003 (12)
10. 基于agent模型的北京市土地利用变化动态模拟进展 东华理工学院学报 2004 27(1)
11. 多代理人系统在商业街消费者行为模拟中的应用 地理学报 2009 64(4)
12. 2000年来中国人口地理演变的agent模拟分析 地理学报 2008 63(2)

就那么一段

Thursday, August 6th, 2009

为什么我们会喜欢一本书一部电影一首音乐,无非能从其中感受到情绪,大多时候是一种情绪的共鸣,更能激起我们的爱。这伯牙叔齐的默契可遇不可求,就像外国人看到Strange horse这个iPhone app会觉得无可理喻一样。换到流行一点的话,就是相互磁场比较和,气场不排斥。

阅读也是这样,看着满篇文字,遇到喜欢的总忍不住圈圈点点,过了很久还能记住其中那么一句或一个笑点。

下面是Davis的一篇文章(The progress of geography in the United States (1924))。说到近代地理学家,很多都是别的学科转到地理来的,所以有一点鸠占鹊巢的意思,但是地理学家们,又是多么骄傲于自己学科和自己伴随它的进步。

We have at least advanced from a stage when geography was anyone’s and everyone’s business to a stage when it is also the business of geographers. We have advanced from a day when geographical knowledge was gathered in an almost unconscious, accidental manner by untrained travelers, to a day when it is consciously and intentionally gathered by trained experts, and when its different aspects and the variations appropriate ways of treating them are coming to receive deliberate attention. We have advanced from an era when there was no opportunity for the collegiate study of geography or fro the training of professional geographers, to an era when many of our colleges and universities are offering such opportunity, and in increasing measure from year to year. We have advanced from a time when geography was only a subject for elementary study, to a time when it has grown so greatly. That it may well engage a man’s best effort for this whole life. If the progress thus far made is not continued, our geographers will have only themselves to blame.

No geographer, therefore, need feel himself unfortunate because of the great diversity of the fact that his composite object require him to study; for in the progress of his work he may discover relation and principles which binds his face together in a thoroughly reasonable manner, and he may then concern himself, especially in his teaching, largely with those relations and principles, and introduce items of fact chiefly to illustrate the principles. Let no young geographer, therefore, be disheartened when he discovers the multiple nature of his subject or the impossibility of mastering all its content. Let him first secure a good understanding of the fundamental components of geography, and then select some special component to study systematically in its occurrence all over the world, and some special area of the world in which to study all the components in their regional associations.

同时,地理又是一个多交叉的学科(darktemplar同学还说我们以后一定要在城市生态气候这些学科做一点interdiscipline的课题)。以前,做模型的时候,用系统动力学,知道那是从数学/物理/管理(或者说系统科学)借来的nonlinear system dynamic;现在做基于行为者的模型,又是从数学/计算机/社会学心理学(或者说复杂科学)借来的comlexity adaptive system。虽然地理学史上很少提到达尔文,但是达尔文也被广义上认为是一个地理学家,他的进化论研究以及达尔文主义也默默影响着地理学的思想。看了这一篇(Darwin impacts on geography)才知道,原来Davis的侵蚀循环也跟达尔文主义息息相关。

Four themes in Darwin’s writings are significant in the development of geographical thought. 1) The idea of development through time strongly influenced the progress of geomorphology, pedology, ecology, and to some extent the social sciences; 2) Darwin’s stress on the intimate relationships between organic life and habitat gave impetus to organismic interpretations of regions and states, which persisted in geography long after the decline of biological Vitalism; 3) the themes of selection and struggle were deterministically applied in both human and political geography; 4) a fourth theme in Darwin’s writings, the random nature of original variations, was ignored by geographers until recently, partly because of Darwin’s own equivocal position on this issue. Finally, Darwin’s work so changed the nineteenth century world view that the development of geography as a science itself became possible.

看霍金这本书(时间简史),完全是因为Star Trek和The Big Bang Theory,最有共鸣的地方不在于相对论和量子力学,而在于那一种能把问题简单化的表述和不停追求目标又有清醒的执着。

Because the partial theories that we already have are sufficient to make accurate predictions in all but the most extreme situation, the search for the ultimate theory of the universe seems difficult to justify on practical grounds. (It is worthy nothing. Though, that similar arguments could have been used against both relative and quantum mechanics, and these theories have given us both unclear energy and the microeletronics revolution!) The discovery of a complete unified theory, therefore, may not aid the survival of our species. It may not even affect out life-style. But ever since the dawn of civilization, people have not been content to see events as unconnected and inexplicable. They have craved an understanding of the underlying order in the world. Today we will yearn to know why we are here and where we came from. Humanity’s deepest desire for knowledge is justification enough for our continuing request. And our good is nothing less than a complete description of the universe we live in.

当我谷歌了之后才知道原来赵薇也拍了《京华烟云》的电视剧。第一次看中国人写的晚清的小说,并且用英文写的。看到八股、顶戴、姨妈、阴阳、中医、中式礼仪这些用英文表述起来那么自然不突兀,不得不佩服林语堂先生。(Moment in Peking Lin Yutang)只是每天两章三十多页的阅读速度还需要提高。我很爱林语堂先生的这段序。

This novel is neither an apology for contemporary Chinese life nor an expose of it, as so many recent Chinese “dark curtain” novels purport to be. It is neither a glorification of the old way of life nor a defense of the new. It’s merely a story of how men and women in the contemporary era grow up and learn to live with one another, how they love and hate and quarrel and forgive and suffer and enjoy, how certain habits of living and ways of thinking are formed, and how, above all, they adjust themselves to the circumstances in this earthly life where men strive but the gods rule.

至于费曼先生这本书(The Feynman lectures on Physics)的序也有那么一段很有共鸣。如果当年我们学编程用的是head first的教程,如果是一个小班级,如果是一个会individual relationship的老师,可能不会让那么多人对编程恐惧。在大学里面,遇到好的研究者不难,遇到好老师却很难。

“The power of instruction is seldom of much efficacy except in those happy dispositions where it is almost superfluous” (Gibboons)
I think, however, that there isn’t any solution to this problem of education other than to realize that the best teaching can be done only when there is a direct individual relationship between a student and a good teacher — a situation in which the student discusses the ideas, thinks about the things, and talks about things. It’s impossible to learn very much by simply sitting in a lecture, or even by simply doing problems that are assigned. But in our modern times we have so many students to teach that we have to try to find some substitute for the ideal (Problems give a good opportunity to fill out the material of the lecture and make more realistic, more complete, and more settled in the mind the ideas that have been exposed.)

在电子交流的时代,也许我在电脑的这一头蹙眉焦虑,但是对方收到的情绪可能完全不是那么一回事,而我们又太害羞说出自己心里的想法而漫长地等着对方能会心的“戳破”了吧。