许 骏,柳泉波,史美林著,协作社群形成与演化机制:理论与算法,北京:科学出版社,2005年3月, ISBN 7-03-015237-9
一、内容简介
协作社群形成与演化机制是社会网络和协同计算研究的新课题。本书尝试从可计算角度研究协作问题,引入统计学习理论、支持向量机与核函数方法,提出相似关系可计算判定和度量的理论与算法,讨论协同式研究Agent系统结构与关键技术,通过仿真实验分析验证算法的有效性。全书既强调数学理论基础与形式化方法,又突出实际问题背景。
二、《协作社群形成与演化机制:理论与算法》序言
计算机支持的协同工作(Computer Supported Cooperative Work,CSCW)是一个多学科交叉的研究领域。自1984年首次提出CSCW的概念以来,该领域的研究一直是国内外学者关注的热点并取得了很多重要成果。CSCW理论与技术己经融入到各个相关学科,进入到不同的应用领域,对人类的工作、学习和生活方式产生了重大影响。当前蓬勃发展的网格计算与下一代互联网技术,必将为CSCW研究与应用带来新的发展空间。
现有的CSCW研究大多针对实体型社群,这类社群对应于现实生活中的实际社会关系,具有稳定的组织结构、明确的角色分配以及模式化的活动流程。基于实体型社群的协作研究主要关注如何为群组成员提供信息交流工具和资源共享平台,工作流技术受到重视。随着计算机网络技术的发展和广泛应用,人们开始关注另一类协作社群---兴趣型社群,认为它更能体现协作过程的社会性与参与性。由于兴趣关系往往是隐含的,并且随着时间的推移会发生变化,因此,社群的形成与演化就成为不容回避的问题。目前,国内外同类研究虽然注意到兴趣关系在协作中的重要性,开始关注兴趣型社群研究并在兴趣型社群的结构与协作效果研究方面取得了一些进展,但这些研究大多停留在定性分析阶段,还不能为相似关系的判定和可计算度量提供理论与算法,缺乏对兴趣关系演化机制的量化研究。本书作者尝试以统计学习理论为基础,将支持向量机与核函数方法引入协作研究,从理论与算法两方面探讨了以相似关系为基础的协作社群形成与演化机制。本书至少有两点值得肯定:
第一,提出了CSCW研究的一个新课题—协作社群的形成与演化机制,这是CSCW研究领域日益凸现且不可回避的问题,本书介绍了作者在该课题研究取得的阶段性成果,其价值在于把协作研究从目前主要关注实体型社群拓展到兴趣型社群,从而扩大CSCW研究与应用的范围,这对网络环境下的协同工作研究尤为重要。
第二,突破国内外同类研究大多停留在定性分析的局限,初步建构了相似关系可计算判定和度量的理论与算法。该问题的解决过程是综合应用统计学习理论、支持向量机与核函数方法的一个成功范例,既强调了数学理论基础与形式化方法,又突出了实际问题的应用背景。作者根据研究课题自身的特点,将理论与算法研究涵盖的对偶表示、特征空间、优化理论、统计学习模型与算法等纳入到自定义的统一框架中,使读者能够对方法的“源头”与“流向”有明确的了解,对理论价值与应用前景有直接的认识,从而能让感兴趣的读者较快进入到该研究领域。从这个意义上说,本书尤其适合相关专业的研究生阅读。
正如作者在前言中指出,从事这一新课题研究的时间较短,所做的工作还只是初步的,书中一些观点和见解也许还存在不成熟甚至不当之处,因此,本书具有明显的探索性和试验性。作者在一个新的研究领域进行开拓性探索,这种努力是可贵和值得鼓励的。
最后,我对该书的出版表示祝贺!
中国人工智能学会理事长、北京邮电大学学术委员会主任 钟义信教授
2005年1月12日
计算机支持的协作学习CSCL (Computer Supported Collaborative Learning)和计算机支持的协同工作CSCW (Computer Supported Cooperative Work)是具有紧密联系的两个研究领域,同时也存在着明显的差别。二者的主要区别在于目标不同:协作学习的目标是知识建构,学习者之间的交互过程即是目标本身。协同工作的目标是最终生成产品。与之相对应,协作学习更多地强调协作(collaboration),而协同工作更强调合作(cooperation)。作为交互的一种特殊形式,协作是参与知识社群(knowledge-building community)的过程。关注协作,实质上就是要关注知识社群的发展以及个体如何参与知识社群并提升自己的知识。合作则被定义为个体进行联合的工作,通常把某个任务分解成多个子任务,由不同的参与者独立完成。无论是协作过程还是合作过程,都需要参与者之间的协调(coordination)和交流(communication)。与合作相比,协作的参与者之间的交互程度更高,需要共同参与协作过程的每一个方面和每一个环节。
社群是研究协作的核心概念,大体上可分为实体型社群和兴趣型社群两类。实体型社群对应于现实生活中的实际社会关系。兴趣型社群以兴趣为基础,彼此的互动也仅限于该社群对应的兴趣主题。从社群的角度研究协作,有两个关键问题需要解决。第一,研究社群如何形成以及随着时间的推移又将如何演化;第二,对已形成的协作社群,研究如何为社群成员提供方便的信息交流通道和资源共享平台,尤其要考虑不同社群成员的个性化需求。
现有的协作研究大多针对实体型社群,这类社群具有稳定的组织结构、明确的角色分配以及模式化的活动流程,基本上不存在社群的形成与演化问题,关注的焦点是为群组成员提供信息交流工具和资源共享平台。但这些工具和平台大多针对所有协作社群成员的共性需求开发,对个性化(personalization)关注不够。人们普遍认为,兴趣型社群更能体现协作过程的社会性与参与性,尤其是在网络环境下的协同工作研究。但由于兴趣关系通常是隐含的,并且它会随着时间的推移发生变化,因此,社群的形成与演化就成为不容回避的问题。目前,国内外同类研究虽然注意到兴趣在协作中的重要性,但大多停留在定性分析阶段,还不能为相似关系的可计算判定和度量提供理论与算法,也缺乏对兴趣关系演化机制的量化研究。针对上述问题,我们以统计学习理论(Statistical Learning Theory)为基础,从理论与算法两方面对兴趣型社群的形成与演化机制以及个性化服务问题进行研究。同时,选择协作式研究作为应用背景,设计开发了协作式研究Agent(Collaborative Research Agent,CRA)系统并进行了仿真实验,讨论了理论与算法的有效性问题。
研究协作和协作社群,重点和难点是相似关系的判定和计算,关键在于兴趣向量的获取,这涉及三个关键的子问题:从同时包含有标号和无标号数据实例的数据集中学习、序回归问题和兴趣转移问题。解决这三个问题的共同基础是分类学习的相关理论与算法。本书首先分析了线性可分数据的两类分类问题,推导出最优硬间隔超平面(即硬间隔支持向量机)优化问题的原始形式和对偶形式,进一步推导出最优软间隔超平面和直推式最优超平面对应的优化问题,探讨了优化问题的求解算法。接着讨论了最优超平面的最优性数学理论基础,研究了线性不可分数据分类学习问题的核函数方法。第三部分介绍实现CRA系统的关键技术、仿真实验以及对实验结果的讨论。最后,指出进一步研究的若干问题。本书的最大特色是突破了国内外同类研究大多停留在定性分析的局限,将理论与算法研究涵盖的对偶表示、特征空间、优化理论、统计学习模型与算法等纳入到自定义的统一框架中,使读者能够对方法的“源头”与“流向”有明确的了解,对理论价值与应用前景有直接的认识,从而能让感兴趣的读者较快进入到该研究领域。
协作社群形成与演化机制是CSCW/CSCL研究的新课题,属于CSCW/CSCL与人工智能学科的交叉研究,我们尝试从可计算角度研究协作问题,将统计学习理论、支持向量机与核函数方法引入协作机制研究,从理论与算法两方面探讨了以相似关系为基础的协作社群形成与演化机制。该课题研究把协作研究从目前主要关注实体型社群拓展到兴趣型社群,从而扩大了CSCW理论与应用研究的范围,对网络环境下的协同工作研究尤为重要,突破了国内外同类研究大多停留在定性分析的局限。问题虽然已经提出来了,但我们所做的研究工作还只是初步的,因此本书具有明显的探索性和试验性,一些见解和观点一定还存在不成熟和不完善的地方,书中的疏漏和错误也在所难免。愿借本书抛砖引玉,与同行交流,诚恳期待各位专家和读者朋友不吝指教和帮助,对此,我们将深为感激,“嘤其鸣矣,求其友声”,这就是我们的肺俯之言。
感谢柳泉波博士的理解和支持,我们的合作始于1998年夏天,共同主持完成的《IT技能测评自动化理论与技术》已于2001年底通过省级科技成果鉴定,该项目在IT技能测评自动化方面做了开拓性工作,在理论研究、技术攻关、软件开发三个层面上均取得重要的创新性成果,达到国际先进水平。我们合作撰写的专著《IT技能测评自动化—理论.技术.应用》于2001年由科学出版社出版,本书是我们合作撰写的第二本专著。我们的合作是愉快并富有成效的,对一些共同感兴趣的理论与实践问题进行研究探索的结果体现在已发表的论文和出版的专著当中,这是对我们合作经历的最好纪念。
我于2003年1月进入清华大学计算机科学与技术系博士后流动站,主要从事计算机网络与分布式系统研究。感谢合作导师史美林教授将我带入到网络计算与计算机支持的协同工作研究领域。史教授在国内很早就提出基于网格计算环境的协同工作理论与关键技术研究这一新课题,该课题后来得到国家自然科学基金重点资助。我很荣幸有机会经历了该课题从论证到实施的全过程,导师的治学态度和敬业精神深深教育和影响了我,在他身上体现了做人与做学问的博大胸怀与崇高境界。在史美林教授的鼓励和指导下,我在博士后研究期间的另一项工作是主持完成了《面向e-Learning的网格计算支撑环境与关键技术研究》,在网格计算技术应用研究领域做了开拓性工作并取得重要的创新性成果,填补了国内e-Learning Grid研究的空白,2004年12月,教育部在清华大学主持召开该项科技成果鉴定会,总体达到国际先进水平。在总结该项目研究成果基础上撰写的专著也将于近期出版。这是专家对我们研究团队工作的肯定和鼓励。正是导师史美林教授给我明确的研究目标、创新的学术思想以及国内一流水平的工作基础,我和研究团队的同事们才能在较短的时间将这一课题研究向前推进一步。感谢项目研究团队的同事和朋友们对我的理解、信任和支持,项目研究成果是集体智慧的结晶,是依靠团队力量联合攻关取得的,我只是主持了这个团队的研究工作而已。我长期主持集体研究项目,对团队精神和集体荣誉感体会最深,我认为,成果固然重要,但团队成员之间的友谊更加珍贵,一项成果也许领先不了多长时间,但友谊地久天长。
本书是在清华大学计算机科学与技术系从事博士后研究期间完成的,在付梓出版之际,感谢清华大学博士后管理办公室的领导以及计算机科学与技术系主任林 闯教授、系办公室籍凤华老师在我办理入站手续和在站期间给予的关心和帮助,感谢计算机科学与技术系博士后流动站前后两任站长杨士强教授和朱小燕教授对我的鼓励和指导,感谢计算机科学与技术系计算机网络技术研究所给我提供良好的科研与生活条件。中国人工智能学会理事长、北京邮电大学学术委员会主任、博士生导师钟义信教授主持了我的博士后离站科研工作评审会,并为本书作序,在此表示诚挚的谢意。感谢参加博士后离站科研工作评审会的曹元大教授、王克宏教授和戴一奇教授。
感谢华南师范大学教育信息技术学院、电大在线远程教育技术有限公司和中央广播电视大学等单位对我博士后研究工作提供支持,感谢何克抗教授、徐福荫教授、李克东教授、常梦雄教授、任为民教授、胡晓峰教授、何丕廉教授、向 勇副教授、姜进磊博士等两年来给予我的鼓励和指导,感谢博士研究生李玉顺、王桂玲、王冬青、杨胜文、苗春雨、任光杰、张少华等给予我的支持和帮助,感谢赵敏先生、汪启富先生和李国斌先生等给予我的关心。本书写作过程中参阅了大量国内外文献资料,从某种意义上说,本书汇集了被引用文献作者的真知灼见。在此,对这些文献的作者表示感谢。
中国科学院科学出版社技术出版分社李振格社长和王淑兰编审为本书的出版做了很多工作,在此表示衷心的感谢!
又是一年春草绿,转眼两年过去了,清华园的博士后研究经历给我留下的不止是美好的回忆,而且真正能成为不断滋润我人生的精神源泉。
许 骏
2005年3月于北京清华园