关于我们
![]() ![]() |
计算语用学引论 定 价:¥38 中 教 价:¥28.12 (7.40折) 库 存 数: 0 丛 书 名:汉语言文学研究文库
计算语用学是一门新兴的计算语言学分支学科,本书是有关计算语用学研究的入门级读本。作者在书中系统阐述了计算语言学、语用学、形式语用学、计算语用学等基本概念,侧重探讨了语用学与计算语用学关注的重点言语行为与语境的形式化方法,以及基于语境的自然语言理解模型问题。
全书结构清晰,逻辑严密,循序渐进,有助于读者比较全面地了解计算语用学这一方兴未艾的学科的发展态势,适合对语言学及计算语言学感兴趣的读者阅读。
本书作者在探讨语境的形式化与自然语言理解模型的基础上,给出了有关语境的一系列形式化定义,提出了基于语境的自然语言理解实现框架,构造了一个基于语境的自然语言理解模型系统。全书结构清晰,逻辑严密,循序渐进,有助于读者比较全面地了解计算语用学这一方兴未艾的学科的发展态势,适合对语言学及计算语用学感兴趣的读者阅读。本书作者具有强烈的创新精神,提出了一些国内外学者没有提过的见解、理论、方法、方案。并且知行统一,构造出模型系统,做出了开创性的贡献!这种既敢想敢干又严谨求实的科学态度和钻研精神是应该大力提倡的!
序一 人类在数百万年的进化过程中逐步从原始猿类中进化分离出来,人类同其他动物最根本分界的特征有以下几个: 第一是直立行走。直立行走使人类可将手和脚进行分工,将双手解放出来,从事更丰富多彩的活动。直立行走使人大大提高了自己的视角,使眼界更远、更开阔,认识世界的能力更强。手脚的分工反过来刺激了脑的发育。 第二是能动手制作劳动工具,延伸自己的器官。动物只能被动地适应这个世界,而人类由于能制造工具,就摆脱了被动适应世界的处境,可以主动地改造世界,创造出自然世界原来没有的东西,并使人脑更加聪明和发达。 第三是在长期的实践中,人类产生了越来越丰富的语言。其他动物也有自己的传递消息的声音(语言)、动作(动作语言)。如蜜蜂用舞蹈来告诉同伴花丛的位置与方向,鸟类的鸣叫、猿猴的不同叫声向同类发出危险将至、此处有食的信息。它们在欢愉、惊恐、痛苦、愤怒等不同情况下发出的声音是不同的,而同类是理解的,这种信号已具有了语言最初级的功能与特征。但这种语言十分简单、原始,语义含量极低。 人类是社会化的动物,在数百万年的进化过程中,在越来越复杂的实践活动中,由于许多活动需要多人配合才能实施,必须交流思想,就逐步形成了越来越丰富的口头语言。有了语言就突破了动物界代际重复的局限,上一代人积累的知识通过语言可以迅速扩散传播,可以顺利地传递给下一代,使下一代的认识能力、实践能力进一步提高,超过上一代。这是十分伟大的进步,大大加快了人类的进化速度。 口头语言逐步丰富,延绵使用了百万年之后,在大约一万年至数千年前形成了文字。文字可以精确地记录人类的实践,更大范围地传播人类的思想、理论和知识,产生了巨大的作用,使人类社会全面快速进步。因此,文字的发明被历史学家看作人类社会脱离野蛮时代、进入文明时代的标志之一。 正是以上三个基本特征的延续和发展,使人类最终成为地球的主宰者。语言的产生,其意义无论怎样强调都不过分。 斯大林曾指出,语言是思想的物质的语言的外壳。他的这一论断有积极意义,但又不全面。因为人类的思维形式有抽象(逻辑)思维、形象(直感)思维和创造性思维,而创造性思维中既有抽象(逻辑)思维,又有形象(直感)思维成分。人的抽象(逻辑)思维是建立在概念的基础上的,语言可以说是抽象(逻辑)思维的外壳。人脑的前额叶(其位置在人头部的前额内)很突出,而智力水平最高的类人猿黑猩猩的前额低平。近三十几年来的研究表明,人的前额叶中至少有数千万个神经元,它们的激发只同抽象概念直接相关,而不管刺激来源于什么信息通道。换句话说,它们只同抽象概念相联系。从人类进化过程中不同时期的头盖骨形态变化中也可以发现,进化程度越高,脑容量越大,前额叶也不断增大。显然人脑语言中枢模块与前额叶的发展是同人类语言的发展相对应的。形象思维的发展比抽象思维早得多,在动物界早已有之。可以说有感觉和知觉的动物界主要是靠形象思维生存的。 我们应该看到,人用语言描述一个场景、一幅图像往往不准确,效率也不高。而用眼睛和视觉皮层配合一瞬间就可以准确完成。可见,形象的感知与思维极为重要,语言还是有很大局限性的。 Ⅱ Ⅲ 人脑、人的思维是综合集成式的。人脑集中了动物进化过程中相当多的最优秀的神经模块。如人的脑干中甚至有爬行动物的神经模块,而丰富的脑皮层特别是前额叶的神经模块的许多部分却是人特有的。人的思维方式和工具多种多样,也具有综合集成的特点,为了解决社会实践中的问题,它们被综合应用、灵活应用。而语言是人与人之间思想交流的工具,是社会化的桥梁,地位特别重要。 科学技术是推动人类社会前进的最革命的因素之一,也是最根本的动力之一。正如钱学森院士所指出的,是科学革命推动技术革命,技术革命推动产业革命,产业革命推动社会革命。科学、技术、产业的发展使人类社会的生产力不断提升,当生产关系已经严重阻碍生产力发展的时候,就不可避免地发生社会革命,推翻阻碍生产力发展的生产关系和上层建筑,建立适应生产力发展的崭新的生产关系和上层建筑,使人类社会由较低级的社会向更高级的社会演进。 二十世纪是人类社会变化最剧烈,灾难最惨烈,进步也极为巨大的世纪。二十世纪人类创造的四项科技成果意义重大,它们是爱因斯坦相对论的提出和核能释放、航空航天科技、电子计算机及计算机网络的发明、DNA(脱氧核糖核酸)双螺旋结构的发现。 其中,电子计算机及计算机网络的发明意义更为深远。因为在计算机发明之前,科学技术的总的作用都是在延伸人类的体力、肢体和感知能力。如基于物理学和化学等学科的化石能(煤、石油、天然气)、热能、电能、核能的利用,蒸汽机、内燃机、电动机、火药、炸药、原子弹、氢弹等的发明,将人类的肌肉动力、人利用的畜力(牛、马等)放大了十倍、百倍、千万倍。各种机器的研发成功地将人类从繁重的体力劳动中解放了出来。而望远镜、显微镜、电子显微镜、雷达、声纳、射电望远镜等的发明使人类看到更广阔、更遥远、更细微的世界。而电子计算机及其网络的发明,则开始延伸人类的大脑和思维,开始将人类从繁重的脑力劳动中解放出来,因而具有划时代的伟大意义。 第一台电子计算机于1946年在美国宾夕法尼亚大学莫尔电子学院诞生,主要用于科学计算(计算火炮的弹道)。此后,计算机的性能不断提高,应用领域不断扩大,经过70年的发展,每秒钟运行10亿亿次的我国高性能超级计算机神威·太湖之光计算机已经面世,其运算速度居世界第一位。计算机的应用类型从科学计算到数据处理、过程控制、数字化通信、人工智能等,几乎渗透到人类社会生活的每一个角落,深刻地改变着人类社会的形态和面貌,改变着人类的思维方式。计算机网络将整个世界联系起来,将偌大一个地球变成了地球村,使信息传递的空间距离几乎消失。 电子计算机发明十年之后,一门旨在用人造系统模拟人类思维和智能行为的,横跨计算机科学、数学、物理学、心理学、生理学、脑科学、逻辑学、哲学、社会学、行为科学、语言学等多学科的崭新的学科人工智能应运而生。1956年暑假,在美国达特茅斯学院召开了世界上第一次人工智能学术会议,宣告这个学科的诞生。参加会议的有卡内基·梅隆大学的认知心理学家、诺贝尔经济学奖得主赫伯特·西蒙、心理学家艾伦·纽维尔、麻省理工学院数学家明斯基等16人。这以后人工智能的研究领域被确定为自然语言理解、模式识别、知识表达、问题求解、机器学习、机器定理证明、机器翻译、专家系统、机器人、计算机视觉、语音与声音合成、数据库智能查询、自动程序设计、人工智能程序设计语言等。近十几年来,数据挖掘、大数据的智能化处理、无人化智能平台与机器人成为研究热点。 自然语言理解是人工智能领域最古老的也是最困难的研究方向之一。早在20世纪50年代初,就有人开展同语言计算机处理相关的研究,如美国乔治城大学与IBM公司研发俄英自动翻译试验系统等。随着计算机工作者同语言学工作者的精诚合作日益加深,自然语言处理、计算语言学这种提法应运而生,它的范畴超出了人工智能工作者最先提出的自然语言理解范畴,并且具有了广泛应用的意味。 华中科技大学文学院以尉迟治平教授为首的中文系研究团队高度重视计算语言学方面的研究工作,20世纪八九十年代,在中文系建立中文信息处理实验室。1998年底学校领导决定要我参加计算语言学研究工作,支持文科发展。2000年华中科技大学文学院申请语言及应用语言学博士点,获得国家学位委员会批准。2001年,文学院成立计算语言学研究所,委任我担任第一任所长。 刘根辉是毕业于中文系的青年学者,他以惊人的毅力勤奋学习数学、计算机和人工智能等领域的知识,掌握了计算机及网络的应用技术,并以优良成绩考入华中科技大学人工智能研究所控制科学与工程学科模式识别与人工智能专业,成为我的第一位计算语言学方向的博士研究生。经过六年多的艰苦努力,他跨过文科、理工科两大领域的界线,获得工学博士学位,成为跨领域的两栖型学者,并被提升为副教授。当前,国内这样的人才十分稀缺。我们深深感到,只有培养更多既有深厚文科根基,又有扎实的数理与计算机科学知识和技能的两栖型学者,计算语言学或自然语言理解领域的堡垒才能最终被攻克。 在为刘根辉选择研究方向的时候,我们有多种选择,为什么最终选定计算语用学为突破口呢?我在计算机、人工智能领域工作了四十三年,发现我国学者中相当多的人总在做跟踪性研究,而且培养出了一种奴性:外国人没有碰过(或碰得少)的问题,他们不敢碰;外国人没有说过的话,他们不敢说;外国人的缺陷或错误,他们不敢反驳、纠正。这使得国内许多领域的学术研究殖民化,民族自尊心、自信心和创造性被严重压抑。我们必须突破这种氛围!怎么突破呢?我的父亲李国平院士认为:多学科的边缘领域是原始创新的富集区,应该到那里去干。他还认为:一般的老师,总是将学生带到自己最熟悉的领域之中,在别人论文的缝隙中做工作、讨生活。好的老师是将学生带上一条前途远大的康庄大道,尽管自己并不一定很熟悉,但他有决心引导年轻人去探索。他还告诉我们:对洋人的好东西,我们要认真学习,但不能有任何奴性。那些外国人我们都较量过,没有什么了不起的!四十年前,就是在父亲这种学术思想的引导下,在当时国内还不敢提人工智能,很少有人从事相关研究的困难情况下,我起草了国内第一份人工智能发展规划报告,并完成了第一项将人工智能技术应用于重大武器装备的科研工作。在刘根辉的博士论文选题上,我们让这种传统再现了。 Ⅳ Ⅴ 爱因斯坦曾经说过,一个蹩脚的科学家是在木板上寻找一个最薄的地方,然后密密麻麻地打上许多个洞。而一位优秀的科学家是在木板上选择一个最厚的地方,扎扎实实地打上一个深洞。 我们认真分析了自然语言理解和计算语言学的发展过程和趋势。经过全球许多科学工作者的艰辛努力,计算语言学在语音学、词汇学、语法学、语义学、语料库语言学等方面都已经取得了重大进展,形成了不少理论和方法,甚至研发出了一些应用系统,而当时国际上计算语用学的论文很少,国内尚无人问津,而且汉语中又有许多特殊规律需要探索。计算语用学需要大量前期工作的积累,是综合性极强、难度极大的研究工作。因此,选择它作为主攻方向符合我们的上述理念。 经过多年的积累和艰苦探索,刘根辉博士不负众望,出版《计算语用学引论》这本专著,我们都感到无比欣慰和愉悦。这本著作是我国第一部计算语用学专著,由于作者独具匠心,鼓励后继,这本专著又是一本大学本科生、研究生和学者探索计算语用学的入门引导书,其作用十分重要。 本人认为该书具有以下特点: 第一,作者系统深入地综述了计算语言学、自然语言理解领域较为完整的发展过程、当前状况和未来趋势,读者可以获得十分清晰、系统的概念和信息。 第二,作者介绍了计算语用学的起源、发展和主要的研究方向,论述了汉语语用学的研究发展趋势。充分考虑了我国学者研究汉语语用学的需要。 第三,在所有的计算机应用问题中,形式化都是关键的一步,舍此无法使用计算机解决任何问题。作者在第三章研究了语用的形式化问题,结合形式语用学发展概况,阐述了国内形式语用学研究的发展思路。 第四,作者深入探讨了计算语用学的研究途径和方法,就语用推理、溯因推理、信任推理、动态环境以及话语意义的计算模型等五个热点问题进行了深入探讨。 第五,作者在Austin、Searle的语言行为理论的基础上,从认知角度出发提出了言语行为的形式化模型系统。 第六,作者在探讨语境的形式化与自然语言理解模型的基础上,给出了有关语境的一系列形式化定义,提出了基于语境的自然语言理解实现框架,构造了一个基于语境的自然语言理解模型系统。 全书结构清晰,逻辑严密,循序渐进,有助于读者比较全面地了解计算语用学这一方兴未艾的学科的发展态势,适合对语言学及计算语用学感兴趣的读者阅读。尤其让我感到高兴的是作者具有强烈的创新精神,提出了一些国内外学者没有提过的见解、理论、方法、方案。并且知行统一,构造出模型系统,做出了开创性的贡献!这种既敢想敢干又严谨求实的科学态度和钻研精神是应该大力提倡的! 李德华 (华中科技大学人工智能研究所、计算语言学研究所所长,二级教授,博士生导师) 2016年6月21日于华中科技大学人工智能研究所
刘根辉,男,江西丰城人。1989年毕业于宜春师范专科学校汉语言文学专业。1999年毕业于华中科技大学(原华中理工大学)语言学及应用语言学专业(汉语音韵学研究方向),获文学硕士学位,后留校任教。2005年毕业于华中科技大学模式识别与智能系统专业(计算语言学研究方向),获工学博士学位。2000年被聘为讲师,2005年被评为副教授。韩国国立安东大学访问学者,美国韦恩州立大学访问学者、孔子学院教师。主要研究领域为计算语言学、语料库语言学、语用学、计算机辅助语言研究等。主持或参与国家社科基金重点项目、教育部社科基金项目、国家985创新基地项目、校自主创新研究基金等各级各类科研项目10余项,在Advances in Systems Science and Applications、《中文信息学报》、《计算机工程与应用》、《语言研究》等各种期刊发表学术论文20余篇。
目录
第一章计算语言学与计算语用学() 第一节几个相关概念() 第二节国内外计算语言学研究概况() 一、 国外计算语言学研究概况() 二、 国内计算语言学研究发展概况() 第三节国内外计算语用学研究状况() 一、 计算语用学的概念() 二、 计算语用学的研究内容() 三、 计算语用学研究现状() 第二章语用学与汉语语用学() 第一节语用学的起源() 第二节语用学的定义() 第三节语用学研究的主要论题() 一、 指示语() 二、 预设() 三、 言语行为理论() 四、 会话含意() 五、 关联理论() 第四节汉语语用学研究与发展() 一、 语用学理论的引进和发展() 二、 汉语语用学研究概况() 三、 汉语语用学研究的发展方向() 第三章语用的形式化研究() 第一节语用形式化的早期探索() 第二节形式语用学的定义() 一、 形式语用学的定义() 二、 形式语用学与计算语用学的关系() 第三节形式语用学研究发展概况() 第四节国内的形式语用学研究() 一、 哲学角度的自然语言逻辑研究() 二、 语用形式化的语言学研究() 三、 汉语形式语用学研究的发展思路() 第四章计算语用学研究的途径和方法() 第一节语言理解与语用推理() 第二节溯因推理与缺省逻辑() 第三节信任推理() 第四节动态语境() 第五节话语意义的计算模型() 第五章言语行为的形式化模型研究() 第一节言语行为理论的产生背景() 第二节Austin的言语行为三分说() 第三节Searle的言语行为理论() 一、 施事行为及其构成规则() 二、 施事行为的分类() 三、 对Searle言语行为理论的评价() 第四节认知角度的言语行为形式化描述() 一、 认知状态下交际情境的形式定义() 二、 语用算子() 三、 施事行为的语用描述() 第六章语境的形式化与自然语言理解模型() 第一节面向自然语言处理的语境形式化研究() 一、 语境在自然语言处理中的作用() 二、 语境的现代语言学分类() 三、 自然语言理解中语境的形式化描述() 四、 实例分析() 第二节基于语境的自然语言理解的实现框架() 一、 构造描述空间和语义空间() 二、 构建语言知识库() 三、 获得话题焦点() 四、 构建动态语境知识库() 五、 根据语境推断话语含意() 六、 基于语境分析的话语理解实现流程() 第三节一个基于语境的自然语言理解模型() 一、 模型总体设计() 二、 语料处理和知识库的构建() 三、 词法分析和句法分析() 四、 确定焦点词的语境义() 五、 实验结果及分析() 结语计算语用学研究展望() 参考文献() 后记()
你还可能感兴趣
我要评论
|