当前位置:文库下载 > 所有分类 > IT/计算机 > 计算机软件及应用 > 030039中国语言技术进展
免费下载此文档侵权投诉

030039中国语言技术进展

专题报道/Cover Features

中国语言技术进展

关键词:自然语言处理

引言

自然语言作为人类交流思想情感最基本、

最直接、最方便的工具,随时随地用于生活的

各种场景。人类从出生后的第一声啼哭开始,

就企图用语言(声音)来表达自己的情感和意

图。随着信息时代的到来,人们使用自然语言

进行通信和交流的形式也越来越多样、灵活和

广泛。然而,人脑是如何实现自然语言理解这

一思维过程的?我们应该如何建立语言、知识

与客观世界之间可计算的逻辑关系,并实现具

有较高区分能力的语义计算?为什么世界上不

同人种在拥有几乎相同的大脑结构和语声机理

的情况下,却无法实现不同语言之间的相互理

解?众多的科学问题至今仍困扰着我们。有关

专家指出,语言障碍已经成为制约21世纪社会

全球化发展的一个重要因素。因此,如何实现

自然语言的有效理解,打破不同语言之间的固

有壁垒,为人际之间和人机之间的信息交流提

供便捷、自然、有效和人性化的帮助与服务,

已经成为备受人们关注的极具挑战性的国际前

沿研究课题,成为全球社会共同追求的目标和

梦想。

Communications of CCF 2008/8 从1956年正式提出人工智能科学以来,

自然语言理解(natural language understanding,

NLU)就成为该学科重要的研究内容之一。

从术语的概念和内涵来看,自然语言理解研

究所关注的更多是关于人类思维对语言的加

工、理解机理和认知过程等问题,但从最终

的应用目的来看,是要实现面向具体任务和

应用目标的自然语言处理系统。因此,从这

个意义上讲,自然语言理解又称自然语言处

理(natural language processing, NLP),其任

40宗成庆 高庆狮中国科学院自动化研究所务是研制表示语言能力(linguistic competence)和语言应用(linguistic performance)的模型,并建立计算框架来实现这些模型,再根据这些模型设计各种实用系统,探讨这些实用系统的评测技术[8]。无论是自然语言理解,还是自然语言处理,研究对象都是人类语言,基本手段都是利用计算机科学和技术、数学、逻辑学和认知科学等。因此,从偏向语言学的角度来讲,自然语言处理又可称为计算语言学(computational linguistics)。综上所述,自然语言理解、自然语言处理和计算语言学三个术语在内涵和外延上各有所侧重,但主体内容相互重叠,为了表述简单,在不引起混淆的情况下本文不再加以区分,通称为人类语言技术(human language technology)。中文信息处理(Chinese language information processing)则是专指以中文为主要研究和处理对象的人类语言技术。由于文字和声音是人类语言两个最基本的属性,因此,从广义上讲,人类语言技术应该涉及两个层面:一个是以文字表示的词汇、语句、篇章和对话等为主要处理对象的语言技术;另一个则是以语音信号识别、辨认、生成等为主要目的的语音技术。尽管两者关系密切且相互渗透,但在理论基础和实现方法等方面都具有相对独立性,而且有各自独立的学科分支。本文主要指前者,不涉及语音技术的细节。我国的语言技术从20世纪50年代进行机器翻译研究算起,发展历史已有50多年。在这50多年发展过程中,国内研究者在资源库建设、基础理论和方法研究方面,以及应

第1页

免费下载Word文档免费下载:030039中国语言技术进展

(下载1-11页,共11页)

我要评论

返回顶部