计算词典学

    计算词典学 :

中国第一款藏汉英电子词典硬件产品:《洛藏藏汉英电子词典》

计算词典学是词典学与计算机技术结合的产物。在20世纪70年代末期计算机硬件和软件有了较大的发展,词典编纂开始与计算技术有了实质性结合,这种结合直接推动了辞书研究和编纂现代化的进程;其现实含义就是在辞书整个编纂过程中充分使用数字技术和各种语言数据资源,包括开发功能强大的语料库、数据库和适用于辞书编纂的软件系统。

国际上自20世纪60~70年代就开始了计算词典学的理论研究,到80~90年代其理论框架和研究范围渐渐趋于明朗。德国词典学刊物《词典学国际年刊》在1988年推出了“计算词典学和计算语言学专辑”;B.K.博古拉夫等人在1989年出版了《自然语言处理中的计算词典学》一书;J.M.辛克莱尔的《语料库、检索与搭配》、B.T.阿特金斯等人的《计算机词库》和V.魏伊的《计算机语料库词典学》等都对计算词典学的发展做出了贡献。

计算词典学从学理上可以解释为以计算机技术为手段、以词典学研究为目的的学科。词典学是研究词典理论和编纂实践的,计算词典学当然不能偏离这个方向;其区别在于前者着重传统词典和编纂范式的研究,而后者着重基于计算机数字技术的新型词典和编纂方法论的研究。

计算机在词典语料的搜集和处理、语料库建设,以及词典数字信息的输入、存取、分析、编辑、传播、交换等方面发挥了重要作用,为词典学的理论与实践提供了新的方法。另一方面,在自然语言处理中,词库或机器词典也是实现数据处理的关键。从计算词典学形成的历史来看,它首先是解决词典信息的“电子化”和“机读性”问题,为建设词典数据库提供数据资源;其次,是研究如何使用计算机进行词典的辅助编纂、编辑、修订和出版;其三,是对现有的商业词典进行数字化升级,设计编纂供人阅读的电子词典或网络词典。在词典编纂数字化方面,面对海量的语料库,连续真实文本的分析以及词汇的索引和提取工具也是计算词典学的主要任务之一;通过索引和语料库模式分析可以从海量、无序的原始语料中提取词典编纂的有用信息,弄清有关语词在自然话语中的分布,抽象出词的语法、句法、语义和语用等功能属性,同时得到词的义项分布或划分的根据。

计算词典学是一个跨学科的研究领域,在长期的研究中已有了明确的研究范围、研究内容和任务,有一整套的研究方法和和比较明确的研究方向,涉及词典编纂的语言资源研究与开发、计算机辅助词典编纂和融媒体出版等三大板块。总的来说,计算词典学是研究如何实现词典语料处理电子化,词典编纂半自动化或自动化,词典信息数据化、释义表征多模态化、词典载体多媒体化、词典编排形式化、词典查检智能化、词典出版融媒体化。

为您推荐

《词典学概论》

《词典学概论》 : 1971年由捷克斯洛伐克科学院的科学出版社和德国德古意特·穆彤出版社出版,1983年由商务印书馆推出中译本。《词典学概论》一书源于1962年在捷克科学院东方研究所召开的词典学国际会..

《系统罗贝尔》

《系统罗贝尔》 : 由罗贝尔辞书出版社于1983年出版。《系统罗贝尔》的编纂宗旨是通过建立词汇和语义间的系统联系帮助学生牢记和扩展词汇,故名“系统”词典。作为第一部系统描写法语词汇的词典,其新颖..

次词条

次词条 : 一般由主词目的派生词或基于主词目的复合词、短语和习语等构成。派生词类次词条往往直接继承主词条的语义特征,不单独释义。次词条的特点是,虽然隶属于主词条,但另外起行,组成相对独立的信息单..

副词条

地方语词典

地方语词典 : 参见方言词典。 ..

《拉鲁斯大百科辞典》

《拉鲁斯大百科辞典》 : 由拉鲁斯出版社于1960年以《百科大拉鲁斯》为书名印刷发行,共12卷;1982~1985年修订再版,更改为现名,以10卷本发行,1989年又推出15卷本。《拉鲁斯大百科辞典》是一部以中等文化程度..

外来语词典

外来语词典 : 外来语词典一般介绍词的来源语种、注释其读音、提供其释义。其体例结构比较简单,一般包含的内容有:①词目词,即外语在母语(如汉语)中的书写形式;②外来语词的注音;③外来语词的来源;④外来语在..