概念词典 :
在概念词典中,概念泛指意义、想法、词族或相似关系,可以通过图形、语词、术语、定义、同义词、外语等值词等来表达。传统的概念词典包括类义词典、同义词典、类语词典、倒序词典、图文词典等。概念词典的条目通常分类逐级编排,建构层级的两种基本方法是逻辑分类或者语义聚类。逻辑分类遵循从一般到个别的演绎方法。逻辑分类的基础是认识经验或已知知识体系,据此将概念世界划分为若干大类,按逻辑属种关系将大类分为次类,次类再分为子类,概念排列在最小的类下。类义词典的编排常用此方法。语义聚类遵循从个别到一般的归纳方法。此方法从个别概念之间的共性特征入手,共性特征多的概念组成小类,自下而上构成层级系统。
在数字化时代,概念词典专指自然语言处理或机器翻译中基本数据库中的数据内容。早期的机器词典主要由基本词典(又称“主词典”)和概念词典两部分构成。基本词典描述词目词的语法、语义特征,包括形态、句法和语义等信息,概念词典描述基本词典中词目词的概念,可进一步分为概念分类体系和概念描述两部分,其功能是在基本词典的框架下对语词的概念词典进行定义或说明,从而获得有关单词的详尽信息。后来根据需要又增加了搭配词典和对译词典,但概念词典仍起着重要作用。
在概念词典中,概念特征或概念的义元与义元之间的关系主要反映在每个记录的概念定义项中。而在各个特征文件中,概念特征之间的关系则体现在特征的层次结构树、必要角色框架和共性特征描述项中。譬如,美国普林斯顿大学的“词网”。词网收录英语名词、动词、形容词和副词,它们是按照同义词集合组织起来的,每个同义词集合代表一个概念,同义词集合之间借助概念-语义关系和词汇关系相关联。在语言处理中,可以按一定的规范对各个特征文件进行处理,从中提取出不同特征的基本信息以及特征之间的关系信息,把它们分别加入特征表和特征关系表。类似的汉语语义词典是北京大学的《中文概念词典》。概念词典还广泛应用于词汇学研究、语言教学、信息检索、语言信息处理等领域之中。