英语国家语料库

    英语国家语料库 :

由英国牛津大学出版社主导,伯纳德和利奇等人主持,兰卡斯特大学、朗文出版公司、钱伯斯-哈洛普出版公司以及大英图书馆等于1991~1994年联合开发。1995年开始以CD光盘形式面向欧洲语言研究者发行,2001年稍作修订后在世界范围发行,2007年第3版开始改用XML格式,其载体也改为DVD光盘。

英国国家语料库总库容为1亿余词,有4124个语言样本,分别处理9000余万词的书面文本和1000余万词的口语文本。其中,书面文本的分类涉及主题类别、文献媒介和时间三个参数,具体包括了70%的信息性文本和30%的文艺创作文本,取自书籍、报刊、杂志、书信、回忆录、学生习作等语言样本。口语文本取自长达2000个小时的录音,抽样人群考虑了不同年龄、地区和社会阶层等方面,涉及38个地区4个不同的社会群体,年龄在15到60之间,语料内容涵盖日常对话以及教学、商务、官方会议、电台节目等,具备良好的分不性和平衡性。其特点主要体现在:①重点收录英国英语语料,非英国英语和外来语只占极小部分;②语料样本均来自于20世纪后期到当代语料,不涉及英国英语的历时变迁;③语料来源广泛,覆盖了英国语言的方方面面,不针对某一特定学科领域、文体类型和语域类型;④所有的书面文本均抽样处理,保证长度均不超过45 000词,以求在1亿词的有限库容中最大限度确保语料的丰富性和代表性。

英国国家是英语辞书领域使用最广,最具代表性的大型英语通用语料库之一;只是在1994年后再无更新,使其使用受到一定的局限。


为您推荐

辞典

辞典 : 其描写对象主要是概念和事物,描写的是语言符号所指称的内容,有知识性专科词典、术语词典、专名词典和百科词典等。“辞典”不完全排除对词汇或语言知识的描写,但这并不是它的主要内容。在辞书的..

吕坤

吕坤 : 归德府宁陵(今河南省宁陵)人。万历二年(1574)进士,历官襄垣、大同知县,户部主事、郎中,山东参政,山西按察使,陕西右布政使,以右佥都御史巡抚山西,召为左佥都御史,升刑部左、右侍郎。万历二十五(1597)年被谗..

戴维斯,A.

戴维斯,A. : 生于英国威尔士。1953年毕业于牛津大学英语专业,1965年获得伯明翰大学博士学位,后任苏格兰爱丁堡大学教授,讲授应用语言学,2005年退休,曾任国际语言测试协会主席、墨尔本大学语言测试研究中心..

语料库词频统计

心理词典

心理词典 : 许多学者认为储存于记忆中的词汇就像保存在人脑中的一部词典,因此称为心理词典。是心理语言学和认知科学中的一个重要概念。心理学家们倾向于认为,学会了语言和阅读的人都具有一部心理词典..

江永

江永 : 他精通三礼、长于算学、乐律和音韵之学,是经学皖派的开创者,一生著述甚多,重要者有《礼书纲目》《周礼疑义举要》《礼记训义释言》《仪礼释义》《春秋地理考实》《群经补义》等。江永精于音理,开..

自然语言语音理解系统

自然语言语音理解系统 : 指人和计算机之间用自然语言口语语音对话的通信系统。这是令人向往的前景。因为人用口语语音传输信息最快,最方便;而双手又是自由的,可以同时进行其他操作。   自然语言语音理解系统,从..