英语国家语料库 :
由英国牛津大学出版社主导,伯纳德和利奇等人主持,兰卡斯特大学、朗文出版公司、钱伯斯-哈洛普出版公司以及大英图书馆等于1991~1994年联合开发。1995年开始以CD光盘形式面向欧洲语言研究者发行,2001年稍作修订后在世界范围发行,2007年第3版开始改用XML格式,其载体也改为DVD光盘。
英国国家语料库总库容为1亿余词,有4124个语言样本,分别处理9000余万词的书面文本和1000余万词的口语文本。其中,书面文本的分类涉及主题类别、文献媒介和时间三个参数,具体包括了70%的信息性文本和30%的文艺创作文本,取自书籍、报刊、杂志、书信、回忆录、学生习作等语言样本。口语文本取自长达2000个小时的录音,抽样人群考虑了不同年龄、地区和社会阶层等方面,涉及38个地区4个不同的社会群体,年龄在15到60之间,语料内容涵盖日常对话以及教学、商务、官方会议、电台节目等,具备良好的分不性和平衡性。其特点主要体现在:①重点收录英国英语语料,非英国英语和外来语只占极小部分;②语料样本均来自于20世纪后期到当代语料,不涉及英国英语的历时变迁;③语料来源广泛,覆盖了英国语言的方方面面,不针对某一特定学科领域、文体类型和语域类型;④所有的书面文本均抽样处理,保证长度均不超过45 000词,以求在1亿词的有限库容中最大限度确保语料的丰富性和代表性。
英国国家是英语辞书领域使用最广,最具代表性的大型英语通用语料库之一;只是在1994年后再无更新,使其使用受到一定的局限。