英语文库 :
英语文库是哈伯—柯林斯与英国伯明翰大学的共建项目,由辛克莱尔主持于1982年建成。该语料库最初命名为“伯明翰英语文汇”(The Birmingham Collection of English Texts, 简称BCET),当时收词量只有230万。1991年,哈珀-柯林斯出版集团决定把库容扩展到2亿词,并改名为“英语文库”(The Bank of English),并由哈珀—柯林斯和伯明翰大学组成一个专门部门“柯林斯伯明翰大学国际语言资料库”(Collins Birmingham University International Language Database,简称COBUILD)负责实施。到2005年,英语文库的规模已达5.25亿词。之后,建库团队解散,语料没有再大量扩容。现在,哈珀—柯林斯和伯明翰大学各持有一个版本,出版社版叫作“在线词汇库:英语语料库”(WordBanks Online: English Corpus),大学版叫作“伯明翰语料库服务平台”(Corpus Hub at Birmingham),向校内开放,供教师、研究生学习和研究使用。这两个版本的语料库都在网上开辟注册窗口,对外提供有偿使用。
英语文库收词涵盖了英国、美国和澳大利亚等大量英语资料,它能为词典编纂提供立目、义项划分和释义的依据,统计使用频率,提取例证和用法,并且还能追溯词义和用法历史演变的过程。该语料库自1982年投入使用以来,已经支持了大量的词典编纂及英语学习参考书的编写,在中国市场上就有20多个版本。《柯林斯COBUILD英语词典》第1版是世界上第一部完全基于真实语料库编写的学习型英语词典,它从根本上改变了词典的编写理念,并从此催生语料库词典学,基于语料库编写的词典大量涌现。