在按频率递减顺序排列的频率词典中,词的序号和词的频率之间存在着一定的数量关系。可以公式化为:。其中r为词的序号;k和γ都是常数;Pr则是序号为r的词的频率。美国语文学家齐夫(G.K.Zipf)通过实验测出γ=1,K=0.1。例如,如果词的序号为50,那么,根据公式得出:0.002。该公式称为齐夫定律。由齐夫定律可知,如果频率词典包含数十万个词,那么,其中头一千个最常用的词占该语言各种文章中全部出现的词百分之八十,因为
齐夫定律(语言)
齐夫定律(语言):
在按频率递减顺序排列的频率词典中,词的序号和词的频率之间存在着一定的数量关系。可以公式化为:。其中r为词的序号;k和γ都是常数;Pr则是序号为r的词的频率。美国语文学家齐夫(G.K.Zipf)通过实验测出γ=1,K=0.1。例如,如果词的序号为50,那么,根据公式得出:0.002。该公式称为齐夫定律。由齐夫定律可知,如果频率词典包含数十万个词,那么,其中头一千个最常用的词占该语言各种文章中全部出现的词百分之八十,因为
从属分析法(语言):把法国语言学家特思尼耶尔(Lucien Tesnière)提出的从属关系语法运用于句法自动分析所得出的一种方法。其基本思想是认为在词结合成句子的时候,词与词之间的关系不是这些词的简单相加,而是由核心成分和..
洪堡特主义(语言):德国人种学家洪堡特提出的关于语言决定思维、语言决定文化的观点。他在《论人类语言结构的区别和它对人类精神发展的影响》中提出由于任何客观的感知不可避免也会牵连上某种主观的东西,所以每一个人不..
基于规则的知识表示(语言):标准的知识表示方式之一。主要是使用”if〈条件〉then〈动作〉”这样的语句来组织和表示语言知识或其他知识。如:⑴if某个短语是由一个动词后接一个名词所组成,then这个短语就是动名短语。⑵if..
扩充转移网络(语言):简称ATN。自然语言自动分析或生成的模式之一。在递归转移网络(RTN)的基础上加以扩充而成。RTN的缺陷有二:一是只能分析出输入句的句法结构,不能理解句中各成分的语义关系;二是不能排除诸如英语中的不..
文化历史发展论(语言):一种关于人类所特有的,以语言和符号为中介而形成的高级心理机能的理论。由苏联心理学家维果斯基及其学生鲁利亚和列昂捷夫于本世纪二十年代所倡导。他们认为,感觉、知觉、不随意注意、机械记忆、形..