精华区文章阅读

发信人: ssos (存在与虚无), 信区: Algorithm
标  题: 词的分类标准是什么？
发信站: 哈工大紫丁香 (2001年06月30日19:47:08 星期六), 站内信件

词的分类标准是什么？
一个等价关系给出一个分类，反之，一个分类决定了一个等价关系。词性分类的定义是
什么呢？如果C是集合S的一个“分类”，按照定义，要求任意两个不同的类之间的交为
空集且所有的类的并集为全集S。就我所知，词性的分类至今没有一个令人信服的定义：
这个问题太复杂了，因为涉及句法和语义中诸多困难方面。弗雷格组合原理是针对语义
单元而言，在一个自然语言的语句中，语义单元比词更接近句法分析所要求的层次。
英语与汉语都面临着同样的语义单元的定义的困难，让机器去自动地切分就更谈不上了
（分析一个含有 computer network 的语句，机器要把 computer和 network 捆绑在一
起，首先必须“理解”该语句，这似乎有点儿象小猫绕着圈儿追自己的尾巴）。自然语
言并不是连续的，每个语句都象一组咬在一起的齿轮，人类有这样的能力（它是上帝赋
予的）：知道如何去把这些齿轮分开或把诸多的齿轮扣在一起使之运转。
计算语言学面对的是计算机，如果人都没能搞清楚词性为何物，词性分类的形式化的定
义，如何教会机器去识别它们？
传统词性定义的合理性值得怀疑，凭什么这样定义？是出于统计呢，还是完全人为的规
定。自然语言不同于计算机语言，它的丰富的结构也决不是象计算机语言那样“简单”
（事实上，计算机语言的句法语义分析理论也不简单）：先有句法后赋语义，自然语言
的句法和语义象是一对共生的东西，我不知道按照“句法”的定义，其研究对象到头来
是不是为空集（或是一个极不重要的小的集合）。如果计算语言学的基础理论的支撑不
稳固，它的前途就很渺茫。
厨师对厨房里的东西的命名不一定比一个外行的命名“好用”，例如，完全可以用1、2
、3……来命名“酱油”、“醋”、“啤酒”……。但厨师对它们的分类一定比外行的要
“好用”。什么东西可以用来做“酱焖茄子”，什么可以用来做“红烧鲤鱼”……。“
命名”不等于“分类”！例如，命名Cutepig为“聪明猪”并不等于给Cutepig分了一个
“聪明猪”的类。即一个命名只是一个标记，没有结构与联系；一个分类则意味着类中
的元素有某种值得研究的联系（“万物皆有联系”与“万物皆无联系”没有什么可争的
，都是假设）。命名的对象可以是具体的个体，也可以是一个抽象的类。当我们提到“
醋”的字眼时，一般是指一个类，而不是一个个体。
例如，“聪明猪不喜欢吃醋”
我猜想你可能是指类的命名吧。如果是这样，分类在先，类的命名在后。但对个体的命
名，情形就不同了。如何定义分类的标准能更好地“描述”自然语言是个难题。有没有
比现有的分类更“好用”的呢？或者问得弱一点：现有的分类是如何给出的呢？总有个
来龙去脉吧。

--


<<社会契约论>>是一本好书,应当多读几遍
风味的肘子味道不错,我还想再吃它

※ 来源:·哈工大紫丁香 bbs.hit.edu.cn·[FROM: 202.118.230.220]

Algorithm 版 (精华区)