Algorithm 版 (精华区)

发信人: ssos (存在与虚无), 信区: Algorithm
标  题: 词的分类标准是什么?
发信站: 哈工大紫丁香 (2001年06月30日19:47:08 星期六), 站内信件

词的分类标准是什么?
一个等价关系给出一个分类,反之,一个分类决定了一个等价关系。词性分类的定义是
什么呢?如果C是集合S的一个“分类”,按照定义,要求任意两个不同的类之间的交为
空集且所有的类的并集为全集S。就我所知,词性的分类至今没有一个令人信服的定义:
这个问题太复杂了,因为涉及句法和语义中诸多困难方面。弗雷格组合原理是针对语义
单元而言,在一个自然语言的语句中,语义单元比词更接近句法分析所要求的层次。
英语与汉语都面临着同样的语义单元的定义的困难,让机器去自动地切分就更谈不上了
(分析一个含有 computer network 的语句,机器要把 computer和 network 捆绑在一
起,首先必须“理解”该语句,这似乎有点儿象小猫绕着圈儿追自己的尾巴)。自然语
言并不是连续的,每个语句都象一组咬在一起的齿轮,人类有这样的能力(它是上帝赋
予的):知道如何去把这些齿轮分开或把诸多的齿轮扣在一起使之运转。
计算语言学面对的是计算机,如果人都没能搞清楚词性为何物,词性分类的形式化的定
义,如何教会机器去识别它们?
传统词性定义的合理性值得怀疑,凭什么这样定义?是出于统计呢,还是完全人为的规
定。自然语言不同于计算机语言,它的丰富的结构也决不是象计算机语言那样“简单”
(事实上,计算机语言的句法语义分析理论也不简单):先有句法后赋语义,自然语言
的句法和语义象是一对共生的东西,我不知道按照“句法”的定义,其研究对象到头来
是不是为空集(或是一个极不重要的小的集合)。如果计算语言学的基础理论的支撑不
稳固,它的前途就很渺茫。
厨师对厨房里的东西的命名不一定比一个外行的命名“好用”,例如,完全可以用1、2
、3……来命名“酱油”、“醋”、“啤酒”……。但厨师对它们的分类一定比外行的要
“好用”。什么东西可以用来做“酱焖茄子”,什么可以用来做“红烧鲤鱼”……。“
命名”不等于“分类”!例如,命名Cutepig为“聪明猪”并不等于给Cutepig分了一个
“聪明猪”的类。即一个命名只是一个标记,没有结构与联系;一个分类则意味着类中
的元素有某种值得研究的联系(“万物皆有联系”与“万物皆无联系”没有什么可争的
,都是假设)。命名的对象可以是具体的个体,也可以是一个抽象的类。当我们提到“
醋”的字眼时,一般是指一个类,而不是一个个体。
例如,“聪明猪不喜欢吃醋”
我猜想你可能是指类的命名吧。如果是这样,分类在先,类的命名在后。但对个体的命
名,情形就不同了。 如何定义分类的标准能更好地“描述”自然语言是个难题。有没有
比现有的分类更“好用”的呢?或者问得弱一点:现有的分类是如何给出的呢?总有个
来龙去脉吧。

--

   
<<社会契约论>>是一本好书,应当多读几遍
风味的肘子味道不错,我还想再吃它      

※ 来源:·哈工大紫丁香 bbs.hit.edu.cn·[FROM: 202.118.230.220]
[百宝箱] [返回首页] [上级目录] [根目录] [返回顶部] [刷新] [返回]
Powered by KBS BBS 2.0 (http://dev.kcn.cn)
页面执行时间:2.419毫秒