主题:  请教GetWord和中英文的问题

spartutu

职务:普通成员
等级:1
金币:0.0
发贴:82
#12003/9/8 20:50:10
比如说
String:="China Beijing北京"
word:=getWord(2,String)
word的值是 Beijing,而不是 Beijing北京
为什么



滨滨

职务:版主
等级:4
金币:13.0
发贴:1931
#22003/9/8 23:34:34
该函数不支持中文



spartutu

职务:普通成员
等级:1
金币:0.0
发贴:82
#32003/9/9 7:37:58
但是我试了word:=getWord(3,string)
返回值是 北京



DoDoDo

职务:普通成员
等级:1
金币:2.0
发贴:174
#42003/9/9 8:49:42
getWord是按空格来区分的,如:
String:="China, Beijing,北京"
word:=getWord(1,String)
word的值是" China,"
好像中文和英文在一起时,电脑自动把它们认为是不同的word。



滨滨

职务:版主
等级:4
金币:13.0
发贴:1931
#52003/9/9 11:35:41
中文分词是一个比较困难的事,需要人工智能以及庞大的词汇库,因为中文之间没有空格。到目前为止,我们还是没有完全解决类似“中华,人民,共和国”与“中,华人,民,共和国”,"物理,论坛"和“物,理论,坛”这种歧义问题。