|
主题: 请教GetWord和中英文的问题
|
spartutu
职务:普通成员
等级:1
金币:0.0
发贴:82
|
#12003/9/8 20:50:10
比如说 String:="China Beijing北京" word:=getWord(2,String) word的值是 Beijing,而不是 Beijing北京 为什么
|
滨滨
职务:版主
等级:4
金币:13.0
发贴:1931
|
#22003/9/8 23:34:34
该函数不支持中文
|
spartutu
职务:普通成员
等级:1
金币:0.0
发贴:82
|
#32003/9/9 7:37:58
但是我试了word:=getWord(3,string) 返回值是 北京
|
DoDoDo
职务:普通成员
等级:1
金币:2.0
发贴:174
|
#42003/9/9 8:49:42
getWord是按空格来区分的,如: String:="China, Beijing,北京" word:=getWord(1,String) word的值是" China," 好像中文和英文在一起时,电脑自动把它们认为是不同的word。
|
滨滨
职务:版主
等级:4
金币:13.0
发贴:1931
|
#52003/9/9 11:35:41
中文分词是一个比较困难的事,需要人工智能以及庞大的词汇库,因为中文之间没有空格。到目前为止,我们还是没有完全解决类似“中华,人民,共和国”与“中,华人,民,共和国”,"物理,论坛"和“物,理论,坛”这种歧义问题。
|