devilkate 发表于 2024-12-28 23:04:49

请教一下Mush里面中文处理报错的问题

RT
总有一些特殊的中文词汇虽然触发器可以触发 但是触发器抓到的文字就是乱码例如西湖的保俶塔中间这个俶 字降魔洞的“降”字还有各种奇奇怪怪的情况

最近正在做谍报的最后在留言板上留言的信息的文字处理   发现那几个固定格式的表达如果用触发器抓取的话就会由于暗语的文字以及地点和房间的文字多次碰到上面这种情况虽然触发器能正常触发 但是抓下来的变量信息都是乱码。。。。。

求教一下 这玩意儿怎么破啊很影响游戏体验啊

还有这个该死的谍报烟花经常显示不出来一个字的情况   我试过把MXP都关掉了 好像还是不好使。。。。。

hniu 发表于 2024-12-29 01:16:21

我一般这样处理:抓“青城山的降魔石”,然后在脚本处理即可。不要单独抓“降魔石”,其他的应该也可以类似解决

yelan 发表于 2024-12-29 01:22:46

就是不支持utf8的原因,比如那个降魔石,不是“降”有问题,而是降的后一个字符与魔的第一个字符组合成了“的”字,于是乎......哈哈

devilkate 发表于 2024-12-29 11:20:53

hniu 发表于 2024-12-29 01:16 AM
我一般这样处理:抓“青城山的降魔石”,然后在脚本处理即可。不要单独抓“降魔石”,其他的应该也可以类似 ...

所以说 干脆直接把整个一行文字的字符串抓下来 然后想办法确定要的字符串的位置 然后把他截取出来就不会有错了对吧   

devilkate 发表于 2024-12-29 11:21:30

yelan 发表于 2024-12-29 01:22 AM
就是不支持utf8的原因,比如那个降魔石,不是“降”有问题,而是降的后一个字符与魔的第一个字符组合成了“ ...

有啥办法能支持一下utf8么? Mush的话

hniu 发表于 2024-12-29 15:14:13

不用抓整行,抓部分即可,只是不要单独抓“降魔石”、“赵孟頫”、“保俶塔”

creat 发表于 2024-12-29 20:29:14

mush不建议用utf8,虽然可以用,但是不建议用
会存在要重新编码所有机器人和其他杂七杂八的问题

devilkate 发表于 2024-12-30 11:35:34

creat 发表于 2024-12-29 08:29 PM
mush不建议用utf8,虽然可以用,但是不建议用
会存在要重新编码所有机器人和其他杂七杂八的问题 ...

好的 感谢 了解了另外Mush里边关闭MXP是不是在这里啊 大佬 下拉菜单选择No-never?最近又被谍报烟花吞字搞的很焦躁啊。。。。。


data/attachment/forum/0590ca10ccfc5cd0206dc543fa004566.png

jarlyyn 发表于 2024-12-30 11:59:42

说真的,个人意见,既然你用lua,可以选择的情况下,就不建议用utf8。

如果用js这种原生支持unicode的语言还可以考虑。

不然你会发现很蛋疼。

剩下的就是机器制作的问题了。

另外就是建议不要过渡滥用正则表达式。

正则表达式本质上是一个表达字符串 外观的 描述文本。

优点是可以在任何支持文本的配置里使用。

但一般情况下还是要自己进行解析和配置的。

jarlyyn 发表于 2024-12-30 12:03:59

举个例子

你这个场景里

你的需求是,一串中文,其中有一个是的。

什么是中文,最直白的就是,在屏幕上占两个格子的,非字母数字

那么就是

[^A-Za-z0-9 ][^A-Za-z0-9 ]

多个中文就是
([^A-Za-z0-9 ][^A-Za-z0-9 ])+

你的场景就是

([^A-Za-z0-9 ][^A-Za-z0-9 ])+(的)([^A-Za-z0-9 ][^A-Za-z0-9 ])+
页: [1] 2
查看完整版本: 请教一下Mush里面中文处理报错的问题