无标题无名氏No.66503564 只看PO
2025-07-06(日)16:40:36 ID:jzcZJpY 回应
预先声明,我不懂任何语言学相关知识,因此以下观点均为纯粹主观看法
既然中文已经有了标点符号,那么书面语中同样应当加入空格用于分隔字词
毕竟就我个人而言,有些时候一些语句真的很容易引发误解,特别是万恶的网文屏蔽词词库( ˇωˇ)
无标题无名氏No.66503901
2025-07-06(日)17:42:16 ID: bELlJkj
对于一种语言,准确性很重要,但效率也不能忽视。这样的做法,牺牲了大量的效率换取少量的准确性,不是一件好事。毕竟100句话里能造成误解的可能不足5句,但你要改整个体系,那么这100句话都会受影响。
当然这不意味这种方式完全不被接纳,在日常的非正式交流中,你可以在你认为有歧义的地方加上空格,只要能帮助表达且不随意滥用,都是可行的。
我可以再举个例子,比如这整段话我用了两次转行来表示话题方向的转折。这显然不是任何正式的或者惯例的表达方式,但我认为这能够帮助你理解我的表达,并且没有造成额外的阅读障碍,那用就行了。
无标题无名氏No.66504553
2025-07-06(日)19:24:23 ID: coIvnpl
那 应该 分隔 到 什么 程度 呢 ?
说话 这个 词语 是 该 作为 一个 词语 存在 还是 分割 成 说 话 两种 成分 ?一个 句子 的 成分 又 该 怎么 确定 呢 ?
无标题无名氏No.66504643
2025-07-06(日)19:38:31 ID: HRGuesf
句子里放空格,你读的时候就会像看见逗号一样下意识的停一下,阅读效率是很低的。
对于一般的句子,如果一个人读不明白,我认为是他语文能力不过关“句读之不知”。
对于容易引发误解的句子,你只需要人工的给他打上空格就好了。例如“南京市长江大桥”,你可以为了严谨写成“南京市长 江大桥”“南京市 长江大桥”。
至于违禁词,你也不能指望一个网站匹配的时候还去用一下正儿八经的tokenizer,只能说适应他。这种东西,就算你打了空格也没法完全避免误判的。一来是一个词里面包含违禁词很正常,比如说“水【乳交】融”;二来是打空格避免违禁词是很常见的操作,匹配违禁词忽略标点符号,空格也是很正常的操作,没法完全避免。