在《javascript语言精粹》一书中，js正则表达式剔除重复的单词出错，什么原因？

Question

以下是我按照《javascript语言精粹》一书中的代码写的demo，我想做的事情是历遍文本，把文本中出现的所有单词以只出现一次的形式打印出来（我不知道书中说的“doubled_words”是不是这个意思，不管是不是了，我现在...

大家讲道理 · Answer

不知道你说的“没达到要求”是指什么，不过这个正则，确实是去除重复单词了。

var textRegExp = /([A-Za-z\u00C0-\u1FFF\u2800-\uFFFD'\-]+)\s+\1/g;//定义一个重复的单词

文字匹配后的+，会有点错误，可能导致两个相邻的不同单词，前一个单词的结尾和后一个单词的开头的相同字母被删除。
改成

/([A-Za-z\u00C0-\u1FFF\u2800-\uFFFD'\-]{2,})\s+\1/g

会好点