Rumah > Soal Jawab > teks badan
java 如何判断 一个 字符串 是否 被 urlencode 过?
为了防止重复endcode
黄舟2017-04-17 10:59:10
urldecode一下,decode前后一致即未encode过,前后不一致即encode过。(具体原理可参看URLDecoder的源码)
看了其他几位同学的回答。简单的补充一下:
1、对于"a-z", "A-Z", "0-9", ".", "-", "*", "_",encode/decode前后不产生任何变化,所以实际上无需判断;
2、" "被转换成"+",如果原字符串本来就含有"+",上述方法无效;
3、其他的字符,根据不同的字符集先被转换成一到多个byte,然后每个byte被表示成类似"%xy"的字符串,其中xy是该byte值的16进制表示形式。所以对于原字符串本来含有"%"或者"%xy",上述方法也无效,对于"%xy",如果xy为非法字符,则会抛出IllegalArgumentException。
所以如果需要得到精确的结果,需要自己另加额外的控制标志位。
黄舟2017-04-17 10:59:10
仅仅比较decode后的字符串是否一致的做法并不正确,当你的字符串包含%字符但不是合法的转义字符时,URLDecoder.decode会抛出异常。事实上并没有一个非常直接的办法。除非加上一些附加的判断条件。比如做一个URLEncodedString类,或者在字符串里面加一个自己的特殊前缀等等。
迷茫2017-04-17 10:59:10
这种事情靠的是约定、良好的设计,url编码本身没法识别。
举例来说,如果原字符串是 A%20B 或者编码后的字符串是 abcd ,都是没法识别的。
如果一定要这么做的话,那你只能把它变成你自己的url编码,增加一个额外的标志。