有同事在公司的OA上發了個貼子,介紹在javascript中如何得到中英文混合字串的長度。
用的是正規表示式。
var str = 」坦克是tank的譯音」; 🎜>var len = str.match(/[^ -~]/g) == null ? str.length : str.length str.match(/[^ -~]/g).length ;
我查了一下書,有點明白了:
西文常用字符集由空格“ ”(0x20)到“~”(0x7e)構成,漢字會落在這個字符集外,而正規表示式[^ -~]表示除空格到“~”外的字元集。
string.match(regex) 會以陣列形式傳回字元字串string中符合正規表示式regex的子字串,所以,
str.match(/[^ -~]/g)會以陣列的形式傳回一個個漢字。例如
var str = "dd大哥";
//顯示"大,哥",數組傳回兩個漢字,數組長度為2
alert(str.match(/[^ -~] /g));
這樣,var len = str.match(/[^ -~]/g) == null ? str.length : str.length str.match(/[^ -~]/g).length ;就可以得到str的正確長度了。
在javascript中,一個漢字的長度也被計算為1,常常在提交到資料庫中造成長度超標的錯誤,現在用這個方法,可以在提交前先檢測一番了。
註:以上代碼有些符號有問題,經修正後,改為如下函數。
function get_strlength (str)
if (str.match(/[^ -~]/g) == null)
{
len = str.length;
}
else
{
len = str.length str.match(/[^ -~]/g).length;
}
return len;
}