正規表現を使用して置換します:
コード スニペット:
String documentTxt = EntityUtils.toString(entity,"gbk");//データを取得します
documentTxt=documentTxt.replaceAll("[\t\n\r]" , "");//コンテンツ領域の復帰と改行を削除します
説明: String クラスの replaceAll には、通常の置換関数があります。 t はタブ文字 n はラインフィード r はキャリッジリターン
Java 正規表現の使用法:
メソッドの例:
public void parseTxt(String content){ Pattern p = Pattern.compile(Config.articlePtn); Matcher matcher = p.matcher(content); while(matcher.find()){ System.out.println(matcher.group(1)); } }
説明: Pattern クラスを覚えておいてください。その静的メソッドは、正規表現を解析して Pattern オブジェクトを生成します。
次に、モデルを使用して文字列を照合し、Matcher を取得し、Matcher の find メソッドを通じてすべての一致を走査します。
groupは正規表現、()式のグループです。 group(0) は元の文字列、gourp(1) は最初に一致したグループです。つまり、一致したグループのインデックスは 1 から始まります。
文字列内のキャリッジリターンとラインフィードを置き換えるその他の Java メソッドについては、PHP 中国語 Web サイトに注目してください。