在 Java Web 应用程序中获取 UTF-8 编码
问题:实现 UTF-8 编码以支持非拉丁语文本和特定字符
环境:
- 开发:Windows XP
- 生产:Debian
- 数据库:MySQL 5.x
- 浏览器:Firefox2、Opera 9.x、 FF3、IE7、Google Chrome
解决方案:
-
配置Tomcat的server.xml:
-
CharsetFilter:
-
JSP 页面编码:
- 指定 JSP 页面的编码web.xml 或在每个页面添加以下元标记:
-
JDBC 连接:
- 使用 ?useEncoding=true&characterEncoding =连接中的UTF-8 URL。
-
MySQL 数据库和表:
- 使用默认字符集=utf8 创建数据库和表COLLATE=utf8_swedish_ci.
-
MySQL 服务器配置:
- 在 my.ini 中设置 default-character-set=utf8 (Windows) 或 my.cnf (Linux).
-
MySQL 过程和函数:
- 显式指定 UTF-8 字符集,例如:
创建函数...返回文本字符集utf8
处理 GET 请求:
- 默认情况下,URL 采用 Latin1 编码,导致非 ASCII 出现问题字符。
- 要解决此问题,请在 server.xml 中将 URL 编码定义为UTF-8。
- 指示浏览器使用元标记和请求标头读取 UTF-8 格式的页面。
GET 请求中的 UTF-8 与 Latin1:
- POST 请求以 UTF-8 编码
- 对于 GET 请求,虽然页面定义为 UTF-8,但某些字符可能仍以 Latin1 编码。这会导致混合编码,使得Web应用程序很难正确处理请求参数。
参考:
- http://tagunov.tripod.com/i18n/i18n.html
- http://wiki.apache.org/tomcat/Tomcat/UTF-8
- http://java.sun.com/developer/technicalArticles/Intl/HT TPCharset/
- http://dev.mysql.com/doc/refman/5.0/en/charset-syntax.html
- http://cagan327.blogspot.com/2006/05 /utf-8-encoding-fix-tomcat-jsp-etc.html
- http://cagan327.blogspot.com/2006/05/utf-8-encoding-fix-for-mysql-tomcat.html
- http://jeppesn.dk/utf- 8.html
- http://www.nabble.com/request-para meters-mishandle-utf-8-encoding-td18720039.html
- http://www.utoronto.ca/webdocs/HTMLdocs/NewHTML/iso_table.html
- http://www.utoronto.ca/webdocs/HTMLdocs/NewHTML/iso_table.html
http://www.utoronto.ca/webdocs/HTMLdocs/NewHTML/iso_table.html utf8-chartable.de/
以上是如何在 Java Web 应用程序中正确实现 UTF-8 编码?的详细内容。更多信息请关注PHP中文网其他相关文章!