一、前言
上面写了console的乱码问题,接下来写的是web中servlet中的问题,大楷我比较关心一点,因为遇到这个的情况多一些吧。直接开始吧。
二、jsp和servlet中的乱码问题
其实在java文件的编译的情况和(一)中的情况是一样的,不过这里是由WEB容器去调用JVM而已,那么我们得知道一些默认的东西
比如特别重要的:(摘要)
如果Servlet 在运行的过程中,需要接受从客户端传来的字符如:表单输入的值和URL中传入的值,此时如果程序中没有设定接受参数时采用的编码格式,则WEB 容器会默认采用ISO-8859-1 编码格式来接受传入的值并在JVM 中转化为UNICODE 格式的保存在WEB 容器的内存中。Servlet 运行后生成输出,输出的字符串是UNICODE 格式的,紧接着,容器将Servlet 运行产生的UNICODE 格式的串(如html语法,用户输出的串等)直接发送到客户端浏览器上并输出给用户,如果此时指定了发送时输出的编码格式,则按指定的编码格式输出到浏览器上,如果没有指定,则默认按ISO-8859-1 编码发送到客户的浏览器上。
注意是ISO-8859-1就行了,tomcat 5.0之前采用是由用户设置的编码方式解析,tomcat 5.0过后有个参数(useBodyEncodingForURI)被默认了false,就使用了ISO-8859-1解析了,这儿是配置中的关键。
<!--more-->
public class Hello extends HttpServlet { private static final long serialVersionUID = 4878915372815719687L; public Hello() { super(); } public void destroy() { super.destroy(); // Just puts "destroy" string in log } public void doGet(HttpServletRequest request, HttpServletResponse response) throws ServletException, IOException { //输入:设置请求编码格式 request.setCharacterEncoding("GBK"); //输出:设置响应编码格式 response.setContentType("text/html; charset=GBK"); PrintWriter out = response.getWriter(); out.write("
"); out.write("Hello, 中文!"); out.write("
"); } public void doPost(HttpServletRequest request, HttpServletResponse response) throws ServletException, IOException { //输入:设置请求编码格式 request.setCharacterEncoding("GBK"); //输出:设置响应编码格式 response.setContentType("text/html; charset=GBK"); //从请求中接收参数 String input_str = request.getParameter("input_str"); String url_arg = request.getParameter("url_arg"); //出错处理 input_str = (null == input_str) ? "" : input_str; url_arg = (null == url_arg) ? "" : url_arg; PrintWriter out = response.getWriter(); out.write("
"); out.println("您输入的字符串是:" + input_str); out.write("
"); //out.println("您的表单传递的URL参数是:" + new String(url_arg.getBytes("ISO-8859-1"), "GBK")); out.println("您的表单传递的URL参数是:" + url_arg); out.write("
"); } public void init() throws ServletException { // Put your code here }}