我遇到了编码问题.不确定它是否与IDE有关,但我使用的是NetBeans 7.4.我在J2EE项目中得到了这段代码:
String test = "kukuřičné";
System.out.println(new String(test.getBytes("UTF-8"))); // should display ok
System.out.println(new String(test.getBytes("ISO-8859-1")));
System.out.println(new String(test.getBytes("UTF-16")));
System.out.println(new String(test.getBytes("US-ASCII")));
System.out.println(new String(test.getBytes("windows-1250")));
System.out.println(test); // should display ok
当我运行它时,它永远不会正常显示. UTF-8应该可以打印出来,但不是.当我尝试时:
System.out.println(Charset.defaultCharset());
它返回了windows-1252.该项目设置为UTF-8编码.我甚至尝试在UTF-8中重新保存这个特定的java文件,但它仍然无法正常显示.
另一方面,我试图创建J2SE项目,当我运行相同的代码时,它正确显示.默认字符集也返回UTF-8.
两个项目都设置了UTF-8编码.
我希望我的J2EE项目像J2SE一样运行.直到我将我的java更新到版本1.7.0_51-b13之前我才注意到这个问题但是我不确定这是否相关.
我也尝试过为整个IDE设置默认编码:-J-Dfile.encoding = UTF-8但它没有帮助.
我注意到一个重要的事实.当我创建一个新的Web应用程序时,它显示正常.当我创建新的Maven Web应用程序时,它显示不正确.
我还没有修好它.仍然没有解决方案.
在我的pom.xml中,编码设置正确,但最后仍显示windows-1252.
UTF-8
我遇到了编码问题.不确定它是否与IDE有关,但我使用的是NetBeans 7.4.我在J2EE项目中得到了这段代码:String test = "kukuřičné";System.out.println(new String(test.getBytes("UTF-8"))); // should display okSystem.out.println(new String(test.getBy...
配置情况: Win7 x64 英文版系统软件平台:
Java
8
在DOS环境下编译
Java
程序时,因为程序内有中文字符,提示Gp
1252
错误,百度之。结论是由于
编码
问题,需要把系统
编码
改为
UTF-8
。方法如下:
在环境变量
修改
中 新建系统变量 变量名”
JAVA
_TOOL_OPTIONS 变量值为:-Dfile.encoding=
UTF-8
修改
完后重启电脑(网上有
今天爬虫运行的时候,发现保存下来的HTML页面偶尔有乱码,访问页面发现页面的字符
编码
是gb2312,而我用Cpdetector
编码
识别后的结果是
windows
-
1252
,所以下载的时候按照
windows
-
1252
去下载便会出现乱码的情况。
百度了一下发现:国人们往往将gb2312与gbk
编码
等同,某些已经使用了gbk
编码
里的字符的,仍然声称内容为gb2312
编码
。而某些
编码
识别类对gb2312编