java 字符串输出到控制台乱码问题

获取到的HTML源文件的编码为gb18030
将源文件输出到console时中文的部分会出现乱码如：
<div class="tf no">
<u tabindex="0" class="black tt ">�ʼ��˵� -- ��估��ϵͼ</u>

经过bytes转换后输出到控制台仍是乱码：
Document doc = Jsoup.parse(lr.getHtml());
byte[] bytes = doc.toString().getBytes();
String str = new String(bytes);
str = new String(bytes,"gb18030");
System.out.println(str);

控制台输出：
<div class="tf no">
<u tabindex="0" class="black tt ">锟绞硷拷锟剿碉拷 - 模锟酵硷拷锟斤拷系图</u>

实际的源文件：
<u tabindex="0" class="black tt ">zhangqiu: 考勤</u>

求大牛指教菜鸟程序猿不胜感激！
多谢各位大牛你们说的我都试过了但还是没有成功

举报该问题

第1个回答 2014-07-04

str = new String(bytes,"gbk");
//如果不行，那就utf-8试试。

追问

试过了没成功。。。

追答

试试unicode，如果还是乱码的话请把源文件发我。
doc.toString().getBytes("gbk");下面不要转码了，你试试。

本回答被提问者和网友采纳

第2个回答 2014-07-04

System.out.println(new String(str.getBytes("UTF-8"),"ISO8859-1")) 试试追问

试过了不行啊

追答

gbk呢

第3个回答 2014-07-04

用的什么软件，如果是myeclipse或eclipse的话，软件的编码也要一致追问

myeclipse10 run里面是默认的我没改过

相似回答

java控制台中文乱码怎么解决答：产生原因：因为这个开源项目的默认字符编码不对，所以控制台的字符编码也自动变成了UTF-8，而键盘的输入流的默认格式是GBK格式，这样就造成了在GBK转UTF-8的过程中产生的奇数乱码错误（这个问题的解释可以在搜索引擎找到）。解决办法：1.在代码区域右键 -> run as -> run configurations -> common(右侧...

eclipse中java中文控制台输出的这种乱码怎么解决答：eclipse中java中文控制台输出的这种乱码解决方式：一、（1）打开eclipse或myeclipse，点击run-》runconfigurations 如图提示，改成UTF-8，有的eclipse或myeclipse有可能需要gbk的形式，不同形式改成不同的编码，尝试一下即可。（2）Arguments也需要更改一下。二、方法如下：打开eclipse.ini文件（在eclipse的安...

java 字符串输出到控制台乱码问题答：str = new String(bytes,"gbk");//如果不行，那就utf-8试试。

eclipse中java中文控制台输出的这种乱码怎么解决答：这不是乱码，原因很明显，索引String数组错误，将最后一个for循环里面的zfc改成zfc[j]即可。

为什么java 用IO流读docx文件里的内容打印在控制台是乱码答：肯定是乱码啊...那是因为docx 里面的东西其实进行过某些格式整合到一起的文件你可以把一个word文件的后缀改成zip 解压缩打开看一下就知道...java读取docx里面的东西可以使用 poi ，具体怎么做可以在网上搜一下

java字节文件复制我明白在控制台输出中文乱码因为读了1个字节就输出...答：出现问题的原因是字节流中每个汉字是两个字节，所以肯定会出现乱码的，要将字节流通过BufferedReader变成按行读取的就可以了。BufferedReader bre = null;try { String file = "D:/test/test.txt";bre = new BufferedReader(new FileReader(file));//此时获取到的bre就是整个文件的缓存流 while ((...

java io怎么读取文件并输出到控制台上?答：直接说问题原因：你只定义byte数组，但没有把文件流放入到数组中，所以打印的string字符串内容是一串空格（看我图1）。解决方法：int len = fis.read(); read 方法加入参数bys，这样才能把fis的内容注入bys里面。顺便说下，FileInputStream不能正确输出中文，因为这个是按字节输出的，每个中文站2个字节...

大家正在搜

从控制台获得一个字符串 tomcat控制台中文乱码解决用DOS命令编译Java出现乱码 java常见乱码

java控制台输出乱码

java初学者关于DOS控制台输出中文时乱码的问题

java输入输出流乱码问题，求解为什么在控制台输入字符串和布...

java控制台打印乱码

JAVA String 将byte数组转换成字符串，执行后控...

java控制台输出时多了16个字节的乱码

使用java语言，怎么在控制台打印输出一段字符串？

java中如何获取System.out.print打印在控制...