中文乱码的原因:解码方法和编码方法不一致。一个中文字符将由utf-8编码转换为三个byte,如果使用gbk编码,则转换为两个byte;用utf-8编码将一个英文字符转换为一个byte,如果用gbk编码将其转换为一个byte。先说说什么叫乱码不知道有没有人这么认为,一个字符串不仅包含字符,还隐藏着它的编码信息。例如,java中的string str =