消息树

  • 本站不支持 IE6, 请用 Google Chrome 或是 Firefox 等更加现代、安全、快速的浏览器!

JAVA环境中处理中文字符

| 1 评论

周末上线一个应用,具体功能是由客户端通过调用WEB服务,将一段xml格式的数据传输给服务器,使用HTTP协议。这个应用在线上已经运行很久,最近只是做了轻微的修改。客户使用时反馈,有时会出现中文字符乱码,我一直以为是客户填写的时候编码有问题,没有在意,周一让同事处理这个问题,web服务很多方面都在用,所以主要找客户端的问题。

等快下班的时候,这个问题还没有搞定,我原以为不是多大的事情,就跟同事一起来梳理,同事说,其中有电话号码一项,填8位就不会出错,填少了会出错。我想那也太诡异了,决定一点点找,先是用tcpdump截取了客户机发出的以及服务器接收到的报文信息,对比,然后又查看对应汉字的编码,都是正确的。因为已经到下班时间,就让同事先走,一个人排查。既然报文是正确的,那么肯定不是客户端的问题了,可是我们服务端那么多人用了好多个月,怎么会出问题呢。无奈,翻出代码来看,发现其中有这么一段:

byte[] b = new byte[1024];

int i = 0;

while ((i = in.read(b)) != -1) {

buf.append(new String(b, 0, i, "UTF-8"));

}

这段代码是用来收取信息并编码成string的,联系之前的一些现象,马上判断出,是byte[]有问题,定了1024的长度,如果恰好把一个汉字分成两次处理,就出问题了。于是给同事发邮件,按这种思路修改。

现在想来,之前这个应用一直有问题,只是客户传送的信息中汉字较少,所以没有暴露出来,而解决问题时太主观,没有考虑服务端还会有这么低级的错误。

Oracle中sysdate的时区偏差

| 2 评论
国庆前有个应用上线,让DBA装了一个双机的Oracle RAC,装好后发现数据的sysdate不太对头,和机器时间差了16小时。这个问题后来解决了,也不复杂,只是这个过程异常曲折。
网上有很多帖子说到了这个问题,操作系统本身的时间是正确的,Oracle里的current_date、current_timestamp都是正常的,就是sysdate有问题。提供的解决方法都是类似的一条命令:
srvctl setenv database -d <dbname> -t TZ=EAT-8
看起来容易理解,差了16小时,可能是时区不对,于是把时区改成东八区(EAT-8),可DBA试了几次,都不见效果。其间也请教过其他人,也怀疑过是不是操作系统装的有问题,打算重装系统。直到在网上看到另外一段资料,才明白了其中的奥秘。
Why is my SYSDATE time not the same as my system clock on Unix? Sysdate is just a system call to the OS to get the time (a "gettimeofday" call).
Sysdate does NOT use timezones in the database (select dbtimezone, sessiontimezone from dual . But OS (unix level) TZ settings DO alter the time that the OS will pass on to Oracle.
To debug:
telnet to the unix box and connect using sqlplus in the telnet session:
1) once trought the listener using a tnsnames alias
select to_char(sysdate,'DD-MON-YY HH24:MI:SS') from dual;
2) once trough a "local" ORACLE_SID connection
select to_char(sysdate,'DD-MON-YY HH24:MI:SS') from dual;
if the result is different then it means that the listener is started with a different TZ
then you current user env ->; stop and start listener with the TZ you want .
If you are using RAC then use 'srvctl setenv database -d <dbname>; -t TZ=<the TZ you want>;' to define the correct TZ.
这段文字说sysdate是调用操作系统里的gettimeofday函数,不依赖oracle数据库里设置的时区,用的是操作系统的时区。而对linux来说,就是环境变量里设置的时区。按照这个解释,运行之前命令是正确的,问题就出在TZ的值上。
运行命令
cat /etc/sysconfig/clock
看到的时区是Asia/Beijing,而不是EAT-8,再到系统目录/usr/share/zoneinfo下查询,发现没有EAT-8。于是修改以前的命令,把TZ设成Asia/Beijing,问题解决。
在此之前,已经有人有过这方面的提示,只是当时不是很清楚数据库里面的机制,误打误撞,总是设不对,明白原理之后,也就有的放矢了。

最近收到的评论

联系方式|Contact Me: @Fengbin
文责声明|Responsibility: 本站内容仅代表个人观点,与其他任何组织、公司无关。

标签

订阅

博客归档

友情链接