每次输出日志前需要判断日志的级别吗?

早期使用log4j/common-logging的时候,出于性能的考虑(非该级别,字符串拼接造成的额外开销),会将判断日志级别作为一种编码规范:

if(logger.isDebugEnabled()){
   logger.debug("debug information: " + xxx);
}

后来slf4j接口里为了避免过早字符串拼接可能引起不必要的开销,将其推迟到了要打印的时候才拼接,可以不必显式的加一次if判断:

logger.debug("my name is {}", name);

但是问题是即使用的是slf4j的api,应用中并不能保证大家都采用format形式的写法,依然很多用加号直接拼接字符串的情况。所以简单的原则是强制所有的日志都必须用if判断一下其级别,保持一致的写法。

关于日志框架还有几句想说的,在公司的野蛮生长阶段,如果一些基础设施不做约束,会对未来埋下很多隐患,迟早要为此付出代价。而在Java里最搞的就是日志框架了,五花八门。之前在做应用容器的时候,为了解决上层各种日志框架的不一致,做了很多奇技淫巧来适配,非常痛苦。如果你在有能力控制的时候一定要尽早控制。

btw,我们当前使用的日志框架是logback,完全满足当前的需求。尽管log4j2前段时间终于发布了,也看到它的一个性能比logback有很大提升,但它的异步实现是基于LMAX的Disruptor,引入这个库似乎过重,像是专门为当前流行的大数据业务所设计;等真的遇到吞吐问题再去考虑它吧。

查看多个节点上的日志:multitail脚本

日志分布在多个节点上,想要实时查看多个日志输出的话可以用这个脚本。这个脚本模拟了multitail的效果:

$ cat multitail.sh

#!/bin/bash
set -f

PROG_NAME=$0

usage() {
    echo "Usage: $PROG_NAME ip1,ip2,ip3... file1 file2 file3 ..."
    exit 1
}

if [ $# -lt 2 ]; then
    usage
fi

COMMAND="tail -f"

IP_LIST=$1
shift && FILES=("$@")

for file in ${FILES[*]}; do
    COMMAND="$COMMAND $file"
done

SED="sed"
if [[ $OSTYPE == *darwin* ]]; then
  which gsed 
  if [ $? -eq 0 ];then
    SED="gsed"
  else
    echo "mac os need gsed, please install gnu-sed." 
    exit 1
  fi
fi

for ip in $(echo "$IP_LIST" | tr ',' '\n'); do
  if [ ${#FILES[@]} -gt 1 ];then
    ssh user@$ip "$COMMAND" | $SED 's/\(==> \)/\1'"$ip:"'/' &
  else
    #ssh user@$ip "$COMMAND" | $SED '0~10a===='"$ip"'====' &
    ssh user@$ip "$COMMAND" | $SED 's/^/'"$ip "'/' &
  fi
done

CHILD_PIDS=$(ps -ef | grep $$ | grep -v grep | awk '$3=='"$$"'{print $2}' | xargs)

# CTRL-C to stop
trap 'kill $CHILD_PIDS >/dev/null 2>&1' SIGINT SIGTERM 
wait

使用方式:

$ ./multitail.sh 192.168.10.1,192.168.10.2 /data/app1/a.log /data/app2/b.log

可以配合ack命令对一些关键字高亮:

$ ./multitail.sh ip1,ip2 log1 log2 | ack --passthru login

注意,依赖ssh执行远程命令,所以前提是执行脚本的机器必须与目标ip打通ssh,不需要密码。