2013년 7월 8일 월요일

talent open studio에서 Apache Access Log 정규식 파싱하기

talent open studio로 Apache로그를 로딩할때  기본 컴포넌트로 커스텀 로그 로딩이 않되는 경우가 있다..
이 경우 정규식 컴포넌트로 진행했다.
정규식 입력시 java 코드를 참고하여
"정규식" + "정규식"  .... 방법으로 넣어줘야 에러가 안난다. 정규식만 집어 넣고 줄 띄우기 하려면 한줄에 쭉~ 넣어줘야 하는데...그것보다는 ""로 묶어서  +로 연결하는게 좋을듯
/tApacheLogInput   (아파치 로그 컴포넌트)
기본 아파치로그 컴포넌트 정규식  (아파치 로그 컴포넌트로는 이것만 로딩 할 수 있는것 같다....
"^([\\d.]+) (\\S+) (\\S+) \\[(\\d{2}/\\w{3}/\\d{4}):(\\d{2}:\\d{2}:\\d{2}) ([+\\-]\\d{4})\\] "+
"\"([A-Z]+) (.+?) (.+?)\" (\\d{3}) (\\d+) ?\"?([^\"]*)\"? ?\"?([^\"]*)\"?"
/tFileInputRegex (정규식 컴포넌트)
아파치로그 커스텀에 대한 정규식
"^([\\d.]+) (\\S+) (\\S+) \\[(\\d{2}/\\w{3}/\\d{4}):(\\d{2}:\\d{2}:\\d{2}) ([+\\-]\\d{4})\\] "+
"\"([A-Z]+) (.+?) (.+?)\" (\\d{3}) (\\d+) ?\"?([^\"]*)\"? ?\"?([^\"]*)\"? "+
"?\"?([^\"]*)\"? ?\"?([^\"]*)\"? (\\d+)"

P.S 기본 컴포넌트로 밀어넣을때는 3000건/sec  가까이 나오던것인 정규식으로 바꾸니 94건/sec가 된다...성능 엄청 떨어짐

댓글 없음:

댓글 쓰기

본 블로그의 댓글은 검토후 등록됩니다.