급변하는 인터넷 환경에서 웹 사이트의 성공적인 운영은 방문자들의 행위를 얼마나 잘 이해하느냐에 달려 있고 그 정보를 웹 로그 분석을 통해 얻을 수 있다.
웹 서버에 접속을 하게 되면 웹 서버의 로그파일에 그 기록이 남게 되고, 이는 단순히 접속이라는 데이터로 기록되며, 한 페이지의 HTML문서를 검색해도 접속은 해당 페이지에 포함된 다양한 형태의 데이터마다 기록을 남기게 된다.
이러한 하나의 데이터 이동을 접속(Hit)이라 한다면, 실제 사용자가 하나의 완성된 페이지를 보는 것을 검색(View)이라 한다. 그렇다면 우리는 특정의 사용자가 일정시간 내에 계속적으로 웹 서버를 검색하는 것을 방문(Visit)이라 할 수 있으며, 이러한 방문데이터가 통계분석의 대상이 되는 것이다. 이와 같이 통계분석을 위한 것이 웹로그인 것이다.
웹로그는 접속이라는 데이터를 기반으로 통계분석을 시작한다. 웹 서버는 대부분의 경우 웹 서버에 접속하는 모든 상태를 로그 파일에 저장한다.
로그파일에는 Access Log, Referrer Log, Agent Log 및 Error Log 파일 등이 있는데, 이러한 로그파일의 분석을 통하여 방문자의 파일 이용, 통신, 시스템 환경에 대한 정보를 추출할 수 있다.
Access log
웹사이트로의 트래픽에 대한 가장 기초적인 정보를 제공한다. 이는 브라우저가 사이트에 방문하여 처리한 내용에 대한 모든 기초적인 정보를 담고 있다.
방문자의 IP 또는 도메인 네임, 방문자가 파일을 요청한 시간, 방문자가 웹서버에 요청한 처리 내용(Get, Put, Head), 방문자가 요구한 파일의 이름, 파일의 크기 및 처리결과 등의 데이터를 제공하는 것이다.
Referer log
레퍼럴로그는 화살표로 표시되며 방문자가 사이트를 방문하기 위하여 어떠한 검색엔진을 활용하였으며, 사이트를 들어오기 위해서 어떠한 키워드를 검색하여 방문하였으며 방문자가 사이트를 방문하기 위하여 거친 URL경로는 어떠한 것이 있는지를 알 수 있기 때문에 검색된 키워드를 통하여 고객들이 원하는 컨텐츠를 구성할 수 있으며 검색엔진 과 링크페이지를 통하여 인터넷광고 매체선정 및 서치엔진 키워드구성 등의 프로모션 전략방안을 설정하여 타겟화된 웹 프로모션을 전개할 수 있다.
Agent log
에이전트 로그는 사이트를 접속하는 방문자의 웹 브라우저 타입 및 버전, OS(Operating System)의 종류 , 화면해상도 어플리케이션 프로그램종류등에 관한 정보를 제공해 최적화된 웹사이트를 구성할 수 있는 단서를 제공해주고 있다.
Error log
에러로그는 웹 서버의 오작동에 대한 모든정보를 포함하고 있다. 에러로그가 발생하는 경우는 파일이나 이미지들을 잘못 링크하여 존재하지 않는 파일인 경우나 CGI프로그램이 정상적으로 작동하지 않은 경우 서버의 퍼미션(Permission)설정을 제대로 부여하지 못하여 정상적으로 서버에 기록되지 못한경우등 이다. 에러로그가 30%을 넘어서게 되면 사이트 신뢰성에 치명적이기 때문에 에러로그를 참조하여 주기적인 사이트 점검을 통해 수정보완을 해줘야 한다.
웹분석은 이러한 파일들로부터 웹서버에 접속하는 사용자의 ID, 이름, 접속시간, 접속페이지, 에러 상태 등의 정보를 추출하여 분석함으로써 웹사이트 상에서 누가, 언제, 무엇을 어떻게 이용하는가를 한눈에 알아 볼 수 있는 보고서를 생성해 낸다.
이런 분석은 기업의 전반적인 시장조사 및 홈페이지 운영평가 자료가 되며, 배너광고 등 인터넷광고의 광고비 산출 자료, 인트라넷을 사용하는 기관에서는 사용자별 부서별 활용현황을 분석하고, 자료의 유출경로를 추적할 수 있는 보완시스템으로서의 역할도 수행한다는 점에서 중요한 솔루션으로 자리잡고 있다.