【转】如何分析LOG日志
作者 席鑫淼
来源 www.ligangxi.com
浏览
发布时间 15/06/29
虽然市面上面有很多日志分析的软件,但是当我拿到一份日志文件的时候还是喜欢用excel来进行分析,因为excel可以使用筛选功能帮你轻松的从各个维度来分析你想要的数据。下面就用实例来告诉大家如何通过excel来分析LOG日志文件。
首先,我们点开一个日志文件,我们会看到很多密密麻麻的信息。如图:
然后,Ctrl + A全部选中日志文件信息,然后Ctrl + C,Ctrl + V复制粘帖到excel中。如图所示:
复制完了之后,选中A列,然后点击excel上方的工具栏,选择数据——分列,如图所示:
选择下一步:
勾选上空格,点击下一步:
然后点击完成,excel自动帮你把日志分列成功。如图:
按照上图所示的分列,A列为IP地址,B,C两列没有用处,可以隐藏掉。D,E两列为时间和时间,F列为所访问的地址,G列为服务器返回的状态,H列为访问文件的大小,I为访问来源,J列为访问的设备环境等。
接下来我们隐藏B,C,E这对我们分析数据帮助不大的三列,按住Ctrl,鼠标点击B,C,E三列,点击鼠标右键,选择隐藏。
隐藏完毕之后,我们选择第一行,点击excel工具栏数据——筛选,然后我们就可以按照我们的需求来分析日志文件了。选择筛选完毕后,excel数据列右侧会出现下拉框,如图:
比如我想分析百度spider都抓取了网站的哪些页面,我们点击J列的下拉框,选择文本筛选——包含,然后输入baiduspider,如图:
点击确定,结果如图:
F列的内容为百度spider所抓取的页面内容。如果想继续分析,某个栏目百度spider抓取了多少页面,如/miji/这个栏目,继续筛选F列选择文本筛选——包含,然后输入/miji/,结果如图所示:
如果要分析其他的维度和其他的搜索引擎抓取状况依次类推。