政府网站普查监测小技巧,“为什么很多政府网站群负责人说网站群普查考核加入更新量指标吃力不讨好,总有对更新量数据准确性的投诉?”
虽然网站更新量监测是政府网站监测考核的核心指标,但宜采用“大时间跨度全站更新情况定性统计”或“全站更新量历史回溯统计”方法,不宜做“每日精确统计”,因为网站更新量统计在较小的时间跨度内,无法实现精确统计。我们认为这其中的原因很复杂,有技术实现问题,也有人为因素,其中人为因素更多。举例如下:
■ 有分站因为业务流程原因、或为了争取普查监测达标,或者为了取得更好监测考核成绩,可能会在月底最后一天将前三十天数据一并补录到网站上,而发布日期则被人为分散在1-30日,这造成按日统计的更新量监测软件对该分站之前每天的监测结果出现漏报。这种“补录信息”情况在网站普查监测中并非个案,有相当大比例的网站会因各种原因采用这种网站更新方式,也不能说这种方法是“考核作弊”。此种更新方式造成的“更新量准确性投诉”是最多的,从技术角度也很难避免。
■ 还有分站将同一信息在多个栏目多次发布,造成认定规则歧义。网站更新软件一般将页面地址相同的信息视为一条信息,但有些网站因各种原因对同一条信息在不同栏目中进行引用,造成软件数量计算上的“漏报”,或者是“信息的栏目归类错误”。此类投诉数量居于第二。
■ 分站频繁的栏目格式变动或改版也是造成更新量监测数据不准原因。目前的网页扫描软件,如果要得到精确栏目更新量数据,一般都采用人工配置栏目映射的方法。但是如果目标网站栏目调整,而栏目配置没有随之调整就会造成网页抓取漂移,栏目更新量统计错误的情况。对于大型网站群(有近百个分站),这种网站栏目或格式调整造成漂移的情况几乎每周都会发生,无法确保每次分站改版都能第一时间告知监测单位及时变更栏目配置。这也是造成网站更新量监测不准的重要原因。
以上几点可以充分证明“实时精确的更新量统计”在实际操作中难以实现,或者要付出极大成本,“非不为也,实不能也”。
|