政府网站监测中的陷阱和严重错别字范围

目前,很多政府网站都关注国办对政府网站的普查通报,对其中一单项否决项“政府网站是否存在严重错别字”尤为重视。有一些不负责任的网站监测服务商误导客户,说政府网站有错别字不怕,只要没有在所谓的“严重错别字库”里就没事。真的是这样么?

北京网景盛世作为中央政府门户网连续8年的网站监测服务商,在此对“网站严重错别字”指标做一个解读。

一个政府网站的错别字是否严重,并非以在所谓严重错别字库里为准,而是以是否会引发网络和媒体炒作为标准。所谓“严重错别字库”只是一个空泛概念,并不真实准确存在,技术角度也无法实现。举个例子,有些厂商说把“领导小组”错写成“领导小姐”,这是严重错别字。那么把“协作小组”错写成“协作小姐”算不算严重错别字?“合唱小组”、“劳动小组”呢?以此类推,带有“小组”这个词汇的组合都可能成为严重错别字。这个错别字词库需要有多大?能穷尽所有可能么?

有些看似普通的错别字,如果出现在了重要的文件和特殊的位置,就不再是“普通错别字”,而是“严重错别字”!

举个例子,比如有媒体在头版把“市委书记致辞”错写成了“市委书记辞职”,“辞职”这个词没有写错,但是放在前后语境中就是一个巨大的文字错误。

再举个例子,如果一段话同时出现多个普通错别字,也很可能酿成重大网站事故。举例:某政府网站新闻标题里出现“某市长在市长办公会上严肃指出整顿市容环境得工作克不容援”。这短短二十多字的新闻标题里出现两个错误,每个错误单独拿出来都不算什么大事,但是集中在短短的一段话里,而且是领导发言,很可能会引发网络和媒体炒作。实际情况也如此,现在很多被新闻媒体爆料出来的政府网站事故,都是同一文章里出现多个普通错别字,被民众质疑工作责任心!

政府网站监测圈里一个潜规则就是用所谓低成本的“严重错别字”检测来替代“网站全部错别字”检测。“严重错别字”检测很容易,随便凑几十个严重的涉政治的错别字建个词库,扫一轮,就算检测完成,政府网站负责人对这种低成本检测方式的识别也很容易,因为这种方式检测出来的错别字数量非常少,大多数就是0。

而“网站全站错别字检测”则成本巨大,监测厂商不仅要用软件找出全部疑似错别字,而且要使用大量人工根据每个错别字所在上下文语境和文章性质、易炒作程度、做出综合判断。这种检测费时费力,但是消除政府网站文字安全隐患的效果最好。识别的方法也很简单,用这种“全站错别字”扫描的错别字一般很多,至少上百。

综上,政府网站的管理者,面对一些厂商给出的“严重错别字”数量为零, 应该保持高度警惕!