谢谢您的支持,关心和投票.
关于家园国内访问困难的原因分析:
有足够的迹象表明 家园的 某个URL 字符串被 关键字 过滤了
这种过滤并非始于今日或者两天前, 而是无处不在。 比如 在 imm-diy 论坛 最新有大约5个帖子谈论家园访问困难的问题。 而笨笨的电脑 对这几个帖子也存在访问困难(能够正常的访问版面浏览,然而打开这几个帖子后,会突然reset,然后与imm-diy失去链接10分钟,才能再次访问)。
联系到最近数月来,家园不少会员报告打开很多帖子时出现这种现象。 俺们开始或怀疑是帖子的问题,或怀疑是论坛数据库的问题,或怀疑是cookie的问题 ... 现在有理由相信,这或许和关键字过滤有关。 而更进一步的猜想是:
相信这种过滤存在累加效应和评分体系,当来自某个网站的过滤内容累加到一定数量后,整个系统将会自动提升网站的过滤级别,日积月累,最终导致网站URL,甚至IP被过滤
家园邀请国内的所有会员报告: 当您访问家园绝大部分帖子一切正常,但访问某个帖子却可重复的导致您与家园论坛的连接中断 超过10分钟 的情况, 您的报告将使家园更加safe!
技术漫谈之二: 关键字过滤
在千兆以上的带宽中(比如主干路由上),监听和过滤所有的信息,普通软件级别的过滤技术是不行的。需要在骨干路由器上有这样的设备。CISCO等公司高级的路由设备中,就提供了这样的系统,最主要的就是IDS(Intrusion Detection System)--- 入侵检测系统。它能够从计算机网络系统中的关键点收集信息,并分析这些信息,检查网络中是否有违反安全策略的行为。
这样的设备能够干甚么呢?他能够检测所有经过的网络数据,如果数据内容有匹配的关键字的话,就可以进一步分析,然后决定对该数据流的处理。比如说吧,用户想到XXX的网站看英语新闻,
http://www.XXX.com/ 。输入这个地址后,那么浏览器会发出一个网络请求,其中就包含著XXX这样的字符。那么这个请求到真正的网站之前,就会经过路由的检测系统。如果系统设置了XXX为关键字,那这个网络数据流就会被检测到。然后路由器会给用户和网站都发送一个重置(reset)的数据包。然后用户就会看到页面无法显示。一般检测设备可能会保持这个用户和这个网站的重置(reset)状态大约十几分钟,然后又恢复正常状态。这个时候用户又可以连上这个网站了。
这样的系统有几个弱点,一个就是IDS的反应都有延迟,因为IDS从抓取数据包,监测关键字,产生RESET包,到最后发出RESET整个过程都要消耗一定的时间。所以在实际用户浏览中,可能会遇到这样的情况,可以看到第一页或者是开始几个连接,但过几十秒后就是页面无法显示。
再一个弱点就是有很大的误报率,不过以宁枉勿纵的态度,只要偷偷的做,一般人也不会知道。即使有人抱怨,也可以说是电信的甚么临时故障等等,一推了之。
再一个就是这样的监测,在数据流量很大的时候,会拖慢整个网络。
从具体应用的角度讲,它主要有3个方面可以过滤。第一个是网址的过滤,就是过滤网络地址中的关键字。比如第一次Google然后又恢复的时候,「网页快照」功能不好使了!想进一步具体浏览的网址也可能出现页面无法显示的现象。它能够实现这样,就是所有的Google的默认快照的网址中,都有类似这样的字符串
http://216.239.59.104/search?q=cache: ,其中的Search?q=cache就被过滤了。 如果用户手动把其中的「search」改为「custom」,那就又可以看到快照功能了。
第二个是对网页内容的过滤。网址的数据量在具体的网络流量中是很少的,监测所消耗的资源也可以容易承受。而对所有网页内容的监测,这个在国际出口上就是一个非常大的消耗,而效果却比较差劲。在2002年左右,曾经有这样一套系统,具体过滤的关键字主要是XXX、XXX等。这样过滤的效果并没有很大作用,却消耗了很大的网络资源。因为从监测到处理发出重置(reset)命令需要比较长的时间,往往用户已经把网页都下载完了,系统才检测到。比如用 Google 搜索前一段时间比较热门的关键字「XXX」,网民就可能看到整个的页面,而继续看下去的时候,才可能只出现半个页面,然后才出现无法显示。到 2003年下半年,很多ISP开始把这个功能搁置起来了,因为对他们来讲实在是得不偿失。消耗了那么多资源,却没甚么用。现在只有很少的部份ISP还在运行这个系统。