什么是人肉搜索

最近“人肉搜索”几乎要成为一个热门词!那么所谓的“人肉搜索”是什么呢?以至于还引发了一些庭事纠纷呢?
just search。从百度知道拉来这么条信息(个人觉得不妥当,甚至有点答非所问了,或者是曲解了,就这点能耐还会引来庭事事件?):
实际上,这里所说的人肉搜索引擎就是指更多的利用人工参与来提纯搜索引擎提供的信息的一种机制。猫扑的人肉搜索引擎就是其中一个比较成功的例子。后面我们会根据猫扑的人肉搜索引擎给出一个更加具体的描述。
针对搜索引擎的Link Farm和Spam也许永远不会停止,因为他们能够从他们的作恶中得到利益。我们知道得到利益不是作恶的唯一原因,然而大规模的工业化的作恶唯一的原因当然是那样可以得到利益。
所以,这是一场永远无法结束的战争,只要搜索引擎还是应用最广泛的一种互联网应用,只要搜索引擎还是用户用户找到合适服务的最主要手段,这就是一场永远无法结束的战争。很多人把问题归结于PageRank技术,历史是何其相似啊,当年人们也是这样地抱怨META关键字和描述技术。也许Google或者其他的公司能够研究出来更加伟大的技术(注一)来取代PageRank,但是谁知道这新的技术什么时候又会变成明日黄花。
搜索引擎是利用机器自动化的收集网络信息并有序化的一种技术。搜索引擎高效快速,然而因为现在人工智能并不完善,搜索引擎还很难甄别刻意的修饰过的信息,所以SEO Spam才会那么猖獗。所以,有些人想从搜索引擎的反面来解决问题,那就是更多的利用人工把搜索引擎得到的信息进一步萃取,进一步有序化,我们称之为人肉搜索引擎。
很多人知道的中国有一个叫做猫扑的论坛,人气非常旺。Tiny在2001年到2004年期间是这个论坛的忠实用户。在我的印象中,人肉搜索引擎的概念应该出自于猫扑。
跟很多论坛一样,猫扑上面也经常有人问这个问题那个问题。同时猫扑有种虚拟货币叫做Mp,问问题的人往往会用Mp来奖励可以帮助他们的人。虽然Mp不能吃不能喝,但是还是很多人醉心于挣取更多的Mp(注二)。那些惯于通过回答问题挣取Mp的人在猫扑一般叫做赏金猎人。
于是很有趣味的一幕出现了,某人需要解决一个问题,就在猫扑发贴并许与一定数量的Mp作为酬谢。很快,就会有赏金猎人看到这个贴子,他们就会去用搜索引擎来寻找问题的答案,然后争先恐后地把找到的答案回在帖子里面邀功。最后,提问题的人得到了答案,赏金猎人得到了Mp,皆大欢喜。这也就形成了所谓的人肉搜索引擎的机制。有趣的是,我们可以发现人肉搜索引擎的搜索流程和搜索引擎在不同服务器之间的分布式搜索流程看起来是那么的相似,区别仅仅在于发动和执行流程的是人,还是机器。
人肉搜索引擎的质量怎样保证呢?这是一个非常有趣的问题,从刚才的流程上大家可以发现,如果有足够多的赏金猎人,他们之间就会产生竞争,寻找资料速度的竞争,资料准确性的竞争。竞争的结果是,一个速度又快资料又准确全面的赏金猎人会有越来越多的Mp,这会给他带来更多的成就感(注三),同时他也会更加的醉心于赏金猎人的工作。甚至,据我所知很多赏金猎人会形成自己的职业道德和行为准则,这样可以给他们更大的自我实现,同时提高了用户的满意程度。这就形成可一个正反馈,一个良性循环,前提是有足够的激励(Mp)投入和足够产生竞争的参与者(赏金猎人)。
同时很多人也为自己是一个人肉搜索引擎的用户感到自豪,因为这确实太好用了,不需要担心分词不准确,不用担心电脑错误的理解了你的话,不用担心搜索引擎收录范围不同造成的风险(注四),甚至不需要学习搜索引擎怎么用(注五),而且答案也不会仅仅局限于搜索引擎能找到的信息,虽然绝大部分问题是通过搜索引擎就可以找到的。
然而,人肉搜索引擎几年来仅仅是一个概念,没有成为一种产品,在猫扑,人肉搜索引擎只能帮助猫扑提升人气,并不能成为一个产品给猫扑带来效益,同时也给更多的人服务。这是为什么呢?我想可能有4点原因:
1、猫扑人肉搜索引擎和论坛的差异不够明显。或者说在猫扑里,人肉搜索引擎只是论坛的一种应用而已,任何需要人肉搜索引擎服务的人必须是论坛的用户,这降低了用户普及度(注六)。
2、Mp过于游戏化。Mp是虚拟货币,是游戏化的货币,这也给猫扑的人肉搜索引擎加上了游戏性的标签。做赏金猎人的人仅仅是喜欢这个游戏化氛围的人,或者说是能被Mp这样的虚拟货币激励的人,这影响了赏金猎人队伍的扩大,从而影响了人肉搜索引擎的扩大。
3、人肉搜索引擎的反映比较慢。Google可以在0.00001秒内给你一个答案,然而人肉搜索引擎需要等待有人看到你的帖子,并找出结果才会有所反应。
4、猫扑人肉搜索引擎不能保留历史纪录,每次有一个问题出现,就会引发一次分布式搜索。即使问题是重复的,也会同样引发这个流程,而且相同的问题在不同的时间问,答案可能迥异(注七),不能对相同答案给予一致性的结果。或者说,我觉得以上4点如果能够解决,人肉搜索引擎将能帮助我们更快更好的找到有用的信息。
——————-
注一:按照某些人的猜测,新的搜索引擎页面估值革命性技术也许是利用Google加速器记录的用户访问行为来评估网站的流量,这个方案可以解决 PageRank的动态性不足问题。然而这个方案和Alexa何其的类似,一旦出台新一轮的作弊风潮一定出现,可以想象每个商业网站都会要求员工安装 Google加速器了,就像他们现在要求员工安装Alexa一样。当然Google的技术实力远非Alexa可比,一切也还仅仅是某些人的猜测。题外话,如果Google真的有一天声称会用Google加速器的访问记录来评估网站,那么Google加速器在中国安装量一定会非常的惊人,看起来这倒可以作为一个不错的推广方法。注二:这实际上就是Mp机制带来的游戏性造成的,在分析猫扑的时候,Mp是一个关键,它造成了猫扑的游戏性,而猫扑的游戏性应该是它一直以来人气旺盛的主要原因。有人甚至说猫扑就是最好玩的网游,这还是有一定道理的。
注三:我猜测这是Mp机制的动力,也是其他的游戏机制的动力。
以上的引用估计是填补不了“人肉搜索”这一名词的解释空缺,甚至是误解的,看看比较实际一点的人肉搜索!
所谓搜索引擎,就是一种通过关键词搜索网页的工具,比如百度和Google等.人肉搜索引擎,顾名思义,它仍然是一种针对某个问题或者事件抛出的问题,最终寻找出最佳答案的搜索机制,但这个术语中的”人肉”一词,在掺杂着些许黑色幽默的同时,也准确地表明了这种搜索方式的特点:搜索行为的原动力,不再像传统的搜索方式那样,仅仅依靠某个网络程序或者冰冷的互联网资料库,而是更多地靠无数有着真实血肉之躯的网民的亲身参与,由他们在某个随时可能参与进来的时间,用自身的知识、经验、信息渠道,向提问者送上部分答案,再由其他网友补充、完善,直至最后得出确切的答案.
比方轰动一时的”虐猫事件”,先是某个网友在曝光的视频里,发现某个建筑物是东北某地.这个答案一出,立马引发了东北网友的寻找热情,很快,有网友将该建筑物锁定在呼兰县……就这样一步接一步,最终找到虐猫女主角.
今年的3377事件和华南虎事件,3377的真实身份和年画虎的出笼,也是网友通过人肉搜索,一步步得出真相的.
有不愿意透露姓名的专家表示:从某种意义上说,人肉搜索之所以能将真实情况最终大白于天下(当然,这其中也可能侵犯事件主人公的隐私),靠的是群体参与的集体力量,正因为有了集体的自发参与,众人拾柴火焰高,所以,人肉搜索让我们真正实现了对信息”大海捞针”的梦想.
同时,这位专家还指出:因为可能陷入侵犯隐私的困境,人肉搜索最终到底会成为服务大众的百科全书,还是湮灭在曝露他人隐私的三岔口?目前还难下定论.但一些网友还是迫不及待地宣称:随着人肉搜索的高调亮相,后搜索引擎时代来临了!
难怪要引来庭事纠纷了,SO强大的一个人肉搜索呀,涉及个人隐私了!!!
Popularity: 20% [?]