人肉搜索詳解
1. 引言 2. 谷歌的人肉搜索愚人節 3. 人肉搜索引擎升級之路 4. 人肉搜索引擎工作原理揭秘
2007年底,一個叫姜巖的31歲女子,因為丈夫有了外遇并想離婚,從24樓跳下自殺。在她生前寫下的后來廣為人知的“死亡博客”中,將自殺原因歸咎于丈夫王菲的不忠,并貼出了丈夫和第三者的照片。這些內容在網上公開后,論壇上眾口一詞痛罵“負心郎”王菲與第三者。
部分網友開始對王菲進行詳細信息追蹤,王菲的信息開始被逐步揭示。王菲在網上被“通緝”、“追殺”,并不斷收到恐嚇郵件。在現實生活中,王菲父母住宅多次被人騷擾,門口兩側貼滿誣陷恐嚇標語,其工作單位也因被騷擾將王菲辭退。
這是一次典型的人肉搜索事件。人肉搜索引擎不是一種互聯網技術或產品,而是指基于互聯網提供的平臺(如論壇、貼吧、社區等),利用互聯網用戶的人工參與,來提純所需要信息的一種機制。
|
比如,某網友需要解決一個問題,就在網上社區發貼,并以一定數量的虛擬幣作為酬謝。看到帖子的網友利用其專業背景、親身經歷或道聽途說的答案來回應。最后,提問題的人得到了答案,回答得到了報酬,雙方皆大歡喜,這就形成了“人肉搜索”引擎機制。
在本文中,我們將研究人肉搜索是如何登上流行詞匯舞臺的,詳細追溯中文互聯網史上“人肉搜索”的發展,以事件為導向研究“人肉搜索”的技術升級之路,并且預測“人肉搜索”的未來。
谷歌的人肉搜索愚人節
人肉搜索成為一個為社會普遍認可的流行用詞,要從2008年4月1日的愚人節說起。2008年4月1日,谷歌中國在其網站上推出一個“人肉搜索”的網絡產品,在這個頁面上,谷歌對自己的這個產品如此介紹:
什么是人肉搜索?
人肉搜索與刺青、美白、護膚、減肥等直接在人肉上施行的種種行為無關。顧名思義,人肉搜索就是利用現代信息科技,變傳統的網絡信息搜索為人找人、人問人、人碰人、人擠人、人挨人的關系型網絡社區活動,變枯燥乏味的查詢過程為一人提問、八方回應、一石激起千層浪、一聲呼喚驚醒萬顆真心的人性化搜索體驗。人肉搜索不僅可以在最短時間內揭露某某門背后的真相,為某三某七找到大眾認可的道德定位,還可以在網絡無法觸及的地方,探尋并發現最美麗的叢林少女、最感人的高山牧民、最神秘的荒漠洞窟、最浪漫的終極邂逅…… 人肉搜索追求的最高目標是:不求最好,但求最肉。
如果互聯網用戶真的嘗試使用這個搜索產品,那么他在輸入關鍵字并回車查詢后,會發現這只是谷歌的又一個愚人節玩笑。
每年的愚人節,谷歌都會針對當前流行事件或者趨勢推出愚人節惡作劇。既然被谷歌選為了2008年愚人節的惡作劇主題,“人肉搜索”大熱的程度可見一斑。在下一部分中,我們將看到“人肉搜索”是如何一步步發展,并成為熱門詞匯的。
人肉搜索引擎升級之路
2007年初,《時代》雜志將年度人物頒發給網民的時候,很多中國人對《時代》雜志的這個判斷感到疑惑不解。然而在2007年整整一年中,仿佛是為了印證《時代》雜志的論述,網絡開始史無前例地影響和改變起中國的社會。
從賣身救母事件、網絡虐貓事件,到火爆的“銅須門”網絡丑聞乃至最新的“白領跳樓自殺事件”,通過遍布互聯網的“人肉引擎”矢志不移的努力,本不離奇的事件在2007年被互聯網演繹成了一個個離奇的懸疑劇而吸引了全社會大眾的關注。伴隨而來的就是人肉搜索引擎的一戰成名。
對于這個現象,《時代》的概括可謂言簡意賅:“正是千千萬萬個網民瀏覽網站,創建博客、視頻共享網站和交友網站,才使網絡信息爆炸性增長,推動傳媒進入大眾唱主角的時代。”
人肉搜索引擎最早出自于貓撲社區。這個互聯網站因為擁有巨大用戶量而具備了人肉搜索的先決條件:人。
MP是貓撲大雜燴使用的一種虛擬貨幣,稱作“貓撲幣”或者“貓皮”。一般來說,想要獲得這類貨幣,需要大量地參加社區活動,發帖子,相比于游戲或者點廣告這些緩慢來“錢”方式,做貓撲“賞金獵人”是一個好主意,不僅能收獲貓皮,還能體驗偵探的快感。于是,某人需要解決一個問題,就在貓撲發貼并許與一定數量的MP作為酬謝。很快,就會有賞金獵人看到這個帖子,他們利用其專業背景、親身經歷、道聽途說甚至冷嘲熱諷來回答這一切。然后爭先恐后地把找到的答案回在帖子里面邀功。最后,提問題的人得到了答案,賞金獵人得到了MP,皆大歡喜。這也就形成了所謂的人肉搜索引擎的機制。
有趣的是,通過比較我們可以發現,人肉搜索引擎的搜索流程和搜索引擎在不同服務器之間的分布式搜索流程看起來是那么的相似,區別僅僅在于發動和執行流程的是人,還是機器。
如今,人肉搜索被歸納為經歷了5個發展階段:
- 人肉搜索1.0(引擎首次發動)
以公布個人資料為重點。
2001年 微軟陳自瑤事件——人肉引擎的首次發動:根據一張照片爆出照片主人的大部分個人資料。
- 人肉搜索2.0(方法基本確定):
- 先在人格上進行分析
- 然后推測私人信息
- 最后發出通緝令
2006年2月“虐貓事件”——首次開始嚴重影響到“被通緝者”的工作生活:這是人肉搜索廣為人知的標志性事件,短短六天之內將虐貓視頻的三個嫌疑人鎖定,第一次彰顯了網絡調查的能力……
- 人肉搜索3.0(引擎升級):
- 效率越來越快
- 影響擴大
- 除了資料,開始曝露他人生活憑證
2006年4月“銅須門”事件——受害人群較前兩次變得更多:網友調查到銅須的身份,還將他的求職簡歷、家庭電話、手機號、學校電話以及照片公布,發布“江湖追殺令”,呼吁社會封殺銅須。由此,一場網絡事件,終于演變成一場大規模的社會討伐。
- 人肉搜索4.0(引擎升級):
- 速度更快,資料更全
- 無辜人群更眾多
- 網絡判決開始影響社會判決
- 攻擊更猛,已然有些不顧及被譴責對象
2007年4月錢軍打人事件——網絡判決開始試圖影響社會判決:幾個小時之內,毆打老人者錢軍和其妻子的電話號碼、身份證號碼、家庭住址、工作單位、孩子上學的學校全部曝光……網民試圖通過影響由派出所來懲治錢軍。
- 人肉搜索5.0(人性化、理智化)
- 部分網友在面對人肉搜索時趨于理智
- 大部分網民開始理性地參與討論
2007年底,由“打虎網民”層層推進的“華南虎事件”,大部分網民開始理性地參與討論,意見和觀點主要基于攝影、生物、常識等不同角度的技術分析,體現出追求真相的愿望。
在下一部分中,我們將看到人肉搜索是如何工作的,其工作原理是基于什么進行的。
人肉搜索引擎工作原理揭秘
為什么選擇人肉搜索引擎,而非搜索引擎這種互聯網產品?原因在于,對于一些八卦搜索、沒有唯一答案、需要去挖掘答案的搜索,人肉搜索往往能得到更有價值和吸引力的結果。這是因為,由于人肉搜索引擎聚集了各地的不同階層、不同知識背景的人,得到幫助的幾率也會大大增加。當然,人肉搜索引擎也有比不上互聯網一般搜索引擎的地方,那就是速度。所以說,人肉搜索引擎的潛在力量比一般的搜索引擎強大,但反饋速度就比不上一般的搜索引擎。換個角度來看,人肉搜索引擎其實就是搜索引擎的社區化。區別僅僅在于發動和執行流程的是人,還是機器。
|
那么人肉搜索引擎的工作原理是什么呢?人肉搜索基于下面這種假設:你是網民嗎?只要你曾經使用過互聯網,在網上留下過你的個人資料,留下過你的言論,就會留下痕跡,就能搜索得出來。
常用方法:
- 利用GOOGLE、百度等超強的搜索功能,根據搜索結果,變換輸入關鍵詞,細化得到的結果。
- 從被搜索的人的博客入手,再進而搜索他朋友的博客,經常有意外的收獲。
- 不放過搜索一些常用網站,如易趣、淘寶,或一些大型論壇,如天涯、貓撲、新浪等,對方都可能留下注冊信息。
- 通過對方的ID或郵件地址,查出其IP號,可以獲得各種“馬甲”的真實身份;
- 如果知道對方所在城市,利用GOOGLE衛星地圖查到他戶外照片的確切所在地。
- 具備一定的邏輯分析能力,整合梳理龐雜信息,拼湊出可被驗證的調查結果。
人肉搜索的未來:人工和技術,一場無法結束的戰爭
迄今為止,搜索引擎是使用最廣泛的一種互聯網應用。只要搜索引擎還是用戶尋找信息的最主要手段,人工和技術就是一場永遠無法結束的戰爭。
搜索引擎是利用機器自動化的收集網絡信息并有序化的一種技術。雖然現在的搜索引擎高效快速,但是因為人工智能并不完善,搜索引擎仍然很難甄別刻意修飾過的信息,這也正是谷歌面對“點擊欺詐”在互聯網上泛濫而束手無策的原因。
而為了應對這一難題,全球的搜索巨頭都加大了研發的力度。據了解,Google正準備研發包括語義搜索在內的下一代智能搜索引擎;微軟也開始研發基于Web Block(網頁塊)而不是網頁的搜索技術。
與此同時,結合人肉搜索的搜索引擎也成為了新一代搜索引擎的思路:搜索引擎對用戶在搜索引擎結果的點擊行為和點進后的瀏覽行為繼續跟蹤,而不是簡單地反饋結果或者跟蹤到點擊就結束。只有更加深入地分析用戶行為才能理解用戶的需求,并向用戶反饋最符合檢索需求的結果。通過分析這些用戶的行為習慣,再根據內部算法進行調整補充,排序結果可以更優良。
但人肉搜索不會因為技術的發展而停止自己前進的腳步。當目前的技術不能解決所有搜索信息需求時,數個互聯網公司都推出了基于人肉搜索的產品。比如,百度娛樂頻道被看作是百度技術整合人肉搜索的嘗試,娛樂頻道內全部的新聞都是基于百度貼吧這個百度產品里的資信息源,通過百度搜索引擎形成的新聞聚合。
評論
查看更多