新闻产经轻工日化电器通讯仪器机械冶金矿产建筑建材石油化工食品医药电子电工能源电力交通运输农业环保图片手机版
当前位置:中国市场调查网>产业>科技>  正文

纽约时报:消灭文字垃圾 谷歌剑指“内容农场”

中国市场调查网  时间:06/28/2011 10:09:12   来源:东西网

  想象一下这样一个虚幻的世界,在它之中,每一个字符、每一个单词和每一个句子都是商品。公司们用码成豆腐块儿的文字赚钱,老板们拿着越来越少的薪水逼迫写手们更多更快地码字儿,读者们再花自己的血汗钱去阅读这些吸引他们注意力的廉价的文字。

  如今那样的虚幻世界在网上可见一瞥。在这阳光明媚的夏日,去看看类似“互联网内容发行商”(Associated Content)或“答案袋”(Answerbag)这种“内容农场”站点吧。在CNN和AOL网站的某些角落你也可以找到这种内容农场。

  内容农场这种在过去18个月里在互联网上兴起的事物,是一种用大量标题、关键词以及其他伎俩诱骗互联网用户进去看广告的“新闻网站”。这些网站使用玩弄Google排名系统的方式干扰并羞辱了Google。去年,《经济学人》杂志曾经很钦佩地称“互联网内容发行商”和“迪蒙德传媒”(Demand Media)“致力于低价生成内容即使微薄的广告收入都能支撑运作”的行为虽离经叛道却是聪明之举。

  作为一朵人工拼凑出来的语言奇葩,内容农场里的东西既没有风格也没有主题。你也许可以从一些此类文章里朦胧地看出点新闻的影子,尤其是各种花边八卦 - 但是它们普遍文风怪异,读起来像外星语言。比如说这句典型的“互联网内容发行商”式的句子:“车上的另一位乘客也已经被宣布死亡。”或是“就像许多流行白痴特权的追随者一样,杜恩的生活和恶作剧对我来说意义重大。”[特别是后一句,明显的内容农场式废话……谁看得懂啊。明显是外星语言,哈哈 - 译者注]

  内容农场上那些看起来像是从维基百科随便摘录外加翻译罗马尼亚文的毫无章法的既空洞又古怪的文字,让整个互联网上的信息都跌了价。几个月之前,当我被原以为能看到正常语言的商业信息中的那些令人毛骨悚然的文字垃圾弄得身心俱疲后,我最终决定投入电子书类、社会传媒类、电子商务类和新闻类手机应用程序的怀抱,至于网络则很少直接上了。我真是被时不时就“偶遇”一下的那些怪文章弄得越来越迷惑了。

  令人吃惊的是,这些垃圾文字居然不是机器人程序搞出来的。不过写这些玩意儿的人工作方式也都跟机器人差不多。近期关于这种“文字就是金钱”的作坊里生活方式的记录中清楚地描述着,很多内容农场写手每25分钟为一个周期,到了点就得交稿。另外一些人被赋予的任务就是搜刮拼凑各种报道,包括对一些专家的访谈,一小时交一次稿。很多人一次轮班就能拼凑、编辑、改好格式并发表10篇文章。

  许多拥有几十年记者工作经验的人就干着这种薪水4万美元一周工作70小时全年无休的工作。内容农场让垃圾新闻进化到了一个全新的水平。

  那么到底是谁在批量制造这些垃圾?一家叫做“商业内幕网”的商业新闻网站为几个廉价的“内容民工”提供了一个发表看法的论坛,他们中有几个是在AOL网站巨大的“种子与补丁”机构工作。他们描述自己的写作环境很让人疲惫,甚至很多时候遭受剥削。奥利弗·米勒,一位拥有美术学硕士学位的记者,在莎拉·劳伦斯的故事里他一度被认为能写出美国最棒的小说。[这句话可以这样理解吗?感觉很别扭。 - 译者注] 他告诉笔者,AOL让他写一篇30万字的关于电视的东西,报酬是2.8万美元。他需要根据自己从未看过的电视节目中的零星线索,每天从夜里11点写到第二天早晨7点或者8点,中间只休息一个半小时,感觉像是坟地里守夜。

  就像米勒先生上周在一份名为“时代快报”(the Faster Times)的网络报刊上说明的那样,他的工作就是把别人的研究中建议过的可能Google上需要的词语凑在一块儿,用一些类似标题的线索串起来,用好听的话润色,让它变成一片模模糊糊像是文章的东西。AOL可能会给它安上一个“里克·福克斯的胡子”之类的标题,猜想着可能有人会在Google搜索栏输入“里克、福克斯、胡子”这几个词,从而检索到米勒先生的“文章”。来AOL的读者是冲着信息来的,没准却会发现这是个文字垃圾站。结果还没等退出网站,他们可能就已经看了一段含有广告的视频短片。他们的访问都会被记录为页面点击,最后AOL再依据这些点击量向广告投放者收取费用。

  所以说这就是撰写商业信息的方式,你付一点点钱给写手,甚至干脆一分钱不掏,却通过“抓眼球”做广告的方式让读者花很多钱。可读者呢?他们得不到什么回报,看不到一点有用信息。这就是内容农场的逻辑 - 白赚你的眼球。

  有一天夜里米勒先生用即时信息质问他的雇主:“你们这些家伙真的在乎我写些什么吗?写好写坏没什么区别吧?” 米勒先生说对方的答案很简单 - “无所谓。”

  米勒先生的经验是,与其他“内容民工”们近期编造的故事保持一致。这同时对不久前泄露的一份名为“AOL线路图”的公司档案上展示的规划也是一种讽刺。在这份档案中,新闻报道艺术被简化成这样一个流程:以“找出高需求的主题”为指标开始,以“高论调低成本”的文字总结结尾。就这种“文章”啊,父老乡亲们,迎合了Google排名和社会媒体追捧所谓的“文学道德”。

  但是一件了不起的事情发生了!在看上去沉寂并麻木了几个月之后,正义的力量 - 或者说宣称蔑视邪恶的力量 - 杀回来了!它最紧迫的任务是“纠正世界信息,让它们物有所值并被广泛接受”。Google显然已经被内容农场体系严重羞辱了。

  就像一位认真的老师惨遭一群作弊学生无情戏弄那样,它(Google)已经丧失了公信力。

  谁都不能对Google永远欺负下去。今年2月,这家公司拿出了一个他们所能搞出的最佳计划:一个新的算法。这个算法被称为“熊猫”,会对12%的搜索产生影响。它正慢慢地不太完美地改进着一切。仅仅在不久以前,网络内容看起来还是没人管的,垃圾内容疯狂挤压正常内容。但是Google宣称它保证“熊猫”代表着良好的网络秩序。通过这个算法,Google可以把不受信任的、重复的、看起来不爽的东西排在后面。这下作弊者们仅仅靠字母A就想拍到前面可没办法了。

  与此同时,据参与开发“熊猫”算法的阿米特·辛海尔和马特·库茨介绍,“熊猫”的目标是“为高品质网站提供更好的排名服务,高品质网站在此指的是拥有原创内容以及类似研究、深入报道和深刻分析之类信息的网站。”

  对于大型传媒公司而言,“熊猫”算法现在就想好莱坞惊悚片里的红宝石或者核心芯片一样宝贵而让人垂涎欲滴。内容民工们如果想像从前一样保住生意那就得想办法击败它。很多广告公司 - 不论新老 - 都寄希望于广告收入,但广告收入取决于眼球率,而眼球率取决于能否得到Google的恩惠。如何把一个网站顶到Google搜索结果的前列或是踩到最末的诀窍才是最宝贵的。

  周二Google正式推出了“熊猫”2.2版,将“Whitey Bulger”系统整合进Google引擎。利用这个东西,你可以找到很多内容农场网站。现在你可以通过很多来自《波士顿环球报》、《洛杉矶时报》、联邦调查局、甚至Mashable网站的有价值的文章链接,做一项关于联邦探员使用公众媒体找到大罪犯鲍尔杰的原创调查。[此处的Bulger是否指联邦调查局10大通缉犯之一的詹姆斯·J·鲍尔杰即JAMES J. BULGER?望高手不吝赐教。 - 译者注]

  上个月,迪蒙德传媒,曾经最臭名昭著的内容农场网站,宣布计划通过发布由雇佣写手撰写的内容更丰富的文章提高网站质量,同时减少免费自由撰稿者的数量。真神奇,迪蒙德传媒正在升级它的玩法。

  为了解这样做会对读者造成什么影响,我访问了eHow网站,它之前是迪蒙德传媒旗下的一个团队。在那儿我读到了一篇署名艾莉森·斯派里的图书馆学专业研究生撰写的文章。文章题目是《如何像沃尔特·惠特曼一样写一首诗》。如果文中所写的不是埃尔文·布鲁克斯·怀特的话,那它就肯定不是那种“机器人”文字垃圾。[此处请参照前文对内容农场写作风格的介绍理解。]

  “想想你最热衷的事情或者体验,或者唤起自己的感情,”斯派里女士是这样写的。
“你最好的写作将从你热衷的事情、体验和知识中出现,”人类肯定不会这样写吧?