绍兴信息港

当前位置:

新聞聚合之Googlenews模式與Te

2019/05/03 来源:绍兴信息港

导读

隨著絡信息的飛速發展,科技這1重要科技資源情勢發揮著愈來愈重要的作用。如何對海量的科技進行聚合已成為新興的熱點話題。文章介紹了聚合的產生,并

隨著絡信息的飛速發展,科技這1重要科技資源情勢發揮著愈來愈重要的作用。如何對海量的科技進行聚合已成為新興的熱點話題。文章介紹了聚合的產生,并將現在廣泛使用的聚合模式歸納為:人工組織、Digg、Google news、Techmeme四種模式;選取其中代表意義的Techmeme模式和Google news模式進行了詳細論述,運用SWOT分析方法,從二者內部的優勢、劣勢、外部的機會和威逼四個方面進行分析,并在此基礎上提出了二者之間存在的十二方面的主要差異;同時科技的聚合方式對圖書情報行業的信息聚合方式也有一定的鑒戒意義。

关键词:信息聚合,聚合,科技,Google news模式,Techmeme模式,数字图书馆

随着络的日趋普及、上信息数量的迅猛增长,互联已经成为人们获得知识的重要信息源。电子科技,这一重要科技资源也在广大科技工作者的工作中发挥着愈来愈重要的作用。但是,在络中有用信息大量增加的同时,无用的冗余信息也随之增加,这就给科技工作者准确迅速获取有效信息带来了一定困难:为了满足日常工作的信息需求,科技工作者们不得不花费大量的时间去搜索、浏览,从搜索引擎提供的大量信息中逐条挑选有效信息。为了解决用户因盲目点击和无目的阅读所耗费的大量时间和精力的问题以及如何为用户提供所

关注领域的信息,聚类技术应运而生了。但应采用哪种聚类技术,采用何种聚合方式至今仍是科技界探讨的热点话题。

1 聚合

1.1 聚合的产生

聚合(News Feeds),是一种新兴的络信息聚合技术。聚合工具是将按不同的话题进行分类、聚合,把符合要求的推送给读者的一种工具。通过聚合工具的使用,读者可以快速方便地浏览到自己关心的。聚合的思想产生源于美国2001年爆发的911事件。美国911恐怖袭击事件后,互联上关于911的相干的需求突增,导致不少站点因无法承受流量压力而罢工。Google也不例外,一时间,关于911相关的搜索需求量突增到平时的60倍。为了应对这一突发事件,Google采取了紧急应对措施:把大型站上与911事件相关的链接集中寄存在Google首页,以方便读者查询。这是Google News的雏形,在此举措的启发下聚合思想诞生了。

1.2 聚合的方式

互联发展至今,络信息已经成为大众获取信息的重要渠道之一,同时用户对信息的需求在数量和质量上都有所增加。因此各大站纷纷采取了各种各样的聚合技术,以期为用户提供更为便捷、有效的信息服务。纵观聚合的发展历史,综合分析对比当今各大站采用的聚合方式,其聚合思路可以归纳为以下4种:人工组织聚合;Digg类的投票社交聚合;以Google为代表的语义聚合;以Techmeme为代表的link聚合。

人工组织聚合:人工组织聚合方式其信息内容主要依靠专业多年积累的经验及自身的敏感度,并参考点击量、阅读数量、推荐指数、评论指数等机器统计数据,从而肯定并向读者推荐当日的重要(焦点)。具体的内容需要通过专业的审批,需有专业人员维护。国外的雅虎及国内的大多数门户站都是采取此思路。Digg类的投票社交聚合:Digg类投票社交聚合主要是依靠友的气力对资讯进行筛选、推荐、投票,根据投票和推荐结果的统计,生成相应的内容。其信息排行几乎不人工干预,由读者参与决定的重要度和推荐度。如我国的抓虾和鲜果。Google news:Google news是机器聚合的代表,它依托机器语义分析,从海量的互联信息中找到相匹配的链接,以一定的显示方式全部推荐给读者,再由读者自行挑选自己关心的。百度、雅虎News也是采取这类聚合方式。以Techmeme 为代表的link 聚合:Techmeme分析的对象包括、博客、视频、图片等多种方式,它不仅向读者推荐本身,还会把有关该的评论、不同或类似观点及后续观点等一系列背后的有价值的,经过综合分析后再推送给读者,可以使读者全面了解所关注的背景、不同的观点及后续发展等情况。它很好地反应了信息的连续性和回放性。国际上使用这类方式的站并不是很多:首创者美国的Techmeme仍是科技翘楚,其跟进者中国的玩聚,发展其实不成熟,影响力不是很大。在科技领域中,上述的四种模式应用为广泛的当数Google news的科技和Techmeme。其中, 依托于Google 强大搜索功能的Googlenews,充分利用搜索引擎本身便捷、快速、全面的特性,很好地弥补了内容过于分散的缺陷。而Techmeme则是早采用依托分析发掘link发现热点的聚合模式。随着信息传播领域的焦点从人工转向机器聚合,Techmeme以其抓取速度快、内容全面和阅读效率高三大优势成为受关注的热点话题。2 Google news模式与Techmeme模式比较研究

2.1 Google news聚合模式概况

Google News(谷歌版叫资讯) 采用的是机器过滤关键字的聚合方式。它是当时的首席科学家Krishna Bharat在911事件的启发下,对其雏形进一步完善形成的,他将不同源的聚合起来,这样用户就可以方便地看到不同媒体关于同一的观点和报导。

但是,随着读者需求的纵向加深,Google news这种单纯的事实收集方式已不能满足需求,他们更希望了解的是背后的故事。对此Google积极采取了改进措施:

2006年Google推出了定制搜索引擎,通过它站和Blog发布者能够为读者提供更具相关性的搜索结果。通过选择关键字和发布者想要在搜索列表中包括的站点列表,用户可以实现以下功能:①只搜索某些站点;②搜索某些站点;③排除某些站点。这个定制的搜索引能够入驻用户选择的站点,搜索结果可以根据用户的喜好以不同风格、不同语种显示。

2007年Google news引入了当事人评论机制,增加了信息的丰富度。这种机制将传统媒体机构收集的与当事人的评论相结合,在提供的同时也提供原创价值信息和链接。Google正在积极引入人工参与的模式,以弥补机器聚合带来的缺陷。

2.2 Techmeme聚合模式概况

Techmeme的前身是2005年推出的memeOrandum,经过几年的发展完善,Techmeme已经成功突破博客社区这个小圈子,上升为一个主流的科技站。Techmeme主要关注科技话题,实时监测已定义的Blog列表,通过扫描传统的媒体和博客(侧重于科技类博客)的 URL链接来挖掘博客作者之间的对话线索,辨认出哪些是重要的,并将相关的信息整理后,以对话的形式展现在首页上,便于用户阅读。其中,这个 Blog列表是前一个月内被 Techmeme 采用频率的100个站点的列表,此列表包含所有权威的科技源和的Blog。

Techmeme是一个非常有效的内容过滤器。首先,Techmeme的聚合是高度相干的,能够毫无遗漏地发现当日所有基于Blog和IT媒体的科技热门。其次,Techmeme的时效性非常强,一般文章发布15分钟后,就能被抓取到。再者,Techmeme具有引发讨论、创造热门的功能。 Techmeme能在Blog的非正式讨论中发现未被报道的热门和未来的趋势,通常情况下几天后这些就会出现在《纽约时报》等主流媒体上。正如TechCrunch创始人迈克尔阿灵顿(Michael Arrington)所说的那样从某种程度上讲,Techmeme可视为博客圈的。这也是Techmeme成为科技工作者必看站点的原因。

2.3 Google news与Techmeme模式的SWOT分析

Google news和Techmeme都是当前的聚合工具,但它们本身并不完美,仍需改进。为了使Google news和Techmeme的优缺点更加清晰,笔者运用SWOT分析方法分别对两者的竞争优势(Strength)、劣势(Weakness)及外界存在的机会(Opportunity)和威逼(Threat)进行了深入的分析,详见表1和表2。

2.4 Google news与Techmeme模式的差异分析

通过对比表1和表2中两者所处的外部环境,可以看出:Google news与Techmeme都处在一个络媒体快速增长、传播范围日益广泛、受众人数剧增的时期,这一机遇为聚合媒体的发展提供了更加广阔的空间。但与此同时,他们又都面临着来自其他同行业厂商的激烈竞争。将二者自身的优势和劣势交叉对比后发现:Google news与Techmeme之间存在很大的差异,主要表现在以下方面:

搜索功能。Google news具有强大的搜索功能。而在Techmeme站内没有设置检索入口,这一缺陷是其的软肋。来源。Google news的主要来源为主流报纸,没有考虑其他新兴的形式,如博客。Techmeme融会了和博客两大源。的时效性。二者的时效性不同,Google news可以显示已经发布18到20小时内的内容,而读者可以在Techmeme上找到15到30分钟前媒体或博客发布的消息。的可定制性。Google news可以依据读者的兴趣与爱好定制不同的;而Techmeme只显示的热门,读者没有自主选择的权利。页面显示。Google news采取的是限量显示方式,即每页多可以显示十条,而Techmeme采取的是分层、滚动的显示方式,通过这种方式读者可以方便地追踪、参与话题讨论,且显示的条数不受限制。重复性。Google news的主要来自主流报纸如美联社、新华社等媒体站,而这些站的报道的重复现象很严重,因此Googlenews不可避免的会有大量的重复存在。与之相比,主要聚合来自博客内容的Techmeme,重复信息相对较少。存档功能。Google news没有存档功能,加上它的变化频率高、每页显示的数量少,读者一旦错过某条,就很难再找回。Techmeme为读者提供了完善的存档功能,只要输入日期和时间,就可以看到当时的页面。的权威性。从2007年开始Google news采用了邀请当事人的评论机制,但评论的权威性难以保证。而Techmeme的观点来自权威的主流媒体及博客(这些博客的博主大多是行业的专家或权威人士),这一方式保证了的准确性和权威性。Techmeme具有的Track功能,用户可以通过RSS订阅方式来跟踪某个热点。这正是Google news所欠缺的。Techmeme在对进行聚合的同时也引入了对photo和Video的聚合,暂时没有迹象表明Google news具有此功能。页面更新频率。除上述十个方面外,Google news和Techmeme在页面的变化频率上也有很大的区分,Google news界面每几分钟就会变化一次,虽然Techmeme的也在变化,但变化的频度没有Google news那样快。经过一段时间的跟踪视察,发现Google news的页面每几分钟就会更新一次,如在2008年3月18日笔者于11点14分采集到了刚刚更新的页面,五分钟后其页面有发生了更新,且除了微软Vista SP1将于明日发布亚马逊站开售这一条外,余下的13条均已发生了变化。2008年3月25日13点39分笔者次收集到了 Techmeme页面上刚刚更新后的,2十分钟后再次收集到更新后的内容,主页面上的内容并没有更新,仅右侧一栏中的发现的主题的部分内容发生了变化,并且它发布了6分钟之前刚刚产生的消息。服务对象。Google news的科技是以大众为服务对象的,它没有十分明确的客户群体的区分,而Techmeme主要是针对科技博客作者、科技工作者和科技工作者的一种新兴的信息聚合方式。随着阅读需求的深化,读者不再仅仅需要单一的信息,而是应该包含评论、观点和更多辅助信息,Techmeme非常恰当地迎合了科技读者对和观点两方面内容的阅读需求,相对来说,Techmeme更适合科技的聚合。分析两者的劣势可以发现,和Google news相比,虽然Techmeme在品牌及市场占有率上暂时处于劣势,但其迅速提升的市场占有率及客户群体的迅速增加,已引起了Google的高度注意。虽然Techmeme暂时局限于美国市场这个小圈子内,但是其国外科技读者的数量正在以几何级数的速度增长。面对外界的同样的机会和威胁,谁能更好、更快地弥补自己的缺点,谁就更有可能成为未来驾驭科技信息聚合领域的强有力的方式。

3 启示

通过上述研究发现,Google news和Techmeme这两种聚合方式各有利弊。互相扬长避短,在两者之间寻找的可能组合,是今后信息聚合理想的方式。

同时Techmeme模式和Google news模式的组合对改良图书情报行业的信息聚合服务方式也具有一定的鉴戒意义。

首先,科技工作者的信息要求的加深,已有的被动信息查阅的方式已不能满足要求。当今社会,信息更新速度越来越快,科技工作者需要时间掌握本领域研究动态,以便及时调剂研究重点。而大部分科技工作者工作繁忙,他们不可能将大量的时间用于跟踪国际动态。如果能提供一种实时跟踪工具,并把跟踪结果经过去重等一系列初步处理后,推送给科技工作者,一定会受到欢迎。而Techmeme快速准确的信息聚合方式很好地满足了这1要求。

其次,随着学科划分的不断细化,研究领域的不断拓展,科学研究的范围越来越广阔,但对每位具体的科学研究人员来说,他的研究领域在短时期内是不会变动的,也就是说在一定时间内每位科技工作者只对某个很小领域内的科技信息感兴趣。因此,针对性很强的科技信息才是科技工作者真正需要的,Google news的信息自主定制功能很好地满足了这一需求。

再者,对于新进入某领域的科技工作者来说,他们需要了解该领域的研究状况,这就需要对一定时间内的信息进行回溯,这也是现在图书馆保留大量历史信息的原因,Techmeme具有的历史存档功能很好地解决了这一问题。

现阶段,无论Techmeme的聚合模式还是Googlenews的聚合模式都不是很完善,因此在图书情报机构进行信息服务时,应综合考虑这两种模式的优劣,结合本行业的具体情况,取长补短是今后的发展思路。

4 结论

随着读者对非官方内容的阅读需求、读者浏览信息的分化和深化、信息的日趋丰富、信息获取手段多样化及用户参与选择的呼声不断高涨,Digg、 Techmeme、Google news等聚合方式应运而生。不管哪一种聚合模式,都是为读者服务的,谁能够提供效的阅读方式,谁就能地争取到用户,范围内开拓自己的市场,成为科技聚合的主流。同时科技聚合模式对图书情报的信息聚合服务方式也有一定的借鉴意义,如何取长补短,找到的组合是今后研究的重点课题之一。

参考文献

[1] DAS A S, DATAR M, GARG A, RAJARAM S. Google news personalization: scalable online collaborative filtering[J]. WWW 2007 / Track: Industrial Practice and Experience, 2007, May: .

[2] RADEV D R, OTTERBACHER J, WINKEL A, BLAIR-GOLDENSOHN ws inessence: summarizing online news topics[J]. Commun. ACM, 2005,48(10):.

[3] CLEUZIOU G, MARTIN L, VRAIN C. PoBOC: An overlapping clustering algorithm, application to rule-based classification and textual data[C]//Proceedings of the 16th ECAI conference, 2004: .

[4] 戴维民. 络信息优化传播导论[M]. 上海: 复旦大学出版社,2004(18): .

[5] 刘学. 中国络媒体研究[J]. 与传播研究, 2002(1):.

[6] 约翰逊托马斯, 凯芭芭拉, 谭辛鹏. 互联与传统媒介信息可信度的比较[J]. 国际界,1999(05):.

[7] 王利. I T新语林:简易信息聚合[ J ] .计算机教育, 2 0 0 5 ( 0 8 ):.

[8] 王娜.博客搜索引擎与传统搜索引擎的比较研究[J].图书情报工作, 2006(07):.

[9] GEORGE C, SCERRI J. Web 2.0 and User-Generated Content: legalchallenges in the new frontier. Journal of Information, Law and Technology[J],2007(2):.

[10] 赵伟.络传播中的博客研究[D]. 湖北:华中科技大学,2005.

[11] 谭芳.络评论研究[D].湖北:武汉大学,2005.

[12] 孙及园,林锦贤.对Web页的查询及信息提取[J]福州大学学报(自然科学版), 2000(03):.

[13] 凤飞伟.络评论及其发展趋向研究[D]. 江西:南昌大学,2005.

作者简介

程文娟(1982-),研究方向:科技资源整合。通讯地址:北京市复兴路15号中国科学技术信息研究所研究生部 100038

彭洁(1965-),研究员,主要研究方向:知识管理、信息资源整合。通讯地址:同上

赵辉(1971-),工程师,主要研究方向:信息资源管理。通讯地址:同上

来源:

专心训练营教你如何理清思绪重装大脑
申请留学年末正当时主流国家留学注意事项
希特勒头像茶杯在德国销售居然源自中国图
标签