俄罗斯Yandex_俄罗斯引擎

2021-11-26 14:08  来源:外房网

 

Yandex Search 是一个搜索引擎。该公司为总部位于俄罗斯的Yandex所有。根据LiveInternet的数据,2015年1月,Yandex搜索产生了俄罗斯所有搜索流量的51.2%。

该搜索技术提供1400多个城市的本地搜索结果。Yandex Search还提供了“并行”搜索功能,在一个页面上显示来自主要网络索引和专业信息资源的结果,包括新闻、购物、博客、图片和视频。

Yandex Search响应实时查询,识别查询何时需要最新信息,比如突发新闻或Twitter上关于特定主题的最新帖子。它还包含一些额外的功能:向导回答,它提供额外的信息(例如,运动结果),拼写检查,自动完成提示查询,检测网页上的恶意软件的反病毒,等等。

2010年5月,Yandex推出了Yandex.com,这是一个测试和改进非俄搜索的平台。

搜索产品可以从个人电脑、移动电话、平板电脑和其他数字设备访问。除了网络搜索,Yandex还提供广泛的专业搜索服务。

2009年,Yandex推出了MatrixNet,这是一种新的机器学习方法,可以显著提高搜索结果的相关性。它允许Yandex的搜索引擎在决定搜索结果的相关性时考虑大量的因素。

另一项技术Spectrum于2010年推出。它允许推断隐式查询并返回匹配的搜索结果。该系统会自动分析用户的搜索结果,并识别出个人姓名、电影或汽车等对象。响应不同用户意图的搜索结果的比例取决于用户对这些结果的需求。

随着2017年7月21日的首次发布,Brave网络浏览器将Yandex作为其默认搜索引擎之一。

功能

索引

通常,Yandex索引的文件类型如下:html, pdf, rtf, doc, xls, ppt, docx, odt, odp, ods, odg, xlsx, pptx。

搜索引擎还能够索引Shockwave Flash对象中的文本(如果文本没有放在图像本身上),如果这些元素作为一个单独的页面传输,该页面具有MIME类型application/x-shockwave-flash和扩展名为.swf的文件

Yandex有两个扫描机器人——“主”和“快”。第一个负责整个互联网,第二个索引频繁变化和更新信息的网站(新闻网站和通讯社)。2010年,“快速”机器人接受了一项名为“Orange”的新技术,该技术由Yandex的加州和莫斯科分公司联合开发。

自2009年以来,Yandex一直支持Sitemaps技术。

 

搜索结果

Yandex,自动地,连同查询的原始“精确形式”,搜索它的各种变体和公式。

Yandex搜索考虑了俄语的词法,因此,无论搜索查询中的单词是什么形式,都将对所有的单词形式进行搜索。如果形态分析不受欢迎,您可以添加感叹号(!)在单词之前-在这种情况下,搜索将只显示单词的特定形式。此外,搜索查询实际上没有考虑到所谓的“停词”,即介词、标点、代词等,因为它们分布广泛

作为一个规则,缩写是自动披露,拼写是纠正。它还会搜索同义词(mobile - cellular)。原始用户请求的扩展取决于上下文。当一组高度专业化的术语,即公司的专有名称(例如,OJSC“Hippo”- OJSC“Hippopotamus”)在确切的引号中添加单词“price”时,就不会进行扩展(这些是用打字机引号突出显示的查询)。

每个用户的搜索结果都是根据他们的位置、查询语言、兴趣和偏好(基于之前和当前搜索会话的结果)单独形成的。然而,搜索结果排名的关键因素是它们与搜索查询的相关性。相关性是根据一个排序公式来确定的,这个公式是根据机器学习算法不断更新的。

搜索用俄语、英语、法语、德语、乌克兰语、白俄罗斯语、鞑靼语和哈萨克语进行。

搜索结果可以按相关性和日期(搜索结果下面的按钮)排序。

搜索结果页面由10个链接和简短的注释组成——“片段”。这些片段包括文本评论、链接、地址、网站的热门部分、社交网络页面等。作为片段的替代,Yandex在2014年推出了一个名为“岛屿”的新界面。

Yandex实现了“并行搜索”机制,当与网络搜索一起时,搜索将在Yandex服务上执行,如目录、新闻、市场、百科全书、图片等。因此,在响应用户的请求时,系统不仅显示文本信息,还显示视频文件、图片、词典条目等链接。

搜索引擎的一个特点也是“意图搜索”技术,意思是搜索解决问题。意图搜索元素是-对话框提示在不明确的请求,自动文本翻译,关于请求的汽车特征的信息,等等。例如,当你请求“Boris Grebenshchikov - Golden City”时,系统将显示一个表单,用于在线收听Yandex音乐服务的音乐,在“st. Koroleva 12”的请求下,系统将显示一个带有标记对象的地图片段。

垃圾邮件和病毒防护

2013年,Yandex被一些人认为是当时最安全的搜索引擎,在所有网络资源中排名第三。到2016年,Yandex下滑至第三位,谷歌排名第一。

2009年,Yandex出现了查看网页并警告用户的现象:从那时起,在搜索结果页面上,在一个危险网站的旁边会有一个提示“该网站可能威胁您的电脑安全”。同时使用两种技术来检测威胁。第一个是从美国反病毒软件Sophos那里购买的,它基于一种签名方式:即,当访问一个网页时,反病毒系统也会访问一个已知病毒和恶意软件的数据库。这种方法速度很快,但实际上对尚未进入数据库的新病毒无能为力。因此,Yandex随着签名也使用了自己的反病毒复合体,基于对行为因素的分析。Yandex程序在访问该站点时,会检查后者是否从浏览器请求额外的文件,是否将其重定向到外部资源,等等。因此,如果接收到网站在未经用户许可的情况下开始执行某些操作(级联样式表、Javascript模块启动和完成程序),就会被列入“黑名单”和病毒特征库中。有关网站感染的信息出现在搜索结果中,并通过Yandex。网站管理员服务网站的所有者收到一个通知。第一次检查后,Yandex会进行第二次检查,如果再次确认感染信息,就会频繁进行检查,直到威胁消除。Yandex数据库中感染站点的总数不超过1%。

2013年,Yandex每天检查2300万个网页(同时检测4300个危险网站),并向用户显示800万个警告。每月大约有10亿个网站被检查。

搜索排名

很长一段时间以来,Yandex的关键排名因素是特定网站的第三方链接数量。互联网上的每一页都被分配了一个独特的引文索引,类似于科学文章作者的索引:链接越多越好。在Yandex和谷歌的PageRank中也实现了类似的机制。为了防止作弊,Yandex使用了多元分析,在800个因素中,只有70个受第三方链接数量的影响。今天,网站的内容和有无关键词在那里,阅读文本的便捷性,域名的名称,它的历史以及多媒体内容的存在发挥着更大的作用。

2013年12月5日,Yandex宣布今后完全拒绝核算关联因素。

搜索提示

当用户在搜索栏中键入查询时,搜索引擎以下拉列表的形式提供提示。提示甚至在搜索结果出现之前就出现了,允许您改进查询,纠正布局或打字错误,或直接进入您正在寻找的网站。对于每个用户,都会生成提示,包括关于其搜索查询的历史记录(My Finds服务)。2012年,所谓的“智能搜索提示”出现了,它能立即给出有关主要常数(赤道长度、光速等)、交通堵塞的信息,并有一个内置计算器。此外,在“提示”(“法语里的爱”一提问就会立刻给出amour、affection)、足球比赛的赛程表和结果、汇率、天气预报等方面,还融入了一名翻译。你可以通过问“几点了”来知道确切的时间。2011年,寻找Yandex的线索完全局限于俄罗斯的83个地区。

除了实际的搜索外,Yandex搜索引擎还内置了hint。词典”、“Yandex市场”、“Yandex。以及其他Yandex服务。

提示函数是意图搜索技术发展的结果,最早出现在Yandex上。Bar在2007年8月,并在2008年10月被介绍到搜索引擎的主页上。该网站有桌面版和手机版,每天向用户显示超过10亿个搜索提示

历史

在很长一段时间内,搜索引擎的变化并没有得到广泛的代表,也没有留下名字。直到2008年初,当算法8 SP1发布时,Yandex才宣布从今以后,新的排名算法将采用城市名称。

1990年代

这个系统的名字——Yandex——是由阿卡迪·沃罗兹和伊利亚·塞加洛维奇共同发明的。

这个词代表另一个索引器(或者像“I am”(俄语中的“ya”)和索引)。根据阿特米·列别捷夫的解释,搜索引擎的名字与Yandeks谐音,yang的意思是男性的开始,

yandex.ru搜索引擎是CompTek在1997年9月23日的Softool展会上宣布的,尽管该公司在搜索领域(圣经索引、CD-ROM文件搜索、站点搜索)的一些发展甚至更早进行。

第一个索引包含5000个服务器的信息,占用4.5 GB。

同样在1997年,俄罗斯版本的Internet Explorer 4.0开始使用Yandex搜索。用自然语言进行查询成为可能。

在1998年,“查找相似的文档”功能出现在每个搜索结果中。

“Yandex。到1998年为止,“搜索”工作在Apache下运行在FreeBSD上的三台机器上:一台机器在互联网上爬行并索引文档,一台搜索引擎,另一台机器复制了搜索引擎。

1999年,一个搜索出现在分类中——搜索,一个搜索引擎和一个目录的组合。搜索引擎版本更新。

2000

2000年6月6日,搜索引擎的第二版面世。引入了并行搜索机制,并在发布的同时,从大量来源提供信息。用户可以将搜索结果限制在选定的主题。标题“流行的发现”出现了——这些词改进了搜索。

2000年12月,索引信息量达到355.22 GB。

2001

2001年,Yandex在参会人数上超过了另一家俄罗斯搜索引擎Rambler,成为俄罗斯网络搜索引擎的领头羊。Yandex开始用自然语言理解询问形式的请求。该系统已经学会识别错别字并提出纠正建议。设计已经改变了。

2002

Yandex搜索引擎每天的查询量超过200万次

2003

对rtf和pdf文档进行了索引。搜索结果开始以XML格式发布。

2004

排名算法发生了变化。

Yandex开始索引。swf (Flash).xls和。ppt格式的文档。

在年底,研究“全文搜索和排名在Yandex的一些方面”发表(作者Ilya Segalovich, Mikhail Maslov),揭示了某些排名的细节在搜索引擎。

2005

在夏天,所谓的“快速”搜索机器人被推出,与实际的索引页面并行工作。“快速机器人”的底座每1.5-2小时更新一次。

排名算法已经得到改进,以提高搜索的准确性。

在Yandex的帮助下,搜索功能得到了扩展。词典”和“Yandex。Lingvo”。搜索引擎已经学会理解诸如“西班牙语中什么是(某物)”之类的问题,并自动翻译它们。

按地区限制搜索结果成为可能。

2006

自2006年5月起,网站图标已经显示在搜索结果中。

12月初,在搜索结果的每个链接旁边都出现了一个条目“保存的副本”,点击它,用户就会进入一个特殊归档数据库(“Yandex缓存”)中页面的完整副本。

2007

排名算法再次改变。

2008

2008年,Yandex首次公开宣布了搜索算法的变化,并开始用俄罗斯城市的名字来命名。每个后续算法的“城市”名称以前一个算法的名称结尾的字母开始。

 

标签:
本网注明“来源:外房网”的所有文章,均为外房网编辑部原创或编译作品,转载请注明来源“外房网”。 凡注明“来源:XX网(非外房网)”的文章,均转载自其它媒体,转载目的在于传递更多信息,部分转载内容原作者未知,如果您发现本网站上有侵犯您的知识产权的文章,请及时与我们联络,我们会及时删除。举报邮箱:sam@glofang.com
俄罗斯最新推荐房源
Global_Property_Price_Report_2014.Q1
资讯排行
12小时在线QQ客服
周一至周日 9:00-21:00

广告联系

邮箱:glofang@glofang.com