10個工程師的愛恨情仇-2020全球資訊工程調查看一看 Stack Overflow ft. Wei Chen | 10 Preferences of Software Engineers
虽然关键字搜索仍然是最流行的方法,但它通常不准确,用户有时会在搜索时达到30,000次点击,然后不得不筛选一个松散相关的关键字结果列表以查找相关文档。“这就是所谓的语义技术的新一代进入框架。根据Ovum分析师Mike Davis和Madan Sheina发布的报告,谷歌的PageRank预测相关性,语义搜索等排名算法会降低语言意义,以产生高度相关的搜索结果。
着名的semanti由分析师挑选出的c Web供应商包括Expert System,Powerset,Yedda,Trovix和Hakia。作者认为,当微软选择了两家语义搜索公司Powerset和Zoomix时,语义搜索意识有所提高。
在专家系统的情况下,它的应用程序Cogito围绕人类理解的原则设计,以允许内容按照作者的意图来理解。这是关键字搜索忽略的内容
“谷歌搜索单词'jaguar'会拉动动物和汽车周围的内容,语义搜索不仅看关键字,还看周围的其他词,如”丛林'或'沙龙'来区分这两种含义,“作者说,”更深入的分析“除了语义搜索外,还有其他形式,包括启发式和本体论,语言学和文本挖掘以及统计学。然而,专家系统声称这些方法不足,只处理分析的形态和语法方面。
其他搜索引擎在深入分析时经常遇到困难。例如,当一个启发式驱动的搜索引擎在一个句子中看到两个形容词时,它通常会将它们冲掉,并将其评分为中性,因为它不了解两个单独的形容词所指向的位置。
相比之下,语义搜索的外观在句子逻辑中 - 句子中的单词如何相互关联 - 以及语义分析 - 理解关键词的上下文。
当一个术语不明确时,意味着它可以有多种含义,例如树皮,需要语义分析换句话说,它包围了它,给它它的真实含义和上下文。
一个词汇数据库
Expert Systems的工程师说Cogito可以走得更远,因为它有一个语义网络 - 一个词法数据库它提供了词汇定义及其关系的知识表示。它把韦伯斯特的词典放入内存数据库中 - 包含350,000个单词和280万个关系
“专家系统的语义网络也专注于常用单词,这与大多数本体论方法不同,内容,例如科学术语,跳过包含所有内容的90%的常用词,“Ovum作者说,”然而,语义搜索仍然充斥着“大量的理论炒作,但很少有实质内容或证据它比当前的搜索技术效果更好
“语义网络构建起来比较棘手,并不都是平等的。语义技术不可能在其分析和结果中提供100%的精确度。此外,对于潜在的粘性性能问题,仍然存在问题,因为语义搜索会消耗更多的处理周期。“