搜索技术在知识库中的应用
几个月前去四大银行之一交流。我们作为搜索技术提供商参与了客服中心方案的讨论,旨在提供web渠道的自助服务。 两次交流后,银行一方问了很多知识库的问题-原来项目中的重头之一是如何修订甚至重建目前已有的知识库-分类混乱,错误多多,更让x行头痛的是多条知识存在一个doc或xls的文档里,如何找到知识,并精确定位,都是传统知识库难以解决的问题,不是么, 面对一个或数个海量知识库, 你有足够的金钱和人力重新修订该知识库么? 还好,俺们公司提供左图的知识库自我学习的机制。前提是有客服机制的系统。当在线知识库查询得不到满足时,系统可以将查询请求转移到客服,客服找到合适的答案,推送回给客户。我们的系统则负责在客户线上搜索的模型和客服推送回的修正的知识建立新的对应。当下一个客户进行同样的搜索时,搜索引擎返回的已经是经由客服更新的知识了。 这样的好处是,客户查询越频繁的知识,被修订的越早。根据power law的定义,应该80%的客户查询都集中在20%的知识上。其次, 知识库的修订跟客服流程相结合,而无需额外的系统和人工。其三,除非新增知识,错误知识的修订并不改变知识库的任何数据,只是改变搜索引擎的索引到新的文档ID或链接。当你有一个海量知识库的时候,以传统技术解决以上三点的工作量可能是你完全不敢想象的。 当让除了上述三点, x行对多数据源的支持也很感兴趣-搜索引擎天生支持多种多个数据源的。这样可以免除了知识库合并的天文数量级的工作量。 大中型企业经过多年的IT建设后,存在各种IT系统,如OA、HR、ERP、CRM、财务系统等,这些系统因为建设时期、项目的不同,形成了一个个数据孤岛。而客户的要求经常要查询多个IT系统,在界面各异,逻辑各异的数据孤岛中寻找相关的内容,基本上成了mission impossible。如何检索,分析和利用分散在不同系统, 不同数据格式的大量已有数据去解决问题, 变成了企业知本能力和行动力的基础。 听起来很玄妙?www.splunk.com就是一个典型的例子。假如你是x电子银行,早上10:30多个客户投诉转账不可用了,你是公司的IT经理,第一反应什么?打电话找集成商和供应商吧。有了 Splunk,可能第一反应是查看splunk并做几个搜索。Splunk 本质就是搜索引擎,将你的IT所有系统的性能,维护,安全等等数据都一网搜尽,不论是底层的数据交换机,路由器,OS,服务器,应用服务器,数据库,web服务器,所有的系统的监测数据和log都为splunk所用。Splunk 将所有的数据进行索引和分类,并提供dashboard,报表等高级功能。所有相关电子银行的异常都将被splunk在一个列表里反映出来, 无论它是防火墙, 路由器, OS, 应用服务器还是数据库等等。 Splunk就是知本经济在IT中的典型应用, 那么你的工作中的知本应用是什么呢?