- 1、本文档共11页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
来自: by 虫子
B2c 站内搜索初探—写给不懂技术的你
这之前:
1、想写这篇文章很久,但一直纠结在搜索引擎具体的技术原理细节中,看得愈多,不懂的
地方也愈多,迟迟不敢动手,这是非程序猿出生的痛苦。
2、所有人都知道搜索是个复杂的玩意,本文试着主要从非技术角度思考并搭建一个适用于
b2c 网站的站内搜索系统,不涉及到太多的技术细节。至于具体的实现代价这里未做考虑(是
通过简单的sql+缓存搞定、用lucene 或Sphinx 等全文检索引擎做二次开发、甚至找google 百
度买代码做二次开发,听你们程序猿的吧,你做不了主)。
3、本文多次提到站内搜索,而非站内搜索引擎,这两者间有巨大差别 (我不是很确定最终
设计出来的是否会是一个真正意义上的站内搜索引擎)。
4 、本文参考了较多资料,例举如下,供参考学习
《web 信息架构-设计大型网站》这本经典书籍(不建议新手购买)
以及部分关于全文检索的论文
在这之后,我们进入正文
1、在开始考虑规划一个b2c 站内搜索前,需要考虑清楚以下2 个问题
站内搜索要解决的问题
下面描述3 类常见的搜索场景
(1)某用户小李,
(2 )某用户小白,听说了b2c 网站A ,看见琳琅满目的商品
(3 )某用户小明,上次来过了网站
分析你的网站是否需要站内搜索
实际上现在站内搜索在b2c 网站基本是标配,但这里仍然唠叨一下网站是否需要站内搜索,
或仅仅是搜索而不引擎?
(1)考虑网站商品的属性:以标准品、常见商品为内容的站点搜索使用率会高;而较偏门
的商品,如绣刺、礼品这类 B2C 网站,用户对要搜索的关键词认知不够,大部分用户建立
不起较清晰的心智模型,搜索使用率会偏低。
(2 )考虑网站可能使用站内搜索用户的绝对数,10 万级别UV/ 日的网站,站内搜索使用用
户的数量已经比较可观了,需要考虑他们的需求。
(3 )考虑商品类目数量、品牌数、sku 数量,根据一点小小的经验,单品牌 sku 小于 500
的服装类网站站内搜索使用率远小于5% 。
(4 )考虑客户重购率、购买周期(其实本质是考虑新客老客的组成),新客为主的用户,基
本是试探性搜索,搜索使用率也偏低。
来自: by 虫子
总结一下:商品偏门、流量不高、sku 少、新客为主的站点,站内搜索基本是摆设,即使要
上站内搜索,亦可简单应付。
这里要提到一点:很多客服经常自己需要用商品款号搜索商品,认为非常需要站内搜索,这
不是用户需求,只能说明后端系统没做好。
2、简单了解搜索引擎的工作原理
爬虫抓取内容建立(包括新增和删减)索引—储存索引—查询 (用户查询)查询分
析—查询结果排序呈现结果
(1)要提到的是,电子商务的信息通过手工录入或其它方式已经导入到了系统,不需要用到爬
虫程序。
(2 )所谓索引,是指搜索系统对信息进行加工,把信息转换成搜索系统能快速理解并方便查询
的过程。要多哪些内容建立索引、对哪些内容的组件进行索引,是下文要探讨的方向。
(2 )查询分析,这是最有技术含量的部分、涉及到搜索引擎的核心算法,对于中文全文检索,
这里又涉及到所谓的分词技术。
比较复杂,下文亦会做简单解说。
(3)查询结果排序,这也是较复杂的部分,排序方式多种多样。最常见并合理是“根据搜索关键
词的相关性”进行排序,什么是最相关的搜索结果?对同一个关键词,每个人的理解可能不一样,
而要通过程序去理解并判定,技术含量可见一斑。最著名的是 Google 首创的 page rank 排名
运算法则。下文也将对b2c 的排名算法做简单阐述。
(4 )搜索结果呈现,对不懂技术的人来说,这是最容易把握,并指点江山的部分。下文会做重
点阐述。
为了便于区分什么是站内搜索,什么是站内搜索引擎,这里贴一张分析表格(出处不详):
来自: by 虫子
3、考虑清楚这两个问题后,你决定要上站内搜索了,那么接着考虑以下几个问题
接上一篇文章
让用户搜什么内容?
比较明显,一般b2c 网站的内容就是商品、外加部分新闻公告和帮助文章。对于平台性的网
站,如淘宝和京东,因为支持店中店,内容还包括店铺和品牌。内容虽然简单,一般是是会
简单的对内容做“搜索分区”,分区的目的是不让用户在同一个搜索结果列表既看到商品展
示、又看到文章和店铺的展示。
淘宝商城有两个分区:商品和店铺
168
您可能关注的文档
- 电商入门指引.doc
- 从韩寒到孙红雷,中国特色的明星代言.doc
- 【双12各方观点大汇总】看淘宝网“双12”,众说纷纭!.doc
- 粉丝娱乐网网站产品策划案.pdf
- 【网营堂】第65期笔记:如何用网络营销做口碑传播(2011-09-22).pdf
- 腾讯搜索推广-赤兔产品介绍v1.1.ppt
- 赤兔产品介绍--内容广告产品手册v2.3.ppt
- bbx_-实业投资财务分析问题(朱武详).ppt
- 电子商务常用术语及常识整理.docx
- Facebook 产品设计五维.docx
- 山东省威海市2023-2024学年高一年级下册期末考试语文试题及答案.pdf
- 2024-2025学年绥化市高二数学上学期开学考试卷(附答案解析).pdf
- 2024届贵州省贵阳某中学联考高考模拟预测地理试题(含答案解析).pdf
- 2024年公务员考试行测常识判断复习讲义.pdf
- 2024年广东学法考试试题附答案(考场一).pdf
- 2024年人教版八年级物理复习讲义:功 专项训练【五大题型】原卷版.pdf
- 江苏省泰州市高港区等2地2023-2024学年九年级上学期期中语文试题.pdf
- 酒店概论及酒店管理培训考试题库.pdf
- 湖北省旅游类《酒店服务》技能高考历年考试试题库(含答案).pdf
- 泰安市2025年中考一模考试物理试题(A)含解析.pdf
文档评论(0)