比如淘宝。一件商品有很多tag(指的是淘宝商品列表搜索的tag,非商品本身尺寸等类型tag)。
搜索完毕,出现
<code>产地:北京,xx,xx,xx,xx 颜色:xx,xx,xx,xx,xx,xx 等等:xx,xx,xx,xx,xx </code>
现在的表结构:
<code>tag: t_id(标签id),t_name(标签名称) </code>
tag_relation:
t_id(标签id),product_id(商品id)
有木有好的查询优化方案?
想过用redis作数据索引,最后用分页后的id取MySQL数据。但是又有一个索引重建的问题。数据量少还好说。但是数据量一上去就要疯了。
想了解一下有没有什么好的方案来实现。比如考虑过sphinx,但没有想到方案。
还有一个需求就是,要所有tag下当前搜索条件所有数据的综合。
比如:选中tagname为“北京”,的数据,那么其他的tagname的数据量应该为0,且北京下属的颜色数据,比如北京下,蓝色数据为1,黑色数据为3,等等。。求方案。
比如淘宝。一件商品有很多tag(指的是淘宝商品列表搜索的tag,非商品本身尺寸等类型tag)。
搜索完毕,出现
<code>产地:北京,xx,xx,xx,xx 颜色:xx,xx,xx,xx,xx,xx 等等:xx,xx,xx,xx,xx </code>
现在的表结构:
<code>tag: t_id(标签id),t_name(标签名称) </code>
tag_relation:
t_id(标签id),product_id(商品id)
有木有好的查询优化方案?
想过用redis作数据索引,最后用分页后的id取MySQL数据。但是又有一个索引重建的问题。数据量少还好说。但是数据量一上去就要疯了。
想了解一下有没有什么好的方案来实现。比如考虑过sphinx,但没有想到方案。
还有一个需求就是,要所有tag下当前搜索条件所有数据的综合。
比如:选中tagname为“北京”,的数据,那么其他的tagname的数据量应该为0,且北京下属的颜色数据,比如北京下,蓝色数据为1,黑色数据为3,等等。。求方案。
数据量大的话,可以考虑下solr,
solr 支持facet 搜索的特性,传送门:http://wenku.baidu.com/view/1c3fd63143323968011c92cc
这个特性可以让我们根据‘分类’、‘标签’、以及关键字一起搜索目标
sphinx 定时重建索引。
如果实时性要求较高,把最近更新的商品数据放到增量索引里面,重建索引频繁点就行。
以上满足几十万商品的级别没问题。
淘宝这样的海量的商品,必然是分布式索引了