V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
cmkpl
V2EX  ›  问与答

有哪个全文检索引擎能好好对应中文?

  •  
  •   cmkpl · 2015-01-24 21:05:33 +08:00 · 3541 次点击
    这是一个创建于 3627 天前的主题,其中的信息可能已经有所发展或是发生改变。

    Solr? Sphinx?

    16 条回复    2015-01-26 13:54:19 +08:00
    abelyao
        1
    abelyao  
       2015-01-24 21:11:11 +08:00   ❤️ 1
    说个可能不符合楼主需求的,SAE 有个全文检索的接口,因为我的项目是部署在 SAE 上的,打算接下来使用这个服务,效果现在还不清楚: http://sae.sina.com.cn/doc/php/fts.html
    cmkpl
        2
    cmkpl  
    OP
       2015-01-24 21:42:30 +08:00
    我的网站放在国外,SAE似乎不合需求
    zeroten
        3
    zeroten  
       2015-01-24 21:49:38 +08:00
    @cmkpl 记得sae有国外的服务器
    abelyao
        4
    abelyao  
       2015-01-24 22:07:54 +08:00
    @cmkpl 如果你是面向国内用户的,SAE 其实也可以考虑一下,无备案的域名也可以绑定,原理是绕道 香港 或 美国 或 日本 去代理一下,访问速度稍慢一些而已
    fising
        5
    fising  
       2015-01-24 22:13:04 +08:00 via iPad
    阿里云
    kslr
        6
    kslr  
       2015-01-24 22:25:07 +08:00 via Android
    资料太少,无法分析,solr还要装java sphinx简单好用,但是要看情况
    Tianpu
        7
    Tianpu  
       2015-01-24 23:11:58 +08:00
    vibbow
        8
    vibbow  
       2015-01-24 23:12:28 +08:00
    http://azure.microsoft.com/zh-cn/services/search/
    不知道对中文支持怎么样。。。
    Agromania
        9
    Agromania  
       2015-01-24 23:15:03 +08:00   ❤️ 1
    sphinx就是个小玩具……solr其实搭起来非常简单的,elastic search也很不错,不过我没用过。
    两者都是基于lucene,有很多成熟的中文分词插件。
    scarlex
        10
    scarlex  
       2015-01-25 00:23:16 +08:00
    elastic search +1
    juicy
        11
    juicy  
       2015-01-25 00:31:43 +08:00
    elasticsearch不错,前段时间刚用它来做了个全文搜索~
    mengskysama
        12
    mengskysama  
       2015-01-25 02:35:27 +08:00
    sphinx 中文支持分词的分支 coreseek 已经出到5了。

    前几天尝试了xunsearch和sphinx对每个字建立索引,也就是等于没分词,查询速度来说sphinx比sphinx快很多。sphinx用起来也方面,协议也完全兼容mysql,你可以像捅mysql一样捅他的9306。

    重点是分词引擎好不好以及词库好不好,直接影响到搜索结果的完整性。(有人和我说分词完整性xunsearch不如coreseek5具体怎么样有待验证)。
    pubby
        13
    pubby  
       2015-01-25 04:10:59 +08:00 via Android
    @mengskysama coreseek5跳票一年了都不见更新,估计不再维护了吧
    armstrong
        14
    armstrong  
       2015-01-25 13:14:21 +08:00
    推荐ElasticSearch,前段时间刚用过,很不错
    mengskysama
        15
    mengskysama  
       2015-01-25 17:45:07 +08:00   ❤️ 1
    pubby
        16
    pubby  
       2015-01-26 13:54:19 +08:00
    @mengskysama 有用过吗?目前还在用3.2的,csft后来的版本都不稳定,不敢在线上使用。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2860 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 28ms · UTC 13:56 · PVG 21:56 · LAX 05:56 · JFK 08:56
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.