Sphinx/字符集、大小寫轉換和轉換表

當建立索引時，Sphinx從指定的數據源獲得文本文檔，將文本分成詞的集合，再對每個詞做大小寫轉換，于是“Abc”，“ABC”和“abc”都被當作同一個詞（word，或者更學究一點，詞項term）

為了正確完成上述工作，Sphinx需要知道：

源文本是什么編碼的;
那些字符是字母，哪些不是;
哪些字符需要被轉換，以及被轉換成什么.

這些都可以用 charset_type 和 charset_table 選項為每個索引單獨配置. charset_type 指定文檔的編碼是單字節(jié)的（SBCS）還是UTF-8的。 charset_table 指定了字母類字符到它們的大小寫轉換版本的對應表，沒有在這張表中出現的字符被認為是非字母類字符，并且在建立索引和檢索時被當作詞的分割符來看待。

注意，盡管默認的轉換表并不包含空格符 (ASCII code 0x20, Unicode U+0020) , 但是這么做是完全合法的. 這在某些情況下可能有用，比如在對tag云構造索引的時候，這樣一個用空格分開的詞集就可以被當作一個單獨的查詢項了.

參考來源[ ]

http://www.coreseek.cn/docs/coreseek_3.2-sphinx_0.9.9.html#required-tools

Sphinx使用手冊導航

安裝：	支持的操作系統\|需要的工具\|在Linux、BSD上安裝Sphinx\|在Windows上安裝Sphinx\|已知的安裝問題和解決辦法\|Sphinx快速入門教程
建立索引：	數據源\|屬性\|MVA\|索引\|源數據的限制\|字符集、大小寫轉換和轉換表\|SQL 數據源\|xmlpipe 數據源\|xmlpipe2 數據源\|Python 數據源\|實時索引更新\|索引合并
搜索：	匹配模式\|布爾查詢語法\|擴展查詢語法\|權值計算\|排序模式\|結果分組\|分布式搜索\|searchd查詢日志格式\|MySQL 協議支持與SphinxQL
命令行工具參考：	indexer命令參考\|searchd命令參考\|search命令參考\|spelldump命令參考\|indextool命令參考
MySQL存儲引擎：	SphinxSE 概覽\|安裝 SphinxSE\|使用 SphinxSE\|通過 MySQL 生成片段

久久精品水蜜桃av综合天堂,久久精品丝袜高跟鞋,精品国产肉丝袜久久,国产一区二区三区色噜噜,黑人video粗暴亚裔

WIKI使用導航

站長百科導航

站長專題

Sphinx/字符集、大小寫轉換和轉換表

參考來源[ ]

Sphinx使用手冊導航

久久精品水蜜桃av综合天堂,久久精品丝袜高跟鞋,精品国产肉丝袜久久,国产一区二区三区色噜噜,黑人video粗暴亚裔

WIKI使用導航

站長百科導航

站長專題

Sphinx/字符集、大小寫轉換和轉換表

參考來源[ ]

Sphinx使用手冊導航

Sphinx/字符集、大小寫轉換和轉換表