Changeset 590

Show
Ignore:
Timestamp:
06-03-12 09:38:04 (2 years ago)
Author:
kees.burger@…
Message:

Updated the solr schema definition to use the ngram algorithm for improved substring matching at the cost of a larger index

Files:
1 modified

Legend:

Unmodified
Added
Removed
  • trunk/code/conceptwiki/storage/storage-solr/src/main/config/solr/conf/schema.xml

    r551 r590  
    66                <fieldType name="text_general" class="solr.TextField" positionIncrementGap="100"> 
    77                        <analyzer type="index"> 
    8                                 <tokenizer class="solr.StandardTokenizerFactory" /> 
    9                                 <filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" enablePositionIncrements="true" /> 
     8                                <tokenizer class="solr.WhitespaceTokenizerFactory" /> 
    109                                <filter class="solr.LowerCaseFilterFactory" /> 
     10                                <filter class="solr.NGramFilterFactory" minGramSize="1" maxGramSize="16" /> 
    1111                        </analyzer> 
    1212                        <analyzer type="query"> 
    13                                 <tokenizer class="StandardTokenizerFactory" /> 
    14                                 <filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" enablePositionIncrements="true" /> 
     13                                <tokenizer class="solr.WhitespaceTokenizerFactory" /> 
    1514                                <filter class="solr.LowerCaseFilterFactory" /> 
    1615                        </analyzer> 
     
    2221                <field name="pref" type="text_general" indexed="true" stored="true" required="true" multiValued="true" /> 
    2322                <field name="syn" type="text_general" indexed="true" stored="true" required="false" multiValued="true" /> 
     23                <field name="tags" type="uuid" indexed="true" stored="true" required="false" multiValued="true" /> 
    2424        </fields> 
    2525