📄 segmentreader.java

📁 lucene2.2.0版本
💻 JAVA
📖 第 1 页 / 共 2 页
字号:
上一页 12
    return tis.terms(t);  }  /**   * @throws CorruptIndexException if the index is corrupt   * @throws IOException if there is a low-level IO error   */  public synchronized Document document(int n, FieldSelector fieldSelector) throws CorruptIndexException, IOException {    ensureOpen();    if (isDeleted(n))      throw new IllegalArgumentException              ("attempt to access a deleted document");    return fieldsReader.doc(n, fieldSelector);  }  public synchronized boolean isDeleted(int n) {    return (deletedDocs != null && deletedDocs.get(n));  }  public TermDocs termDocs() throws IOException {    ensureOpen();    return new SegmentTermDocs(this);  }  public TermPositions termPositions() throws IOException {    ensureOpen();    return new SegmentTermPositions(this);  }  public int docFreq(Term t) throws IOException {    ensureOpen();    TermInfo ti = tis.get(t);    if (ti != null)      return ti.docFreq;    else      return 0;  }  public int numDocs() {    // Don't call ensureOpen() here (it could affect performance)    int n = maxDoc();    if (deletedDocs != null)      n -= deletedDocs.count();    return n;  }  public int maxDoc() {    // Don't call ensureOpen() here (it could affect performance)    return si.docCount;  }  /**   * @see IndexReader#getFieldNames(IndexReader.FieldOption fldOption)   */  public Collection getFieldNames(IndexReader.FieldOption fieldOption) {    ensureOpen();    Set fieldSet = new HashSet();    for (int i = 0; i < fieldInfos.size(); i++) {      FieldInfo fi = fieldInfos.fieldInfo(i);      if (fieldOption == IndexReader.FieldOption.ALL) {        fieldSet.add(fi.name);      }      else if (!fi.isIndexed && fieldOption == IndexReader.FieldOption.UNINDEXED) {        fieldSet.add(fi.name);      }      else if (fi.storePayloads && fieldOption == IndexReader.FieldOption.STORES_PAYLOADS) {        fieldSet.add(fi.name);      }      else if (fi.isIndexed && fieldOption == IndexReader.FieldOption.INDEXED) {        fieldSet.add(fi.name);      }      else if (fi.isIndexed && fi.storeTermVector == false && fieldOption == IndexReader.FieldOption.INDEXED_NO_TERMVECTOR) {        fieldSet.add(fi.name);      }      else if (fi.storeTermVector == true &&               fi.storePositionWithTermVector == false &&               fi.storeOffsetWithTermVector == false &&               fieldOption == IndexReader.FieldOption.TERMVECTOR) {        fieldSet.add(fi.name);      }      else if (fi.isIndexed && fi.storeTermVector && fieldOption == IndexReader.FieldOption.INDEXED_WITH_TERMVECTOR) {        fieldSet.add(fi.name);      }      else if (fi.storePositionWithTermVector && fi.storeOffsetWithTermVector == false && fieldOption == IndexReader.FieldOption.TERMVECTOR_WITH_POSITION) {        fieldSet.add(fi.name);      }      else if (fi.storeOffsetWithTermVector && fi.storePositionWithTermVector == false && fieldOption == IndexReader.FieldOption.TERMVECTOR_WITH_OFFSET) {        fieldSet.add(fi.name);      }      else if ((fi.storeOffsetWithTermVector && fi.storePositionWithTermVector) &&                fieldOption == IndexReader.FieldOption.TERMVECTOR_WITH_POSITION_OFFSET) {        fieldSet.add(fi.name);      }    }    return fieldSet;  }  public synchronized boolean hasNorms(String field) {    ensureOpen();    return norms.containsKey(field);  }  static byte[] createFakeNorms(int size) {    byte[] ones = new byte[size];    Arrays.fill(ones, DefaultSimilarity.encodeNorm(1.0f));    return ones;  }  private byte[] ones;  private byte[] fakeNorms() {    if (ones==null) ones=createFakeNorms(maxDoc());    return ones;  }  // can return null if norms aren't stored  protected synchronized byte[] getNorms(String field) throws IOException {    Norm norm = (Norm) norms.get(field);    if (norm == null) return null;  // not indexed, or norms not stored    if (norm.bytes == null) {                     // value not yet read      byte[] bytes = new byte[maxDoc()];      norms(field, bytes, 0);      norm.bytes = bytes;                         // cache it      // it's OK to close the underlying IndexInput as we have cached the      // norms and will never read them again.      norm.close();    }    return norm.bytes;  }  // returns fake norms if norms aren't available  public synchronized byte[] norms(String field) throws IOException {    ensureOpen();    byte[] bytes = getNorms(field);    if (bytes==null) bytes=fakeNorms();    return bytes;  }  protected void doSetNorm(int doc, String field, byte value)          throws IOException {    Norm norm = (Norm) norms.get(field);    if (norm == null)                             // not an indexed field      return;    norm.dirty = true;                            // mark it dirty    normsDirty = true;    norms(field)[doc] = value;                    // set the value  }  /** Read norms into a pre-allocated array. */  public synchronized void norms(String field, byte[] bytes, int offset)    throws IOException {    ensureOpen();    Norm norm = (Norm) norms.get(field);    if (norm == null) {      System.arraycopy(fakeNorms(), 0, bytes, offset, maxDoc());      return;    }    if (norm.bytes != null) {                     // can copy from cache      System.arraycopy(norm.bytes, 0, bytes, offset, maxDoc());      return;    }    // Read from disk.  norm.in may be shared across  multiple norms and    // should only be used in a synchronized context.    norm.in.seek(norm.normSeek);    norm.in.readBytes(bytes, offset, maxDoc());  }  private void openNorms(Directory cfsDir, int readBufferSize) throws IOException {    long nextNormSeek = SegmentMerger.NORMS_HEADER.length; //skip header (header unused for now)    int maxDoc = maxDoc();    for (int i = 0; i < fieldInfos.size(); i++) {      FieldInfo fi = fieldInfos.fieldInfo(i);      if (fi.isIndexed && !fi.omitNorms) {        Directory d = directory();        String fileName = si.getNormFileName(fi.number);        if (!si.hasSeparateNorms(fi.number)) {          d = cfsDir;        }                // singleNormFile means multiple norms share this file        boolean singleNormFile = fileName.endsWith("." + IndexFileNames.NORMS_EXTENSION);        IndexInput normInput = null;        long normSeek;        if (singleNormFile) {          normSeek = nextNormSeek;          if (singleNormStream==null) {            singleNormStream = d.openInput(fileName, readBufferSize);          }          // All norms in the .nrm file can share a single IndexInput since          // they are only used in a synchronized context.          // If this were to change in the future, a clone could be done here.          normInput = singleNormStream;        } else {          normSeek = 0;          normInput = d.openInput(fileName);        }        norms.put(fi.name, new Norm(normInput, fi.number, normSeek));        nextNormSeek += maxDoc; // increment also if some norms are separate      }    }  }  private void closeNorms() throws IOException {    synchronized (norms) {      Enumeration enumerator = norms.elements();      while (enumerator.hasMoreElements()) {        Norm norm = (Norm) enumerator.nextElement();        norm.close();      }      if (singleNormStream != null) {        singleNormStream.close();        singleNormStream = null;      }    }  }    /**   * Create a clone from the initial TermVectorsReader and store it in the ThreadLocal.   * @return TermVectorsReader   */  private TermVectorsReader getTermVectorsReader() {    TermVectorsReader tvReader = (TermVectorsReader)termVectorsLocal.get();    if (tvReader == null) {      tvReader = (TermVectorsReader)termVectorsReaderOrig.clone();      termVectorsLocal.set(tvReader);    }    return tvReader;  }    /** Return a term frequency vector for the specified document and field. The   *  vector returned contains term numbers and frequencies for all terms in   *  the specified field of this document, if the field had storeTermVector   *  flag set.  If the flag was not set, the method returns null.   * @throws IOException   */  public TermFreqVector getTermFreqVector(int docNumber, String field) throws IOException {    // Check if this field is invalid or has no stored term vector    ensureOpen();    FieldInfo fi = fieldInfos.fieldInfo(field);    if (fi == null || !fi.storeTermVector || termVectorsReaderOrig == null)       return null;        TermVectorsReader termVectorsReader = getTermVectorsReader();    if (termVectorsReader == null)      return null;        return termVectorsReader.get(docNumber, field);  }  /** Return an array of term frequency vectors for the specified document.   *  The array contains a vector for each vectorized field in the document.   *  Each vector vector contains term numbers and frequencies for all terms   *  in a given vectorized field.   *  If no such fields existed, the method returns null.   * @throws IOException   */  public TermFreqVector[] getTermFreqVectors(int docNumber) throws IOException {    ensureOpen();    if (termVectorsReaderOrig == null)      return null;        TermVectorsReader termVectorsReader = getTermVectorsReader();    if (termVectorsReader == null)      return null;        return termVectorsReader.get(docNumber);  }    /** Returns the field infos of this segment */  FieldInfos fieldInfos() {    return fieldInfos;  }    /**   * Return the name of the segment this reader is reading.   */  String getSegmentName() {    return segment;  }  void setSegmentInfo(SegmentInfo info) {    si = info;  }  void startCommit() {    super.startCommit();    rollbackDeletedDocsDirty = deletedDocsDirty;    rollbackNormsDirty = normsDirty;    rollbackUndeleteAll = undeleteAll;    Enumeration values = norms.elements();    while (values.hasMoreElements()) {      Norm norm = (Norm) values.nextElement();      norm.rollbackDirty = norm.dirty;    }  }  void rollbackCommit() {    super.rollbackCommit();    deletedDocsDirty = rollbackDeletedDocsDirty;    normsDirty = rollbackNormsDirty;    undeleteAll = rollbackUndeleteAll;    Enumeration values = norms.elements();    while (values.hasMoreElements()) {      Norm norm = (Norm) values.nextElement();      norm.dirty = norm.rollbackDirty;    }  }}
上一页 12
⌨️ 快捷键说明

复制代码 Ctrl + C
搜索代码 Ctrl + F
全屏模式 F11
切换主题 Ctrl + Shift + D
显示快捷键 ?
增大字号 Ctrl + =
减小字号 Ctrl + -