net.trialpc.sticktools.model
クラス BiLayerModelBuilder

java.lang.Object
  上位を拡張 net.trialpc.sticktools.model.AbstractModelBuilder<DocCollection<DocumentModel>>
      上位を拡張 net.trialpc.sticktools.model.BiLayerModelBuilder
すべての実装されたインタフェース:
ModelBuilder<DocCollection<DocumentModel>>

public class BiLayerModelBuilder
extends AbstractModelBuilder<DocCollection<DocumentModel>>

文書モデルと文書集合モデルの 2 層の言語モデルを生成するビルダーです。

作成者:
tetsu

フィールドの概要
 
クラス net.trialpc.sticktools.model.AbstractModelBuilder から継承されたフィールド
DEFAULT_DELIMITER
 
コンストラクタの概要
BiLayerModelBuilder()
           
 
メソッドの概要
 boolean add(java.lang.String docid, java.lang.String document)
          文書 ID と文書の内容を追加します。
 DocCollection<DocumentModel> build()
          追加された文書を基に、文書コレクションモデルを生成します。
 
クラス net.trialpc.sticktools.model.AbstractModelBuilder から継承されたメソッド
getTexts, setDelimiter, setStemmer, setStopWord
 
クラス java.lang.Object から継承されたメソッド
clone, equals, finalize, getClass, hashCode, notify, notifyAll, toString, wait, wait, wait
 

コンストラクタの詳細

BiLayerModelBuilder

public BiLayerModelBuilder()
メソッドの詳細

add

public boolean add(java.lang.String docid,
                   java.lang.String document)

文書 ID と文書の内容を追加します。

追加された文書の内容に対しては、ステミング処理とストップワードの除去が行われます。 これらの処理を変更したい場合は、AbstractModelBuilder.setStemmer(Stemmer)AbstractModelBuilder.setStopWord(StopWord) メソッドなどを利用してください。

パラメータ:
docid - 文書 ID
document - 文書
戻り値:
文書を追加できた場合は true, そうでない場合は false
関連項目:
AbstractModelBuilder.setStemmer(Stemmer), AbstractModelBuilder.setStopWord(StopWord), AbstractModelBuilder.setDelimiter(String)

build

public DocCollection<DocumentModel> build()

追加された文書を基に、文書コレクションモデルを生成します。

戻り値:
文書モデルの設定された文書集合モデルのインスタンス