net.moraleboost.junsai
クラス CompilerConfig

java.lang.Object
  上位を拡張 net.moraleboost.junsai.CompilerConfig
すべての実装されたインタフェース:
Config

public class CompilerConfig
extends java.lang.Object
implements Config

辞書コンパイル時の設定

作成者:
taketa

フィールドの概要
 
インタフェース net.moraleboost.junsai.Config から継承されたフィールド
DEFAULT_CHAR_PROPERTY_BIN_FILENAME, DEFAULT_CHAR_PROPERTY_FILENAME, DEFAULT_CHARSET, DEFAULT_LEFT_ID_FILENAME, DEFAULT_MATRIX_BIN_FILENAME, DEFAULT_MATRIX_FILENAME, DEFAULT_POS_ID_FILENAME, DEFAULT_REWRITE_FILENAME, DEFAULT_RIGHT_ID_FILENAME, DEFAULT_SYS_DIC_FILENAME, DEFAULT_UNKNOWN_BIN_FILENAME, DEFAULT_UNKNOWN_FILENAME, DEFAULT_USR_DIC_FILENAME
 
コンストラクタの概要
CompilerConfig()
           
 
メソッドの概要
 void addDictionaryFile(java.lang.String file)
          辞書ソースファイルを追加する。
 void clearDictionaryFiles()
          追加した辞書ソースファイルをクリアする。
 java.lang.String getCharPropertyBinFile()
          コンパイル済み文字カテゴリ定義ファイルのパスを取得する。
 java.lang.String getCharPropertyFile()
          文字カテゴリ定義ファイルのパスを取得する。
 java.lang.String getCharset()
          辞書ソースファイルの文字コードを取得する。
 java.lang.String[] getDictionaryFiles()
          辞書ソースファイルの配列を取得する。
 int getDictionaryType()
          辞書タイプを取得する。
 java.lang.String getLeftIdFile()
          左文脈ID定義ファイルのパスを取得する。
 java.lang.String getMatrixBinFile()
          コンパイルした接続コスト行列を書きだすファイルのパスを 取得する。
 java.lang.String getMatrixFile()
          接続コスト行列のソースファイルのパスを取得する。
 java.lang.String getNodeFormat()
          ノード書式を取得する。
 java.lang.String getOutputFile()
          コンパイル済み辞書ファイルのパスを取得する。
 java.lang.String getPosIdFile()
          品詞ID定義ファイルのパスを取得する。
 java.lang.String getRewriteFile()
          リライトルール定義ファイルのパスを取得する。
 java.lang.String getRightIdFile()
          右文脈ID定義ファイルのパスを取得する。
 java.lang.String getUnknownBinFile()
          コンパイル済み未知語定義ファイルのパスを取得する。
 java.lang.String getUnknownFile()
          未知語定義ファイルのパスを取得する。
 boolean getWakati()
          分かち書き専用辞書を構築するかどうかを取得する。
 void setCharPropertyBinFile(java.lang.String charPropertyBinFile)
          コンパイル済みの文字カテゴリ定義が書き込まれる ファイルのパスを指定する。
 void setCharPropertyFile(java.lang.String charPropertyFile)
          文字カテゴリ定義ファイルのパスを指定する。
 void setCharset(java.lang.String charset)
          辞書ソースファイルの文字コードを指定する。
 void setDictionaryType(int type)
          構築する辞書のタイプを指定する。
 void setLeftIdFile(java.lang.String leftIdFile)
          左文脈ID定義ファイルのパスを指定する。
 void setMatrixBinFile(java.lang.String matrixBinFile)
          コンパイルした接続コスト行列を書きだすファイルのパスを 指定する。
 void setMatrixFile(java.lang.String matrixFile)
          接続コスト行列のソースファイルを指定する。
 void setNodeFormat(java.lang.String nodeFormat)
          ノード書式を指定する。
 void setOutputFile(java.lang.String outputFile)
          コンパイル済み辞書を書きこむファイルのパスを指定する。
 void setPosIdFile(java.lang.String posIdFile)
          品詞ID定義ファイルのパスを指定する。
 void setRewriteFile(java.lang.String rewriteFile)
          辞書内のlid, ridが負であった場合に用いられる リライトルールの定義ファイルのパスを指定する。
 void setRightIdFile(java.lang.String rightIdFile)
          右文脈ID定義ファイルのパスを指定する。
 void setUnknownBinFile(java.lang.String unknownBinFile)
          コンパイル済み未知語定義ファイルのパスを指定する。
 void setUnknownFile(java.lang.String unknownFile)
          未知語定義ファイルのパスを指定する。
 void setWakati(boolean wakati)
          分かち書き専用の辞書を構築する。
 
クラス java.lang.Object から継承されたメソッド
clone, equals, finalize, getClass, hashCode, notify, notifyAll, toString, wait, wait, wait
 

コンストラクタの詳細

CompilerConfig

public CompilerConfig()
メソッドの詳細

setCharset

public void setCharset(java.lang.String charset)
辞書ソースファイルの文字コードを指定する。

パラメータ:
charset - 文字コード

getCharset

public java.lang.String getCharset()
辞書ソースファイルの文字コードを取得する。

戻り値:
文字コード

setWakati

public void setWakati(boolean wakati)
分かち書き専用の辞書を構築する。 分かち書き専用辞書には、素性情報が含まれない。

パラメータ:
wakati - trueを指定すると、分かちがき専用辞書を構築する。

getWakati

public boolean getWakati()
分かち書き専用辞書を構築するかどうかを取得する。

戻り値:
trueなら、分かち書き専用辞書を構築する

setDictionaryType

public void setDictionaryType(int type)
構築する辞書のタイプを指定する。Dictionary.TYPE_SYS_DICDictionary.TYPE_USR_DICDictionary.TYPE_UNK_DICの いずれかを指定。それぞれ、システム辞書、ユーザ辞書、未知語辞書を 表す。

パラメータ:
type - 辞書タイプ

getDictionaryType

public int getDictionaryType()
辞書タイプを取得する。

戻り値:
辞書タイプ

setNodeFormat

public void setNodeFormat(java.lang.String nodeFormat)
ノード書式を指定する。null以外の値にセットすると、 辞書ソースファイルのエントリを、この書式によって 書き換えたものが、素性としてコンパイル済み辞書に 書き込まれる。nullをセットすると、ソースファイル内の 素性情報がそのまま書き込まれる。

パラメータ:
nodeFormat -

getNodeFormat

public java.lang.String getNodeFormat()
ノード書式を取得する。

戻り値:

addDictionaryFile

public void addDictionaryFile(java.lang.String file)
辞書ソースファイルを追加する。 システム辞書の場合、辞書ディレクトリ内のCSVファイルを ここで追加する。ユーザ辞書の場合、自前で定義した CSVファイルを指定する。未知語辞書については、 setUnknownFile(String)で指定したファイルが 使用されるため、この設定は関係しない。

パラメータ:
file - 辞書ソースファイルのパス

getDictionaryFiles

public java.lang.String[] getDictionaryFiles()
辞書ソースファイルの配列を取得する。

戻り値:
辞書ソースファイルの配列

clearDictionaryFiles

public void clearDictionaryFiles()
追加した辞書ソースファイルをクリアする。


setMatrixFile

public void setMatrixFile(java.lang.String matrixFile)
接続コスト行列のソースファイルを指定する。 これは通常、辞書ディレクトリ内のmatrix.defである。

パラメータ:
matrixFile - 接続コスト行列ソースファイルのパス

getMatrixFile

public java.lang.String getMatrixFile()
接続コスト行列のソースファイルのパスを取得する。

戻り値:
接続コスト行列のソースファイルのパス

setMatrixBinFile

public void setMatrixBinFile(java.lang.String matrixBinFile)
コンパイルした接続コスト行列を書きだすファイルのパスを 指定する。これは通常、辞書ディレクトリ内のmatrix.binである。

パラメータ:
matrixBinFile - コンパイル済み接続コスト行列ファイルのパス

getMatrixBinFile

public java.lang.String getMatrixBinFile()
コンパイルした接続コスト行列を書きだすファイルのパスを 取得する。

戻り値:
コンパイル済み接続コスト行列ファイルのパス

setLeftIdFile

public void setLeftIdFile(java.lang.String leftIdFile)
左文脈ID定義ファイルのパスを指定する。 これは通常、辞書ディレクトリ内のleft-id.defである。

パラメータ:
leftIdFile - 左文脈ID定義ファイルのパス

getLeftIdFile

public java.lang.String getLeftIdFile()
左文脈ID定義ファイルのパスを取得する。

戻り値:
左文脈ID定義ファイルのパス

setRightIdFile

public void setRightIdFile(java.lang.String rightIdFile)
右文脈ID定義ファイルのパスを指定する。 これは通常、辞書ディレクトリ内のright-id.defである。

パラメータ:
rightIdFile - 右文脈ID定義ファイルのパス

getRightIdFile

public java.lang.String getRightIdFile()
右文脈ID定義ファイルのパスを取得する。

戻り値:
右文脈ID定義ファイルのパス

setRewriteFile

public void setRewriteFile(java.lang.String rewriteFile)
辞書内のlid, ridが負であった場合に用いられる リライトルールの定義ファイルのパスを指定する。 これは通常、辞書ディレクトリ内のrewrite.defである。

パラメータ:
rewriteFile - リライトルール定義ファイルのパス

getRewriteFile

public java.lang.String getRewriteFile()
リライトルール定義ファイルのパスを取得する。

戻り値:
リライトルール定義ファイルのパス

setPosIdFile

public void setPosIdFile(java.lang.String posIdFile)
品詞ID定義ファイルのパスを指定する。 これは通常、辞書ディレクトリ内のpos-id.defである。

パラメータ:
posIdFile - 品詞ID定義ファイルのパス

getPosIdFile

public java.lang.String getPosIdFile()
品詞ID定義ファイルのパスを取得する。

戻り値:
品詞ID定義ファイルのパス

setCharPropertyFile

public void setCharPropertyFile(java.lang.String charPropertyFile)
文字カテゴリ定義ファイルのパスを指定する。 これは通常、辞書ディレクトリ内のchar.defである。

パラメータ:
charPropertyFile - 文字カテゴリ定義ファイルのパス

getCharPropertyFile

public java.lang.String getCharPropertyFile()
文字カテゴリ定義ファイルのパスを取得する。

戻り値:
文字カテゴリ定義ファイルのパス

setCharPropertyBinFile

public void setCharPropertyBinFile(java.lang.String charPropertyBinFile)
コンパイル済みの文字カテゴリ定義が書き込まれる ファイルのパスを指定する。 これは通常、辞書ディレクトリ内のchar.binである。

パラメータ:
charPropertyBinFile - コンパイル済み文字カテゴリ定義ファイルのパス

getCharPropertyBinFile

public java.lang.String getCharPropertyBinFile()
コンパイル済み文字カテゴリ定義ファイルのパスを取得する。

戻り値:
コンパイル済み文字カテゴリ定義ファイルのパス

setUnknownFile

public void setUnknownFile(java.lang.String unknownFile)
未知語定義ファイルのパスを指定する。 これは通常、辞書ディレクトリ内のunk.defである。

パラメータ:
unknownFile - 未知語定義ファイルのパス

getUnknownFile

public java.lang.String getUnknownFile()
未知語定義ファイルのパスを取得する。

戻り値:
未知語定義ファイルのパス

setUnknownBinFile

public void setUnknownBinFile(java.lang.String unknownBinFile)
コンパイル済み未知語定義ファイルのパスを指定する。 これは通常、辞書ディレクトリ内のunk.dicである。

パラメータ:
unknownBinFile - コンパイル済み未知語定義ファイルのパス

getUnknownBinFile

public java.lang.String getUnknownBinFile()
コンパイル済み未知語定義ファイルのパスを取得する。

戻り値:
コンパイル済み未知語定義ファイルのパス

setOutputFile

public void setOutputFile(java.lang.String outputFile)
コンパイル済み辞書を書きこむファイルのパスを指定する。 システム辞書の場合は、これは通常、辞書ディレクトリ内の sys.dicである。ユーザ辞書の場合は、同じくusr.dicである。

パラメータ:
outputFile - コンパイル済み辞書ファイルのパス

getOutputFile

public java.lang.String getOutputFile()
コンパイル済み辞書ファイルのパスを取得する。

戻り値:
コンパイル済み辞書ファイルのパス