|
|||||||||
前のクラス 次のクラス | フレームあり フレームなし | ||||||||
概要: 入れ子 | フィールド | コンストラクタ | メソッド | 詳細: フィールド | コンストラクタ | メソッド |
java.lang.Objectnet.moraleboost.junsai.dictionary.Dictionary
public class Dictionary
メイン辞書クラス
フィールドの概要 | |
---|---|
static int |
MAGIC
|
static int |
MIN_FILE_SIZE
|
static int |
TYPE_SYS_DIC
|
static int |
TYPE_UNK_DIC
|
static int |
TYPE_USR_DIC
|
static int |
VERSION
|
コンストラクタの概要 | |
---|---|
Dictionary(java.lang.String filename)
Dictionary(String, boolean) において、
mapをtrueに指定した場合と同じ。 |
|
Dictionary(java.lang.String filename,
boolean map)
コンパイル済み辞書ファイルをオープンしてDictionaryオブジェクトを構築する。 |
メソッドの概要 | |
---|---|
static int |
baseIndex(Trie.Result r)
rの示す表層形を持つTokenのうち、最初のもののインデックスを取得する。 |
int |
commonPrefixSearch(java.lang.CharSequence key,
int offset,
int len,
Trie.Result[] result,
int rlen)
key内の位置offsetから長さlenまでの部分文字列で始まる見出しを持つ、 辞書エントリを検索する。 |
boolean |
exactMatchSearch(java.lang.CharSequence key,
Trie.Result r)
keyと完全に一致する見出しを持つ辞書エントリを検索する。 |
java.lang.String |
feature(Token t)
Tokenに対応する素性を取得する。 |
int |
getDsize()
この辞書ファイル内の、double-array領域のサイズ(バイト数)を取得する。 |
java.lang.String |
getFilename()
辞書ファイルのパスを取得する。 |
int |
getFsize()
この辞書ファイル内の、素性領域のサイズ(バイト数)を取得する。 |
int |
getLexsize()
辞書見出し数を取得する。 |
int |
getLsize()
接続コスト行列の左サイズを取得する。 |
int |
getRsize()
接続コスト行列の右サイズを取得する。 |
int |
getTsize()
この辞書ファイル内の、token領域のサイズ(バイト数)を取得する。 |
int |
getType()
辞書のタイプを取得する。 |
int |
getVersion()
辞書のバージョンを取得する。 |
boolean |
isCompatible(Dictionary d)
dとこの辞書の互換性をチェックする。 |
static int |
makeTokenValue(int baseIndex,
int numTokens)
トークンのインデックスとトークン数から、Trieに格納する値を算出する。 |
static int |
numTokens(Trie.Result r)
rの示す表層形を持つ単語の数を取得する。 |
void |
token(int idx,
Token token)
Token配列内のインデックスを直接指定して読む。 |
void |
token(Trie.Result r,
int offset,
Token token)
rの指す表層形を持つ最初のTokenから数えて、offset番目のTokenを読む。 |
クラス java.lang.Object から継承されたメソッド |
---|
clone, equals, finalize, getClass, hashCode, notify, notifyAll, toString, wait, wait, wait |
フィールドの詳細 |
---|
public static final int TYPE_SYS_DIC
public static final int TYPE_USR_DIC
public static final int TYPE_UNK_DIC
public static final int MIN_FILE_SIZE
public static final int MAGIC
public static final int VERSION
コンストラクタの詳細 |
---|
public Dictionary(java.lang.String filename) throws DictionaryException, java.io.IOException
Dictionary(String, boolean)
において、
mapをtrueに指定した場合と同じ。
filename
-
DictionaryException
java.io.IOException
public Dictionary(java.lang.String filename, boolean map) throws DictionaryException, java.io.IOException
filename
- コンパイル済み辞書ファイルのパスmap
- trueなら、メモリマップトファイルを用いてデータを読み込む。
falseなら、最初にすべてのデータをメモリ上にロードする。
DictionaryException
java.io.IOException
メソッドの詳細 |
---|
public java.lang.String getFilename()
public int getVersion()
public int getType()
public int getLexsize()
public int getLsize()
public int getRsize()
public int getDsize()
public int getTsize()
public int getFsize()
public boolean isCompatible(Dictionary d)
d
-
public void token(Trie.Result r, int offset, Token token)
r
- [in] Trieの検索結果offset
- [in] オフセットtoken
- [out] 読み込んだ情報を格納するトークンpublic void token(int idx, Token token)
idx
- [in] インデックスtoken
- [out] 読み込んだ情報を格納するトークンpublic static int numTokens(Trie.Result r)
r
- Trieの検索結果
public static int baseIndex(Trie.Result r)
r
- Trieの検索結果
public static int makeTokenValue(int baseIndex, int numTokens)
baseIndex
- 同じ見出しを持つTokenの最初のものの位置numTokens
- 同じ見出しを持つTokenの数
public java.lang.String feature(Token t)
t
-
public boolean exactMatchSearch(java.lang.CharSequence key, Trie.Result r)
key
- [in] 見出し語r
- [out] 検索結果
public int commonPrefixSearch(java.lang.CharSequence key, int offset, int len, Trie.Result[] result, int rlen)
key
- [in] 見出し語のprefixを含むシーケンスoffset
- key内のprefixが始まる位置len
- key内のprefixの長さresult
- 検索結果rlen
- resultに検索結果を格納する数の上限
|
|||||||||
前のクラス 次のクラス | フレームあり フレームなし | ||||||||
概要: 入れ子 | フィールド | コンストラクタ | メソッド | 詳細: フィールド | コンストラクタ | メソッド |