抽出パターン
ドキュメント から情報を抽出する場合、抽出エンジンは、品詞抽出パターンのセットをテキストの単語の「積み重ね」に適用して、抽出の候補のキーワード (単語および句) を特定します。抽出パターンを追加または変更できます。
品詞には、名詞、形容詞、過去分詞、決定詞、前置詞、人の名、イニシャル、助詞など、文法的な要素が含まれます。これら一連の要素が、品詞の抽出パターンを構成しています。IBM® Corp. のテキスト マイニング製品では、各品詞が 1 つの文字で表され、パターンが定義しやすくなります。例えば、形容詞は小文字の「a」で表されます。デフォルトでは、サポートされているコードのセットがデフォルトの抽出パターンの上位に、パターンのセットと、各パターンの例と共に表示され、使用される各コードについて理解しやすくなります。
抽出パターンの書式規則
- 1 行ごとに 1 つのパターン。
- 行頭に
#を使用してパターンを無効化する。
単語の指定された順序は抽出エンジンによって一度だけ読み込まれ、エンジンが合致を検出した最初の抽出パターンに割り当てるため、抽出パターンの表示順が非常に重要になります。
サポートされる品詞コード
英語のコンパイル済み辞書で定義されている、サポートされるすべての品詞コードを以下の表に示します。
特定のテンプレートで使用されているすべての品詞は、の上部にリストされます。
基本リソース テンプレートと意見テンプレートの主な違いは、基本テンプレートで最小の限定詞 (d) と前置詞 (c) を使用している場合に、意見テンプレートでは範囲の広いもの (e と r) を使用していることです。「0」および「1」はすべての意見テンプレートで限定的に使用されます。を参照してください。
それ以外の英語のテンプレートでは、辞書にリストされていない一部の品詞を使用している場合があります (例えば、Market Intelligence テンプレートでは w と W を使用しています)。ただしその場合、それらの品詞はで特定の単語に割り当てられています。
| コード | 意味 | 例 |
|---|---|---|
| a | 形容詞 | abdominal、blue... |
| A | 未使用 | 未使用 |
| b | 副詞 | frequently、often、very、... |
| B | 未使用 | 未使用 |
| c | 前置詞 | / |
| C | ミススペルの単語に対する内部コード | |
| d | 限定詞 | the |
| D | 未使用 | 未使用 |
| e | 拡張限定詞 | the、an、my、your... |
| E | 未使用 | 未使用 |
| f | 名 | John、Mary... |
| F | 未使用 | 未使用 |
| g | 未使用 | 未使用 |
| G | 国籍の形容詞 | french、american... |
| h | 未使用 | 未使用 |
| H | 未使用 | 未使用 |
| i | 「.」に先行するすべての単一文字を頭字化する | 「a.」、「w.」および「w」などの一部の単一文字 (「John W. Doe」などの人名の抽出に使用) |
| I | 未使用 | 未使用 |
| j | 未使用 | 未使用 |
| J | 未使用 | 未使用 |
| k | 未使用 | 未使用 |
| K | 未使用 | 未使用 |
| l | 未使用 | 未使用 |
| L | 未使用 | 未使用 |
| m | 名詞または不明語 | dog、ibm |
| M | 未使用 | 未使用 |
| n | 名詞 | dog |
| N | 一部の固有名詞 | ibm |
| o | 接続詞 | and、& |
| O | 未使用 | 未使用 |
| p | 過去分詞 | abandoned、accessorized... |
| P | 未使用 | 未使用 |
| q | 未使用 | 未使用 |
| Q | 修飾子 | expensive、small、good、... |
| r | 広範囲の前置詞 | of、among、against、from... |
| R | 未使用 | 未使用 |
| s | ストップワード | 抽出対象外のすべての単語 |
| S | 未使用 | 未使用 |
| t | 敬称 | mrs.、mrs、captain、brig.、... |
| T | 未使用 | 未使用 |
| u | 定義により不明。辞書に存在せず | |
| U | 未使用 | 未使用 |
| v | 動詞 | eat、eats、ate、eating、... |
| V | 不定詞の動詞 | eat、... |
| w | 未使用 | 未使用 |
| W | 未使用 | 未使用 |
| x | 助動詞 | be |
| X | 未使用 | 未使用 |
| y | 小辞 | von、di、de、... (人名の抽出に使用します。例: John von Doe) |
| Y | 未使用 | 未使用 |
| z | 未使用 | 未使用 |
| Z | 未使用 | 未使用 |
| 0 | 意見の副詞 | 意見のみで使用します。を参照してください。 |
| 1 | to (意見の場合) | を参照してください。 |
| 2 | 未使用 | 未使用 |
| 3 | 未使用 | 未使用 |
| 4 | 未使用 | 未使用 |
| 5 | 未使用 | 未使用 |
| 6 | 未使用 | 未使用 |
| 7 | 未使用 | 未使用 |
| 8 | 未使用 | 未使用 |
| 9 | 未使用 | 未使用 |