8.3.19. `normalize`¶

ご用心

normalize コマンドは実験的な機能です。このコマンドは将来的に変更されるかも知れません。

8.3.19.1. 概要¶

normalize コマンドは指定したノーマライザーでテキストを正規化します。

normalize コマンドを使うのにテーブルを作成する必要はありません。このコマンドは、ノーマライザーの結果を確認するのに便利です。

8.3.19.2. 構文¶

normalize コマンドは normalizer と string という二つの引数をとります。これらの引数はどちらも必須です。

normalize normalizer
          string
          [flags=NONE]

8.3.19.3. 使い方¶

以下は normalize コマンドの簡単な使用例です。

実行例:

normalize NormalizerAuto "aBcDe 123"
# [
#   [
#     0,
#     1337566253.89858,
#     0.000355720520019531
#   ],
#   {
#     "normalized": "abcde 123",
#     "types": []
#   }
# ]

8.3.19.4. 引数¶

このセクションでは normalizer の引数について説明します。

8.3.19.4.1. 必須引数¶

必須引数は二つあります。 normalizer と string です。

8.3.19.4.1.1. `normalizer`¶

ノーマライザー名を指定します。 normalize コマンドは normalizer で指定された名前のノーマライザーを使います。

組み込みのノーマライザーの一覧は ノーマライザー にあります。

以下は NormalizerAuto ノーマライザーを使う例です。

TODO

他のノーマライザーを使いたい場合は、 register コマンドでノーマライザープラグインを登録する必要があります。例えば、 groonga-normalizer-mysql を登録することでMySQL互換の正規化方法を使うことができます。

8.3.19.4.1.2. `string`¶

正規化したい文字列を指定します。

string の中に文字列を含める場合は、シングルクォート（ ' ）またはダブルクォート（ " ）で string をクォートする必要があります。

string の中で空白を使う例です。

TODO

8.3.19.4.2. 省略可能引数¶

いくつか省略可能な引数があります。

8.3.19.4.2.1. `flags`¶

ノーマライズ処理をカスタマイズするオプションを指定します。「 | 」で区切って複数のオプションを指定することができます。例えば、 REMOVE_BLANK|WITH_TYPES というように指定できます。

指定可能なフラグは以下の通りです。

フラグ	説明
`NONE`	無視されます。
`REMOVE_BLANK`	TODO
`WITH_TYPES`	TODO
`WITH_CHECKS`	TODO
`REMOVE_TOKENIZED_DELIMITER`	TODO

以下は REMOVE_BLANK を使った例です。

TODO

以下は WITH_TYPES を使った例です。

TODO

以下は REMOVE_TOKENIZED_DELIMITER を使った例です。

TODO

8.3.19.5. 戻り値¶

[HEADER, normalized_text]

HEADER

HEADERのフォーマットは [0, UNIX_TIME_WHEN_COMMAND_IS_STARTED, ELAPSED_TIME] です。HEADERについては 出力形式 を参照してください。

normalized_text

normalized_text はオブジェクトです。このオブジェクトは以下の属性を持っています。

名前

説明

normalized
正規化されたテキスト。

types An array of types of the normalized text. The N-th types shows the type of the N-th character in normalized.

8.3.19.6. 参考¶

ノーマライザー

groonga - オープンソースのカラムストア機能付き全文検索エンジン

8.3.19. `normalize`¶

8.3.19.1. 概要¶

8.3.19.2. 構文¶

8.3.19.3. 使い方¶

8.3.19.4. 引数¶

8.3.19.4.1. 必須引数¶

8.3.19.4.1.1. `normalizer`¶

8.3.19.4.1.2. `string`¶

8.3.19.4.2. 省略可能引数¶

8.3.19.4.2.1. `flags`¶

8.3.19.5. 戻り値¶

8.3.19.6. 参考¶

目次

前のトピックへ

次のトピックへ

このページ

名前	説明
`normalized`	正規化されたテキスト。
`types`	An array of types of the normalized text. The N-th `types` shows the type of the N-th character in `normalized`.

groonga - オープンソースのカラムストア機能付き全文検索エンジン

ナビゲーション

8.3.19. normalize¶

8.3.19.1. 概要¶

8.3.19.2. 構文¶

8.3.19.3. 使い方¶

8.3.19.4. 引数¶

8.3.19.4.1. 必須引数¶

8.3.19.4.1.1. normalizer¶

8.3.19.4.1.2. string¶

8.3.19.4.2. 省略可能引数¶

8.3.19.4.2.1. flags¶

8.3.19.5. 戻り値¶

8.3.19.6. 参考¶

目次

前のトピックへ

次のトピックへ

このページ

クイック検索

ナビゲーション

8.3.19. `normalize`¶

8.3.19.4.1.1. `normalizer`¶

8.3.19.4.1.2. `string`¶

8.3.19.4.2.1. `flags`¶