Pipelineの説明(詳細割愛)
前処理について記載します。
日本語抽出に利用するingest-attachmentを例に記載しています。
https://www.elastic.co/guide/en/elasticsearch/plugins/current/using-ingest-attachment.html
その他のプラグインはプラグインのガイドの記載方に合わせてください。
[“field” : “message”]の部分がdocument登録の際、pluginに渡されるFieldになります。messageはLogstashからESに渡す際のfield
{
"attachment" : {
"description" : "Extract attachment information",
"processors" : [
{
"attachment" : {
"field" : "message",
"indexed_chars" : -1,
"properties" : [
"content",
"content_type",
"title",
"author",
"keywords",
"date",
"content_length",
"language"
]
}
}
]
}
}
区切り文字で分割するsplitプロセッサを例に記載しています。
https://www.elastic.co/guide/en/elasticsearch/reference/current/split-processor.html
その他のプロセッサはプロセッサのガイドの記載方に合わせてください。
{
"description": "Extract attachment information",
"processors": [
{
"split": {
"field": "data",
"separator": ",",
"preserve_trailing": true
}
}
]
}