セパレーターコンポーネントは、指定した区切り文字をもとに、与えられたテキスト入力を複数のセグメントに分割するAIワークフロー用のユーティリティです。大量のテキストの個別部分を処理・分析したい場合(例:段落、行、リスト内のエントリの分割など)に特に有効です。
セパレーターは何をする?
セパレーターの主な役割は、入力テキスト(例:長いメッセージ、ドキュメント、リストなど)を、任意の区切り文字列(デフォルトは改行文字 \n)で分割し、小さなテキストチャンクのリストにすることです。これにより、後続コンポーネントが各セグメントを個別に処理・分析できるようになります。
入力
| 名前 | 型 | 説明 | デフォルト | 必須 |
|---|---|---|---|---|
| 入力 | メッセージ | 分割したいテキスト | (空) | いいえ |
| セパレーター | 文字列 | 入力を分割するために使う文字列 | \n | いいえ |
- 入力:分割したいプレーンテキストを指定します。メッセージやあらゆるテキストデータを利用できます。
- セパレーター:分割に使用する文字や文字列を定義できます。たとえばカンマ区切りの場合は
,、段落ごとに分割する場合は\n\nなどが利用できます。
出力
| 名前 | 型 | 説明 |
|---|---|---|
| データ | メッセージ | 分割後のテキストセグメントのリスト |
出力は、元の入力を指定した区切り文字で分割した各テキスト部分のリストです。
セパレーターを使う理由
- 前処理:大きなテキストを小さな単位に分割し、他のAIコンポーネントで処理しやすくします。
- 柔軟な分割:改行、カンマ、カスタムトークンなど、データに合わせて区切り文字を自由に選べます。
- ワークフロー統合:分割した各セグメントを要約・分類・翻訳など、さまざまな後続処理の個別入力として活用できます。
利用例
- 議事録やトランスクリプトを文や段落ごとに分割し、さらなる分析に活用
- カンマ区切りリストを個別の項目に分割
- ユーザー入力を複数のコマンドや質問に分ける
まとめ
セパレーターコンポーネントは、テキストを使いやすいセグメントに分割できる汎用ツールであり、AIワークフローの柔軟性と効率を高めます。区切り文字をカスタマイズすることで、さまざまなテキスト形式や処理ニーズに適応できます。
