Pentaho Data Integration 先行ステップからの値を引き継いで
Pentaho Data Integrationで先行ステップの値を引き継いで、データ変換(Kettleデータ変換 .ktr)を実装してみる。
Talend のtMySQLRowを使ってクエリーの変数バインドをしていた処理と同等の機能をPentahoで実装してみる。
Pentahoで処理を実装する場合、データ変換で実装する方法とジョブで実装する方法があります。データ変換で作成したものは、ジョブから呼び出すことが可能。ジョブはデータ変換を含めた一連の処理制御の実装で利用する等、処理そのものについてはどちらでも実装、実行可能だったりするので厳密な所はマニュアル等を参照ください。
今回は、データ変換として作成(実装)してみます。
メニュー、ファイル(F)-新規(N)-データ変換(T)より、新規データ変換を作成します。
デザインタブの入力より、テーブル入力を選択して貼り付けます。
テーブル入力の設定を行います。データソース名は、新規作成よりMySQLの接続設定を作成します。
接続を作成しデータソース名を設定したら、SQLステートメントを入力します。
ブレビューを実行しSQLステートメントの実行結果が想定とおりか確認します。
問題がなければプレビュー画面を閉じ、OKボタンをクリックして設定を確定します。
同じ要領で、テーブル入力(テーブル入力 2)もう一つ貼り付けてください。テーブル 2を貼り付けたら、テーブル入力とテーブル入力 2を接続してください。その後テーブル 2の設定を行います。
データソース名をセットし、SQLステートメントを入力、ここで先行ステップから値を引き継ぐにチェックを入れます。OKをクリックし設定を確定してください。
次に、デザインタブの出力よりテーブル出力を貼り付けてください。
テーブル出力の設定を行います。データソース名を設定しテーブル名を参照(B)ボタンより選択してください。
その他、適宜必要に応じて各項目の設定を行います。
出来上がったデータ変換(処理)が以下、
確認ボタンで実行前にデータ変換処理に問題がないかチェック
●実行前のデータを確認
●データ変換処理を実行結果
●実行後のデータを確認
・・・Talendと比べて・・・ツールの日本語化という意味では、Pentahoの方がより日本語化されているので、直感的に作成しやすいかなと個人的には思いました。ツール毎に癖はあるので嵌りどころはそれぞれあると思います。この手のツールはノンプログラミングによる実装面の効率化が良く謳われていますが、ツールが自動で判断設定した内容そのままをうのみにするとうまく動作せず、手動で調整(設定変更)が必要であったり以外と単純なことで嵌り解決に苦労する事がある点は、PentahoもTalendも変わらずと言った印象を受けました。
0コメント