30天學會Data Integration - Kettle系列 第 11 篇 - Step - 讀取Excel檔案

 此篇將介紹如何讀取Excel檔案,請先找到這個Step,[input]Microsoft Excel Input,然後就開始新增Step吧!




準備Excel檔案

與前一篇一樣,先來準備一下要讀取的資料


請記得存成Excel 97-2003格式,也就是.xls檔案,.xlsx是不支援的喔!



接著[input]Microsoft Excel Input上點滑鼠左鍵兩下,即可開始設定

Files

首先,迎接我們的是Files頁籤,這邊要先確認你要讀取的Excel的檔案是哪種格式

  • Excel 97-2003 XLS (預設值)
  • Excel 2007 XLSX (Apache POI)
  • Excel 2007 XLSX (Apache POI Streaming)
  • Open Office ODS

選擇檔案格式之後,按下Browser按鈕來選取檔案,完成後請點一下Add按鈕,在Selected files中會看到已新增的檔案,大致上就完成此頁籤的設定囉



Sheets

接著,要來指定要讀取哪一張工作表,如果沒有設定,那就是讀取全部工作表的資料,操作步驟請參考下圖



另外,可以指定要讀取資料行的範圍,可以保持空白,系統會自動幫我們補0,也就是代表讀取全部資料的意思



Content

  • Header:是否當然欄位名稱
  • No empty rows:打勾的話則不會讀取空白的資料行,直接略過,若沒有勾選,空白的資料會以null顯示
  • Stop on empty row:遇到空白的資料行,就停止資料讀取,也就是位於空白行下面的資料,都不會被讀取進來
  • Limit:可以限制要讀取幾筆資料,0代表讀取全部資料
  • Encoding:與讀取CSV檔案一樣,都可以設定編碼方式


Fields

操作方式與CSV類似,一樣是按下Get more fields,接著按Preview按鈕即可預覽取得的資料



如果想要編輯Fields,可以按右鍵的選項來進行設定,也可以直接按下Delete鍵刪除Fields



Additional output fields

如果想新增一些關於excel資訊的欄位,可以自行輸入欄位名稱,按預覽來觀看加入欄位的資訊



下一篇將介紹,如何讀取資料庫,我想這應該是大家最期待的吧XD


留言

這個網誌中的熱門文章

CPE 一顆星選集題目說明與解答 - Java 筆記與心得分享

Visual Studio 自動排版格式化程式碼

1. Vito's family (CPE10406, UVA10041) - CPE一顆星解答與說明