Jako dane wejściowe rozumiemy plik zawierający interesujące nas dane (billing, wyciąg z konta bankowego...). Pliki te wczytywane są za pomocą importerow.
Obecnie obsługiwane formaty plików to:
Format pliku | Klasa importera | Opcje importera |
---|---|---|
tekstowy .ack | AckDataImporter | - |
tekstowy (kolumny oddzielone spacjami) .txt | TxtDataImporter | - |
oddzielany przecinkami .csv | CsvDataImporter | Separator |
Excel .xls | JxlXlsDataImporter | - |
Po imporcie z pliku dane przechowywane są w formacie dwuwymiarowej tablicy stringów reprezentowanej przez klasę TabularData. Klasa TabularData zawiera liste wierszy (DataRow). Wiersze nie muszą posiadać tej samej ilości kolumn.
Rysunek 1: klasa Tabular Data oraz Data Row.
Podczas konwersji wiersze (DataRow) przekształcane sa w relacje (IRelation). Zbiór takich relacji jest reprezentowany przez IDataSet.
Rysunek 2 przedstawia diagram klas związanych z klasą DataSet oraz przykład specjalizacji zbioru danych w postaci billingu.
Klasa DataSet składa się z wielu relacji.
Relacja Relation natomiast może należec do wielu obiektów DataSet. Każda relacja posiada dwa {Entity} - source i target.
Entity może być source lub target dla wielu relacji.