Jako dane wejściowe rozumiemy plik zawierający interesujące nas dane (billing, wyciąg z konta bankowego...). Pliki te wczytywane są za pomocą importerow .
Obecnie obsługiwane formaty plików to:
Format pliku | Klasa importera | Opcje importera |
---|---|---|
tekstowy *.ack | AckDataImporter | - |
tekstowy (kolumny oddzielone spacjami) *.txt | TxtDataImporter | - |
oddzielany przecinkami *.csv | CsvDataImporter | Separator |
Excel *.xls | JxlXlsDataImporter | - |
Po imporcie z pliku dane przechowywane są w formacie dwuwymiarowej tablicy stringów reprezentowanej przez klasę TabularData . Klasa TabularData zawiera liste wierszy (DataRow ). Wiersze nie muszą posiadać tej samej ilości kolumn.
Rysunek 1 : klasa Tabular Data oraz Data Row .
Podczas konwersji wiersze (DataRow ) przekształcane sa w relacje (IRelation ). Zbiór takich relacji jest reprezentowany przez IDataSet .
Rysunek 2 przedstawia diagram klas związanych z klasą DataSet oraz przykład specjalizacji zbioru danych w postaci billingu.
Klasa DataSet składa się z wielu relacji.
Relacja Relation natomiast może należec do wielu obiektów DataSet . Każda relacja posiada dwa {Entity} - source i target .
Entity może być source lub target dla wielu relacji.