Czym jest Tableau?
Tableau jest doskonałym narzędziem dającym możliwość interaktywnego analizowania danych. Jednym ze źródeł sukcesu Tableau, obok doskonałego interfejsu, jest możliwość załadowania kopii danych do Tableau w postaci ekstraktów danych. Dzięki nim Tableau niemal natychmiast modyfikuje wizualizacje i tabele na żądanie użytkownika.
Ekstrakty to struktury danych zapisane przez silnik Tableau zawierające kopię informacji źródłowych, często zagregowane w celu zmniejszenia ich wolumenu. Są to bardzo wydajne struktury danych, które dla większości zastosowań są wystarczające.

Przychodzi jednak moment kiedy napotykamy na problem, że źródło danych, z którego chcemy skorzystać jest zbyt duże i wolne, aby odpytywać je bezpośrednio, a rodzaj analizy, którą chcemy przeprowadzić nie pozwala nam stworzyć agregowanego ekstraktu danych.
Co zrobić kiedy danych jest zbyt dużo dla ekstraktu ?
Jednym z możliwych rozwiązań jest oczywiście zmiana wymagań dla dashboardu/analizy. Nie jest to jednak odpowiedź, która usatysfakcjonuje użytkowników.
Drugą możliwością jest wykorzystanie źródła danych, które zapewni interaktywność ekstraktu oraz nieograniczoną skalowalność. Takie źródło powinno pracować z wydajnością gwarantującą natychmiastowe odświeżanie ekstraktów. Powinno być łatwe w obsłudze, gdyż ma wspierać nas w pracy analitycznej.

Czy istnieją rozwiązania, które bez dużych nakładów pozwalają tak usprawnić pracę?
Można sięgnąć po narzędzia Open-Source, które dadzą nam albo wydajność, albo przystępność obsługi albo stabilność. Niestety w świecie darmowych rozwiązań te cechy prawie nigdy nie idą w parze..., może poza jednym narzędziem. Chociaż nie jest ono open-source to jednak do pewnej wielkości pozostaje narzędziem darmowym(!).
Narzędzie to nazywa się Vertica. Jest to niezwykle szybki silnik bazodanowy, bardzo łatwy w obsłudze i radzący sobie z naprawdę dużymi danymi. Jest na tyle sprawny że używają go nawet firmy takie jak Facebook, Uber, Twitter czy AT&T. Często właśnie z Tableau. Dla użytkownika jest ważne, że nie kupując dodatkowego oprogramowania, może zacząć wykonywać analizy, na które wcześniej jego istniejące źródła danych kazały czekać godzinami lub w ogóle odmawiały pracy.
Co można uzyskać ?

Vertica jest silnikiem przetwarzania równoległego MPP. Przetwarzania są rozpraszane na kilkadziesiąt procesorów naraz.
- Vertica niezwykle efektywnie kompresuje dane i nie wymaga ani dysków SSD ani dużej przestrzeni dyskowej.
- Vertica automatycznie stroi się pod kątem wykonywanych zapytań.
- Vertica pozwala połączyć w jeden system wiele serwerów, aby podnosić prędkość i dostępność systemu.
Tableau pracujące z Vertica w trybie Live, zgodnie z nazwą, zwraca wyniki natychmiast. Fakt że teraz dane nie są agregowane w ekstraktach Tableau, pozwala na wykorzystanie flagowej funkcjonalności Tableau – drill down. Każdy analityk może zejść w swojej analizie do poziomu pojedynczych transakcji dokładnie sprawdzając interesujące go pozycje wykresów lub tabeli.
