sobota, 28 kwietnia 2018

Tableau 2018.2 Beta już dostępna

Własnie ukazała się kolejna wersja Tableau Desktop o numerze 2018.2, która wprowadza kilka ciekawych nowości:
  • Tableau Services Manager - zupełnie nowe narzędzie do administrowania serwerem Tableau (Windows i Linux)
  • Extensions API - możliwość bezpośredniego umieszczania zewnętrznych aplikacji webowych w dashboardach tableau
  • Spatial join - możliwość złączenia danych w sytuacjach, gdy jedynym wspólnym polem jest lokalizacja
  • Zaawansowane możliwości formatowania workbooków (automatic mobile layouts, dashboard grids, transparent quick filters)

środa, 14 marca 2018

Project Maestro Beta 4!

Muszę przyznać, że tempo w jakim dostajemy kolejne buildy Project Maestro jest naprawdę imponujące. Po raz kolejny widzimy, że twórcom Tableau bardzo zależy na jak najszybszym dogonieniu konkurencji w zakresie przetrwarzania i transformacji danych. Co nowego tym razem?


  • Ogólna poprawa wydajności (wildcard union, łaowanie join summary)
  • Usprawnienia funkcji grupowania
  • Możliwość publikowania ekstraktów danych bezpośrednio na tableau server
  • Łatwiejsze monitorowanie przebiegu każdego workflow
Na koniec przedstawię jeszcze podsumowanie wszystkich funkcjonalności dostępnych w tej wersji:

Connect:  Text files, Excel files (including Data Interpreter), TDE (Tableau Data Extract) and major relational databases.

Combine:  Join, Union, Wildcard Union (union multiple text files or Excel sheets based on a folder or pattern).

Reshape:  Aggregate, filter data rows or fields, pivot columns to rows.

Clean:  Calculations (including quick cleaning), Change data tye, split, auto-dataparse, rename fields, group and replace values, and fuzzy clustering.

Output:  Output to TDE, Hyper or CSV and Open in Tableau.

Publish:  Publish prepared data source to Tableau Server or Online.


piątek, 2 marca 2018

Tableau 2018.1 Beta 2 już dostępna

Jeszcze dobrze nie oswoiliśmy się z nowościami zaprezentowanymi w pierwszej becie Tableau o numerze 2018.1, a już pojawiła się informacja o fazie drugiej. Tym razem do naszej dyspozycji oddano następujące funkcjonalności:

  • połączenie z danymi przestrzennymi (spatial data) bezpośrednio z SQL Server - złożone przestrzenne zapytania, wykorzystanie custom SQL oraz zaawansowanej analizy danych przestrzennych
  • Dual-axis mapping - czyli zaawansowane możliwości łączenia zarówno customowych, jak
     i automatycznie generowanych przez tableau współrzędnych geograficznych na jednej osi
  • Downgrade workbooków z Tableau Server i Tableau Online - w końcu bez grzebania w xml
Nowości jest dużo więcej, w związku z czy zachęcam do zapoznania sie z pełną listą zmian na stronie producenta oraz poniższą grafiką przedstawiającą najważniejsze funkcjonalności w Beta 2.


wtorek, 27 lutego 2018

Tableau ponownie wśród liderów rynku BI według nowej odsłony prestiżowego raportu Gartnera!

W sieci można już znaleźć link do najnowszej edycji długo wyczekiwanego raportu Magic Quadrant for Analytics and Business Intelligence Platforms. Analitycy Gartnera ponownie wyróżnili Tableau, Power BI oraz Qlik jako zdecydowanych liderów rynku.

Magic Quadrant for Analytics and Business Intelligence Platforms 2018
źródło: Gartner

Raport chwali ostatnie zmiany dokonane przez twórców Tableau oraz nadchodzące funkcjonalności Project Maestro zapowiedziane na 2018 rok, ale zwraca również uwagę na wyniszczającą wojnę cenową z Microsoftem, która spowodowała znaczny spadek tempa wzrostu firmy z Seattle. Gartner zauważa również coraz większą lukę pomiędzy długoterminową wizją Tableau, a planami giganta z Redmond. Na chwilę obecną to jednak ciagle Tableau jest nazywane "Gold standard" for interactive visual exploration, więc moim zdaniem sytuacja praktycznie nie zmieniła się od czasu poprzedniej edycji raportu z 2017.

Tradycyjnie już polecam zapoznanie się pełnym artykułem na stronie Gartnera. Już w marcu raport zostanie rozszerzony o tzw. "Critical Capabilities of a BI and Analytics Platform" - wtedy z pewnością wrócimy do tego tematu, żeby dokładnie przeanalizować obecną sytuację na rynku BI.

czwartek, 8 lutego 2018

Ruszyła kolejna beta Project Maestro!

Z kronikarskiego obowiązku wypadałoby wspomnieć, że właśnie ruszyła trzecia faza betatestów Project Maestro - czyli narzędzia ETL prosto od producentów Tableau. Trzeba przyznać, że pracę nad tym projektem nabierają tempa. W wersji Beta 3 przetestujecie między innymi:

  • czyszczenie pól tekstowych: upper/lower case, usuwanie znaków interpunkcyjnych i spacji
  • więcej opcji filtrowania dat (w tym tzw. "relative date filters")
  •  zmiana nazwy kolumn na etapie inputu
  • usprawnienia joinów i pivotów (podgląd mismatched values, smart default names)
  • łatwiejsze dodawanie kolejnch połączeń (drag and drop)
  • operacje na kilku "stepach" jednocześnie (bulk operations)
  • łatwiejsze debugowanie data flow (go to error)

Trzeba przyznać, że w porównaniu do poprzedniej wersji Beta 2, zmian jest naprawdę sporo. Niektóre z nich, takie jak łatwiejsze debugowanie i "bulk operations" to na pewno ważny krok w stronę pełnoprawnego narzędzia ETL. Jeszcze niedawno złośliwi mówili, że to co dostaliśmy do tej pory można było nazwać co najwyżej aplikacją typu "ETL lite", której daleko do rozwiązań takich jak Alteryx czy Informatica. Być może już za kilka lat to własnie Maestro będzie wyznacznikiem najwyższej jakości w przetwarzaniu i transformacji danych. Na pewno warto śledzić ten bardzo dynamicznie rozwijający się projekt :)

niedziela, 4 lutego 2018

Rusza Tableau 2018.1 Beta 1

Tableau zaczyna rok bardzo intensywnie - właśnie ruszyła kolejna Beta o zupełnie nowym oznaczeniu 2018.1 (przypominam, że dosłownie przed kilkoma tygodniami na naszych dyskach twardych gościliśmy wersję o numerze 10.5). Czyżby to zapowiedź jeszcze większej ilości programów beta w 2018? Już teraz producenci przyznają, że kolejny build Beta 2 będzie zawierał dużo więcej nowości. A co przygotowano dla nas juz teraz?



  • Step and Jump lines - funkcja pozwalająca na łatwiejsze wyświetlanie danych typu discrete
  • Analytic object guidance - coś w stylu "Show Me" tylko dostępne w zakładce Analytics
  • Easier connector driver installation - teoretycznie Tableau powinno samo rozpoznać, jakich sterowników potrzebujesz w celu podłączenia się z danym data source
Zestawienie nowych funkcjonalności Tableau 10.5 Beta 2 (v2018.1)

poniedziałek, 22 stycznia 2018

Project Maestro Beta 2 - moje wrażenia

Jakiś czas temu pisaliśmy o nowym przedsięwzięciu producentów Tableau - innowacyjnym narzędziu ETL o nazwie kodowej Project Maestro. Prawdopodobnie każdy, kto pracuję z dużo ilością danych (szczególnie, analitycy, deweloperzy) zgodzi się z tym, że w większości przypadków to właśnie przygotowanie danych stanowi największe wyzwanie we współczesnych projektach IT (niezależnie od ich wielkości). Niektóre badania mówią nawet, że na ten etap tracimy około 80% naszego czasu, a sama wizualizacja danych to tylko 20% całkowitego czasu trwania projektów. Oczywiście sprawa jest dużo bardziej złożona i wszystko zależy tak naprawdę od wielu czynników, jednak jako doświadczony konsultant Tableau, który brał udział w kilkunastu projektach wdrożeniowych różnej wielkości, niestety muszę się zgodzić z tym stwierdzeniem :)

ETL (Extract, Transform, Load)
 to zbiorcza nazwa narzędzi służących do transformacji danych, które pozwalają na integrację wielu niejednorodnych źródeł (pliki tekstowe, excele, bazy relacyjne itp) oraz ich przetwarzanie/wzbogacenie w celu uzyskania jednolitego zbioru danych spełniającego szereg uprzednio zdefiniowanych kryteriów dotyczących ich jakości (tzw. data quality). Jeszcze do niedawna byliśmy w tym zakesie skazani na rozmaite narzędzia third party (np. Alteryx, Informatica czy Pentaho). W chwili obecnej producenci Tableau wyszli na przeciw naszym oczekiwaniom i zaoferowali nam rozwiązanie w pełni zintegrowane z Tableau Desktop. Co więcej, już na pierwszy rzut oka widać, że podobnie jak w ich pierwszym projekcie, interfejs jest bardzo przejrzysty, a samo narzędzie nie przytłacza użytkownika przy pierwszym kontakcie.

Pierwsza beta oferowała jedynie podstawową funkcjonalność z zakresu przetwarzania danych (filtrowanie, kalkulacje, splity, joiny, uniony, agregacje, itp). Przyznam szczerze, że potraktowałem to jako przystawkę przed głównym daniem, które producent obiecał dostarczyć w późniejszym terminie.

Wraz z drugą fazą programu Beta, twórcy oddali w nasze ręce kilka nowych możliwości, np. wildcard union, znaną z Tableau funkcję data interpreter oraz popularne pivoty, których tak bardzo brakowało mi w pierwszym buildzie!


Tuż po połączeniu się z wybranym plikiem ujrzymy pierwszy ekran, który pozwala na zapoznanie się ogólną strukturą analizowanych danych (liczba kolumn, wierszy, typy danych, etc). Na tym etapie możemy wykorzystać dodatkowe filtry i obejrzeć dowolny sample danych (można użyć opcji random).

Pierwszy ekran, który zobaczymy po wczytaniu dowolnego pliku z danymi

Na pierwszym etapie mamy również możliwość zmiany defaultowych typów danych wykrytych przez program. Po dodaniu kolejnego "stepu" w naszym workflow pojawia się szereg opcji dotyczących jakości oraz czyszczenia danych. Muszę przyznać, że widziałem już niejedno narzędzie ETL, i nigdzie informacje te nie były podane w tak przejrzysty sposób. Widać, że twórcy Tableau inspirowali się najlepszymi pomysłami swoich konkurentów (Alteryx, to znowu ty?).

Kolejny etap, który pozwoli nam lepiej zrozumieć nasze dane

Na tym etapie możeny dokładnie zapoznać się ze wszystkimi danymi. W bardzo prosty sposób usuniemy irytujące literówki oraz pogrupujemy te same serie danych. O wszystkich dokonanych zmianach jesteśmy informowani w lewej górnej częsci ekranu (screen).

Wszystkie dokonane zmiany zostaną zapamiętane przez program

Project Maestro korzysta również z dobrodziejstw machine learningu i jest w stanie samodzielnie grupować podobne wartości w ramach pojedynczego wymiaru (zazwyczaj są to po prostu irytujące literówki czy też różnice w kodowaniu znaków). Ten efekt możemy uzyskać - uwaga - za pomocą jednego kliknięcia! (Group and Replace-Pronunciation). Jest również możliowość manualnego wskazania wartości, które zostaną "zmergowane".
Opcja pozwalająca na oczyszczenie danych przy wykorzystaniu machine learningu

Nie zabrakło również rozbudowanych opcji dotyczących delimitowania długich ciągów wyrażeń, co bardzo przydaje sie w trakcie pracy z plikami tekstowymi.

Splity, czyli jedna z najprzydatniejszych umiejętności w Maestro
Moim abolutnym faworytem są jednak stare dobre pivoty, których tak bardzo brakowało w pierwszej wersji bety. Teraz nawet najgorzej sformatowany excel może zostać "spłaszczony" za pomocą dosłownie kilku kliknięć!

Dobry pivot potrafi uratować życie analityka

Ostateczny efekt naszych prac możemy wyeksportować do jednego z trzech formatów:
  • Tableau Data Extract (.hyper)
  • Tableau Data Extract (.tde)
  • Plik tekstowy .csv - bardzo przydatne - nie każdy na świecie korzysta z Tableau :)
Eksportowanie danych do pliku .tde
Cały proces eksportu trwa dosłownie kilka-kilkanaście sekund w zależności od wielkości naszego zbioru danych oraz ilości wukonywanych operacji. Na pewno jest to mechanizm dużo wydajniejszy, niż ten zastosowany w Tableau, bo te same operacje w Maestro były wykonywane zdecydowanie szybciej. To zapewne zasługa nowego mechanizmu hyper oraz lepszej optymalizacji zapytań.

Jak na wczesną betę Maestro wygląda naprawdę nieźle. Oczywiście ma sporo problemów ze stabilnością, a także brakuje mu wielu podstawowych funkcjonalności, które są dostępne "out of the box" np. w takim Alteryxie, jednak już teraz widać, że producenci Tableau zmierzają w dobrym kierunku. Osobiście traktuję Project Maestro w kategoriach fajnej ciekawostki oraz porgramu "ETL lite" jednak niewykluczone, że już za kilkanaście miesięcy o tym produkcie będzie naprawdę głośno, bo przejrzyste i wydajne narzędzia do transformacji danych są zawsze w cenie.