czwartek, 22 czerwca 2017

Rusza Tableau 10.4 Beta

Właśnie ruszył program betatestów kolejnej wersji oprogramowania Tableau. Co nowego czeka nas tym razem?

  • System rekomendacji i certyfikacji opublikowanych źródeł danych (tableau server)
  • Dashboard spacing - funkcja umożliwiająca precyzyjną kontrolę nad formatowaniem naszego dashboardu (dotyczy głównie pustych przestrzeni, tzw. "white spaces")
  • Dalsze usprawnienia w web authoringu - tym razem dodano m.in możliwość edycji osi, filtrów, aliasów i grup (kolejny krok w kierunku przeniesienia najważniejszych funkcji desktopa do wersji online)
  • Poprawa geocodingu i garść nowych konektorów (to już standard)
  • Wsteczna kompatybilność przy publikowaniu na starszą wersję tableau server (do 10.2 włącznie)
  • Zupełnie nowy system komentowania dashboardów (z poprzedniego chyba nikt nie korzystał)
  • Integracja z Matlabem
  • Wprowadzenie funkcji geometrii liniowej umożliwiająca wizualizację sieci połączeń


Według informacji zamieszczonej na stronie producenta, program beta potrwa do połowy sierpnia. Tradycyjnie odsyłam do pełnej listy zmian na stronie producenta.

czwartek, 8 czerwca 2017

Tableau Performance Tuning - część II

W ostatnim artykule poświęconym Performance Tuningowi dashboardów prayglądaliśmy się wszystkim czynnikom na poziomie środowiska oraz źródła danych, które mogą poważnie wpłynać na wydajność naszych raportów. Tym razem pora zastanowić się nad konkretnymi działaniami oraz tzw. dobrymi praktykami, które możemy zastosować w trakcie tworzenia dashboardów aby przyśpieszyć ich działanie.

Wyłącz automatyczną aktualizację danych


Jeśli pracujemy z wyjątkowo dużym zbiorem danych w trybie live, warto rozważyć tymczasowe zablokowanie automatycznych update'ów (pause auto updates) do czasu dodania wszystkich dodatkowych miar i wymiarów - dzięki temu unikniemy niezwykle irytującego oczekiwania na wyrenderowanie się widoku przy każdej modyfikacji. Po zakończeniu całej operacji wystarczy ponownie włączyć opcję "resume auto updates" lub wymusić ręczny update poprzez użycie kolejnego buttona "Run Update" (również dostępny po wciśnięciu F9).

Opcje Pause Auto Updates i Run Update


Połączenie ze źródłem danych


Staraj się nie korzystać z Custom SQL, jeśli nie jest to absolutnie konieczne. Pozwoli to uniknąć kosztownych podzapytań generowanych przez Tableau. Generalnie dobrą praktyką jest używanie jak najmnijeszej liczby źródeł danych (jakkolwiek trywialnie by to nie zabrzmiało) i usuwanie na bieżąco niepotrzebnych połączeń, które mogą się stać dodatkowym obcążeniem.


Filtry kontekstowe


Nie wahaj się korzystać z filtrów kontekstowych (context filters) jeśli wiesz, że dany worksheet potrzebuje jedynie małego fragmentu całego zbioru danych np. ściśle sprecyzowanego okresu czasu, produktu czy klienta. Złota reguła mówi, że jeśli na dzień dobry musimy odfiltrować 90% naszych danych, to użycie filtra kontekstowego powinno znacznie przyśpieszyć całą operację (szczególnie, jeśli mamy do czynienia z tzw. "slow changing dimensions").

Opcja użycia filtra kontekstowego

Kolejny sposób na wykorzystanie filtrów kontekstowych w celu poprawy wydajności to zastosowanie pozornie bezsensownego filtra typu "include all" w celu zmateralizowania joinów wykonywanych przez Tableau. Dzięki takiemu prostemu zabiegowi zostanie stworzona tableau tymczasowa, która powinna kilkukrotnie przyśpieszyć dostęp do danych (pod warunkiem, że korzystamy z joinów w tableau). Jak stworzyć taki filtr? Najprościej wykorzystać Exclude none :)

teoretycznie nieistniejący filtr, czyli "exclude none"


Ekstrakty


O ekstraktach i wszystkich pozytywnych aspektach ich wykorzystywania pisaliśmy w jednym z poprzednich artykułów. Warto pamiętać o tym, że ekstrakty w Tableau są niezwykle wydajne i pozwalają w znaczny sposób przyśpieszyć dostęp do największych źródeł danych. Wyjątkowo przydatne opcję, które możemy wykorzystać przy tworzeniu ekstraktu to:

  • Hide All Unused Fields - pozwala wykluczyć wszystkie nieużywane pola w celu "odchudzenia" ekstraktu i znacznego wzrostu wydajności
  • Aggregate data for visible dimensions - czyli agregacja danych na poziomie wykorzystywanym przez wizualizację (szczególnie przydatne przy pracy z danymi transakcyjnymi )


Filtry


Istnieją pewne sytuacje, w których zwykłe filtry potrafią w znacząc sposób wpłynąc na wydajność naszego workbooka.

Staraj się unikać opcji Exclude - w przypadku zastosowania tej opcji Tableau musi każdorazowo przeskanować wszystkie dane. Dodatkowo można wtedy zapomnieć o wszystkich korzyściach związanych z wykorzystaniem indeksów na poziomie bazy danych!

Fltrowanie wymiaru czasu po indywidualnych datach (Individual dates and times) również nie jest najlepszym pomysłem w przypadku pracy z wielomilionową tabelą - zdecydowanie lepiej zastosować filtrowanie kaskadowe (np. rok, miesiąc, dzień) i wyświetlić tylko cześć danych, która nas interesuję. W celu ograniczenia dużych zbiorów danych można też wykorzystać tzw. relative date filters (np ostatni dzień, miesiąc, rok).

Opcja Only Relevant Values dostępna w przypadku quick filters powinna być wykorzystywana z rozwagą i jedynie wtedy, gdy jest naprawdę wymagana. Jej wykorzystanie może drastycznie wpłynąć na szybkość działania dashboardu!

W większości przypadków filtering dashboard actions są szybsze, niż quick filters. Wynika to z tego, że w przypadku tych drugich tableau jest zmuszone do każdorazowego skanowania całego wymaru przed wyśwetleniem listy dostępnych wartości. W przypadku dashboard actions nie jest to wymagane, ponieważ filtry te wykorzystują wyrenderowane wizualizację, które posiadają już taką informację. Warto również zwrócić uwagę na to, co ma się dziać z widokiem bo resecie selekcji (opcja "clearing the selection will" w menu Dashboard->Actions). Jeśli pracujemy z wyjątkowo dużym zbiorem danych, zaleca się wykorzystanie opcji "Exclude all values" w celu uniknięcia wyświetlania dużych ilość danych w trybie "defaultowym".

Edytowanie dashboard action


W kolejnym artykule z tej serii postramy się przyjrzeć dobrym praktykom związanym z tworzeniem kalkulacji w Tableau, dzięki którym możemy bezpośrednio wpłynąć na wzrost wydajności całego dashboardu. Do zobaczenia następnym razem!

środa, 31 maja 2017

Tableau Performance Tuning - część I

Szybkość działania jest jedną z najważniejszych cech każdego rozwiązania w IT - nie inaczej jest z raportami w Tableau. Bo niby po co komu piękne raporty odpowiadające na wszystkie pytania użytkownika jeśli w czasie ich renderowania można sobie spokojnie zaparzyć herbatę? Prawdą jest, że w dzisiejszych czasach użytkownicy oczekują błyskawicznej reakcji na swoje zapytania oraz interakcje z poszczególnymi elementami dashboardu. Z przyczyn technicznych nie zawsze jest to możliwe, jednak można śmiało stwierdzić, że w dobie dzisiejszych rozwiązań nikt nie chcę już oglądać "loading screenów" dłużej niż kilka sekund. Czas jest naszym najcenniejeszym zasobem i nie powninno nas wcale dziwić, że tak dużo mówi się dzisiaj o optymalizacji.



Tableau udostępnia moduł Performance Recording, który pozwala na analizę poszczególnych zapytań i zidentyfikowanie potencjalnych źródeł problemów z wydajności. O tym narzędziu pisaliśmy już w jednym z poprzednich artykułów. Porównywaliśmy również wszystkie zalety i wady używania ekstraktów i źródeł danych typu "live". To dobre wprowadzenie do Performance Tuningu w Tableau, jednak aby lepiej zrozumieć istotę tego zagadnienia musimy przyjrzeć się kilku podstawowym zasadom, które pozwolą nam wycisnąć z naszych workbooków jak najwięcej w jak najkrótszym czasie. W pierwszej części tego artykułu przyjrzmy się temu, co można w tej kwestii zrobić na poziomie samego środowiska i źródła danych (bazy).

Środowisko

Tableau Desktop działa zdecydowanie lepiej na maszynach z 64-bitowym systemem operacyjnym, co nie powinno nikogo dziwić. Kluczowym aspektem jest tutaj ograniczenie w pamięci operacyjnej dla systemów 32-bitowych (efektywnie jest to około 3-3,5 GB RAM), które nie pozwala Tableau rozwinąć skrzydeł, a w przypadku pracy z większymi źródłami danych kończy się znienawidzonym błędem "out of memory". Generalnie im więcej pamięci RAM, tym lepiej. Maszyna deweloperską powinna mieć przynajmniej 8GB (zaleca się 16 GB). Liczy się również szybkość taktowania pamięci i dysków twardych. Niezłym pomysłem jest wykorzystanie ciągle taniejących dysków SSD.

Te same zasady dotyczą serwera - przy instalacji nowej instacji tableau server na pewno warto zainwestować w mocny sprzęt z dużo ilością ramu i szybkim, wielordzeniowym CPU. Wiele testów pokazuję, że rówież przeglądarka ma duże znaczenie. Generalnie Chrome i Firefox wypadają lepiej niż IE. Warto oczywiście zadbać o ich najnowsze wersję biorąc pod uwagę jak szybko wypuszczane są aktualizacje do Tableau Desktop/Server.

Baza danych

W większości środowisk korporacyjnych relacyjne bazy danych stanowią główne źródło danych. Mając doświadczenia z wieloma setupami mogę stwierdzić, że najlepszą wydajność w Tableau odnotowałem pracując z bazami Teradata i Oracle. Trochę gorzej wspominam pracę z MS SQL Server i IBM DB2, ale często jest to kwestia tuningu samej bazy, która jest naszym wąskim gardłem jeśli chodzi o wydajność raportów - szczególnie warto zwrócić na to uwagę używając połączeń typu "live data connection". Oto kilka rad odnośnie tego, co warto zoptymalizować na poziomie bazy:
  • Indeksy to podstawa. Na pewno warto indeksować wszystkie kolumny wykorzystywane w operacjach join i filtrach/ dashboard actions
  • Obecność kluczy głównych i obcych we wszystkich tabelach pozwala Tableau na zignorowanie wielu "integrity checks", co znacznie przyśpiesza zadanie (weryfikacja powinna być po stronie bazy)
  • Przy dużych ilościach danych istotne jest partycjowanie danych np na poziomie daty
  • Tableau nie lubi wartości typu NULL - unikaj ich jeśli tylko masz taką możliwość!
  • jeśli potrzebujesz skomplikowanych kalkulacji, pomyśl o stowrzeniu dedykowanego widoku na poziomie bazy danych który wykona czarną robotę za Tableau - w większości przypadków system bazodanowy wykona to zadanie zdecydowanie szybciej niż Tableau!
  • Korzystaj z tabeli zagregowanych jeśli masz do czynienia wielkimi źródłami danych (o ile nie musisz prezentować danych transakcyjnych i wystarczą Ci podsumowania). Pamiętaj, że możesz również wykorzystać opcję agregacji na danym poziomie przy tworzeniu ekstraktu w Tableau!
Więcej informacji znajdziecie w kolejnej części artykułu poświęconej optymalizacji wydajności w samym Tableau!

sobota, 8 kwietnia 2017

Nowy model licencjonowania Tableau

Właściciele Tableau właśnie zakomunikowali znaczące zmiany w modelu licencjonowania ich narzędzi. Otóż od tej chwili oprogramowanie będzie można nabyć również w modelu subskrypcyjnym. W przypadku Tableau Desktop oferowane są dwa warianty:
  • Personal Edition za 35 USD miesięcznie
  • Professional Edtion za 70 USD miesięcznie
Właściciele zapewniają, że wszystkie licencje zakupione w starym systemie (perpetual) pozostaną dalej ważne, a obecny system subskrypcyjny jest tylko rozszerzeniem oferty wynikającym z bezpośrednich oczekiwań klientów. Taka strategia to zapewne efekt bardzo agresywnej konkurencji ze strony Microsofttu, który ciągle oferuję swój analogiczny produkt Power BI w żenująco niskiej cenie (10 USD/mies) oraz wyjście na przeciw obecnym trendom w branży. Według analityków Gartnera już około 65-70% dostawców oprogramowania korzysta z takiego modelu, a do końca 2020 roku ten odsetek może wzrosnąć nawet do 80%. Polecam poniższy artykuł, z którego można dowiedzieć się nieco więcej o właśnie wprowadzonym modelu sprzedaży oraz strategii nowego CEO Tableau (Adam Selipsky, były dyrektor Amazon Web Services).


https://www.information-management.com/news/new-tableau-ceo-seeks-smoother-sales-with-subscription-push

niedziela, 26 marca 2017

Tableau Beta dla wersji 10.3 już dostępna

W tym tygodniu producent Tableau rozpoczął kolejną fazę beta-testów swojego oprogramowania,  tym razem dla wersji 10.3. Wśród najciekawszych nowości znajdują się:
  • automatyczne alerty wysyłane z poziomu Tableau Server (tzw. data-driven alerts)
  • garść nowych konektorów (PDF, Dropbox, OneDrive, ServiceNow, Amazon Athena, MongoDB, Denodo)
  • Tableau Bridge dla wersji Tableau Online (możliwość bezpiecznego łączenia się z bazami danych w trybie live connection)
  • Usprawnienia i wbudowane rekomendacje dla modułu przygotowania danych (smart table & join recommendations)
  • Usprawniony Web Authoring (możliwość edycji i tworzenia stories online)
  • Dalszy rozwój API (REST API, JS API)

Pełną listę zmian znajdziecie pod tym adresem. Liczna zmian może nie poraża, ale to kolejny krok przed wypuszczeniem poełnoprawnej wersji Tableau 11, która według wielu źródeł powinna się pojawić pod koniec tego roku. Obecna faza testów potrwa do 19 maja.

wtorek, 7 marca 2017

Raport o kondycji rynku BI według Gartnera - najważniejsze funkcjonalności narzędzi Business Intelligence oraz platform analitycznych

Właśnie ukazał się szczegółowy suplement do tegorocznego raportu Gartnera dotyczący najważniejszych funkcjonalności współczesnych narzędzi Business Intelligence oraz platform analitycznych (Critical Capabilities for Business Intelligence and Analytics Platforms).

Critical Capabilities Matrix (Gartner, Marzec 2017)


Analitycy z Gartnera po raz kolejny podkreślają fundamentalną zmianę, jaka zaszła na rynku BI w ciągu ostatnich lat (przesunięcie osi ciężkości w kierunku narzędzi typu data discovery).
 Najważniejsze wnioski z tegorocznej edycji raportu są następujące:
  • tradycyjne narzędzia BI zaczynają w dużej mierze doganiać możliwości pierwotnie oferowane tylko przez grono dostawców narzędzi typu data discovery, jednak różnice w ich funkcjonalnościach są ciągle widoczne (w zależności od przyjętych kryteriów)
  • Kolejna faza innowacji produktowej już się rozpoczęła (smart data discovery) i tym razem to duże firmy są o krok przed obecnymi liderami rynku (Tableau, Qlik, PowerBI, Tibco) dzięki ogromnych nakładom na innowacje (IBM, Microsoft, Microstrategy, SAP, SAS) oraz licznym przejęciom dobrze prosperujących start-upów (Oracle, Salesforce)
  • Pomimo relatywnie dużego nasycenia rynku platform analitycznych, większość produktów cechuje pewna rożnica w funkcjonalnościach, w związku z czym każde z tych narzędzi ma nieco inne przeznaczenie/jest skierowane do innej grupy odbiorców
Kilka kluczowych rekomendacji/wniosków dla osób zastanawiających się nad wdrożeniem współczesnych narzędzi klasy Business Intelligence bądź też modernizacją obecnie wykorzystywanej technologii:
  • Rozwijaj portfolio tradycyjnych narzędzi do raportowania poprzez wykorzystanie możliwości jakie oferuje nurt data discovery
  • Dokonaj wnikliwej analizy możlwości współczesnych narzędzi BI w celu wyboru optymalnego rozwiązania w zależności od Twoich potrzeb oraz sytuacji w Twojej organizacji
  • Ustal w jakim stopniu scentralizowane zespoły IT będą w stanie wesprzeć Twoich użytkowników biznesowych w zakresie przygotowania bądź udostępnienia niezbędnych danych
  • Zostań zwolennikiem przyjaznych narzędzi zorientowanych na łatwość obługi oraz wykorzystanie metodyk zwinnych w celu wykorzystania pełnego potencjału analitycznego drzemiącego w Twojej organizacji
  • Kontroluj na bieżąco zadowolenie użytkowników biznesowych z wykorzystywanej technologii i podczas wyboru narzędzi nie kieruj się wyłącznie ewaluacją samych funkcjonalności, możliwością integracji oraz całkowitym kosztem inwestycji
Przyjżyjmy się jeszcze wizualnej reprezentacji oceny 5 najważniejszych funkcjonalności BI według Gartnera:
  1. Agile Centralized BI Provisioning
    Źródło: Gartner 2017
  2. Decentralized Analytics
    Źródło: Gartner 2017
  3. Governed Data Discovery
    Źródło: Gartner 2017
  4. OEM or Embedded BI
    Źródło: Gartner 2017
  5. Extranet Deployment Use Case
    Źródło: Gartner 2017
Jak wypadło Tabelau na tle swoich konkurentów? W ocenie pierwszych 3 "krytycznych funkcjonalności" oprogramowanie zostało wymienione w pierwszej dziesiątce rankingu, co na pewno jest wynikiem bardzo dobrym, ale nie wybitnym i pokazuje, że konkurencja nie śpi. W przypadku dwóch ostatnich cech, Tableau plasuje się mniej więcej w połowie stawki.

Równie ciekawie przedstawia się ocena cząstkowa poszczególnych funkcjonalności. Warto zauważyć, że możlwiości Tableau są oceniane bardzo podobnie zarówno przez klentów, jak i analityków którzy wzięli udział w badaniu (wykres poniżej).
Critical Capabilities Matrix - analyst opinion only (Gartner, Marzec 2017)
Zgodnie z moimi przewidywaniami, Tableau wypada znakomicie pod względem wizualizacji danych, budowy interaktywnych dashboardów, wykorzystanie plarform mobilnych, łatwość użycia oraz integracji z innymi platformami (tzw. żargonowy BI gold standard). Nieco zaskoczyła mnie wysoka ocena zdolności transformacji i przetwarzania danych (Self-Contained ETL and Data Sorage) - moim zdaniem funkcje te są na dzień dzisiejszym dosyć mocno ograniczone, ale wszystko ma się zmienić dzięki tajemniczemu projektowi Maestro, który ujrzy światło dzienne już wkrótce. Nie zaskoczyła mnie natomiast umiarkowana ocena rozwiązań cloudowych (wszak są ciągle rozwijane), zarządzania metadanymi (mimo ciągłych usprawnień od wersji 9) oraz bardzo słaba odpowiedź na rzekomy kolejny krok rewolucji - smart data discovery (przynajmniej w chwili obecnej, ponieważ deweloperzy Tableau deklarują, że cięzko pracują nad tym, żeby dogonić konkurentów pokroju IBM Watson Analytics w niedalekiej przyszłości).

Kompletnie nie zgadzam się z bardzo niską oceną zdolności do publikowania i administrowania kontentu w Tableau Server oraz zdolności szeroko rozumianej "kolaboracji". Myślę, że niska ocena tych komponentów to efekt porzucenia wielu starych, dobrych praktyk stosowanych przez tradycyjne platformy BI takie jak Cognos czy OBIEE, która przez wielu starych wyjadaczy jest ciągle uważana za "must have".

Pełny raport zawiera oczywiście dużo więcej szczegółowych informacji, w tym opis wykorzystanych kryteriów oraz ocena sytuacji każdego z zakwalifikowanych vendorów. Gorąco zachęcam do zapoznania się z jego treścią!

środa, 1 marca 2017

Tableau 10.2 już dostępny

Od wczoraj można już pobierać stabilną wersję Tableau 10.2:
https://www.tableau.com/support/releases/10.2.0



Poza całą masą zmian na poziomie przygotowania danych, najnowsza wersja oferuję przede wszystkich znaczne usprawnienia w kwestii wizualizacji danych geoprzestrzennych oraz wykorzystaniu analizy statystycznej. Szczegółowy wykaz wszystkich wprowadzonych zmian znajdziecie na oficjalnym blogu oraz w sekcji what's new na stronie producenta.

poniedziałek, 27 lutego 2017

Jak przygotować się do egzaminu Tableau Desktop 10 Delta Exam?

Ostatnio dostaję coraz więcej zapytań o certyfikacje i materiały szkoleniowe dotyczące Tableau. Kilka dni temu udało mi się zdać kolejny egzamin Tableau, więc stwierdziłem, że podzielę się swoimi przemyśleniami na jego temat.

Tym razem chodzi o wspomniany Delta Exam, który pozwala na upgrade najwyższej istnejącej licencji (QA albo CP) do ostatniej opublikowanej wersji. Jedynym wymogiem jest posiadanie certyfikatu dotyczącego poprzedniej wersji. Uwaga - jeśli pominiecie dwie wersje z kolei, czyli np przespaliście możliwość zdanwania Delty w wersji 9, a posiadacie tylko licencje Desktop/Server QA 8, to musicie niestety zdawać ponownie cały egzamin QA (w tym przypadku wersja 10). Jak widać, Tableau chce w ten sposób zmotywować ludzi do uzupełniania swojej wiedzy o nowości dotyczące najnowszych wersji, a jest ich ostatnio naprawdę sporo.

Jeśli chodzi o formę egzaminu, to ponownie mamy do czynienia ze sprawdzoną formułą egzaminu QA. Tym razem jest tylko 16 pytań, z czego zdecydowana większość (w moim przypadku 11) to tzw. pytania knowledge base dotyczące nowości w Tableau Desktop 10 - forma bardzo podobna do tej z egzaminu QA, więc nie powinno to być dla Was nic nowego. Do tego tylko 5 pytań, gdzie trzeba coś policzyć, każde za 3 pkt. Pytania teoretyczne są za 1 pkt, więc łącznie można uzyskać 26 pkt. Do otrzymania 'passa' musimy uzyskać ponad 75%. Czasu jest sporo mniej, bo tylko 60 min, ale przy tak małej ilości zadań praktycznych jest to w pełni uzasadnione - zasadniczo powinniście się wyrobić w pół godziny.

Jak się do tego egzaminu przygotować? Wystaczy dogłebnie przestudiować podany zakres materiału. Polecam dokładne zapoznanie się z sekcją "What's New in Tableau Desktop" dla wersji 10 na oficjalnej stronie Tableau:
http://onlinehelp.tableau.com/current/pro/desktop/en-us/help.htm#whatsnew_desktop.html

Jedna wskazówka, która powinna znacznie ułatwić Wam zadanie - możecie korzystać z tych zasobów również w trakcie egzaminu :) Standardowo przygotujcię się na pracę z wieloma źródłami danych w formacie excelowych plików. Sam egzamin jest zdawany na wirtualnej maszynie, na której macie tylko Tableau 10 i dostęp do internetu. To naprawdę dużo. Życzę wszystkim powodzenia i chętnie usłyszę jak Wam poszło!



czwartek, 23 lutego 2017

Gartner Magic Quadrant dla Business Intelligence and Analytics Platforms - pełny raport już dostępny!

Na oficjalnej stronie Tableau można już znaleźć link do pełnej wersji raportu Gartnera dotyczącego rynku Business Intelligence oraz współczesnych platform analitycznych. Po raz kolejny vendorzy zostali podzieleni na segmenty modern BI (wspomniany raport) oraz tradycyjne platformy BI (ta część raportu jest dopiero w przygotowaniu), więc możemy tutaj mówić o kontynuacji ubiegłorocznej rewolucji.

Najważniejsze trendy zauważone w tym roku:
  • dalszy boom platform typu smart/visual data discovery
  • coraz mniej wdrożeń tradycyjnych systemów BI (it-centric)
  • do 2020 roku większość narzędzi BI będzie oferować natywną obsługę zapytań w języku naturalnym (NLP)
  • w tym samym roku nawet 50% zapytań będzie już generowanych przy wykorzystaniu sztucznej inteligencji

Tradycyjnie polecam lekturę pełnego raportu w celu zapoznania się z tegorocznymi kryteriami Gartnera oraz oceną oferty poszczególnych vendorów:

https://www.gartner.com/doc/reprints?id=1-3TYE0CD&ct=170221&st=sb

poniedziałek, 20 lutego 2017

Test Microsoft Power BI - nowy rywal Tableau?


Od jakiegoś czasu uważnie przyglądam się poczynaniom Microsoft w sferze Business Intelligence. Trzeba przyznać, że w ciągu ostatnich lat giganci z Redmond sporo zainwestowali w rozwój swojej najnowszej platformy analitycznej Power BI. Gdy rok temu publikowałem porównanie najlepszych narzędzi na rynku (Tableau vs Qlik vs Tibco), Power BI był jedynie dobrze zapowiadającą się ciekawostką. Czy w tym momencie można go już uznać za godziwego rywala dla złotej trójcy segmentu data discovery?

Microsoft Power BI zyskuję coraz większe grono użytkowników oraz bardzo przychylne opinie ekspertów branży. Wystarczy spojrzeć na ostatnią odsłonę raportu Gartnera, gdzie produkt Microsoft został oceniony niemal tak wysoko jak Tableau (a może nawet lepiej?). Wszystko za sprawą bardzo skutecznego marketingu (w końcu to Microsoft) oraz niezwykle atrakcyjnej wyceny narzędzia w modelu subskrypcyjnym - licencja Power BI Pro kosztuję obecnie jedynie 9.99 USD miesięcznie. W porównaniu do ceny Tableau to tyle co nic. Nawet dla krajów rozwijających się (pakiet Netflixa + Spotify kosztują Was drożej!). Niektórzy twierdzą wręcz, że są to ceny dumpingowe, ale nawet jeśli to prawda, to kto bogatemu zabroni? :)

Interfejs Power BI. Do najpiękniejszych nie należy

Przy tak dużej bazie klientów, jaką posiada obecnie Microsoft, nadrzędnym celem firmy jest obecnie szybka ekspansja, którą kilka lat temu przeprowadził Qlik, a następnie Tableau. Na zarabianie przyjdzie jeszcze czas. Aby ocenić czy w obecnej formie oprogramowanie Microsoftu może zagrozić Tableau, proponuję przyjrzeć się krótkiemu testowi opartemu na tej samej metodologii, którą zastosowałem ponad rok temu w analizie porównawczej narzędzi klasy BI.

Test jest oparty na darmowej wersji Power BI Desktop v2.42.4611.901 dostępnej w styczniu 2017 (wersja 64-bit)

Standardowo procedura testowa składa się z następujących kroków:

Nazwa testu
Waga testu
Test 1 – Kompatybilność
0,3
Test 2 – Wizualizacja danych
0,4
Test 3 – Funkcjonalność
0,3
Razem
1,0

TEST 1 - KOMPATYBILNOŚĆ

Tutaj na pewno nie mamy żadnych złudzeń - Microsoft postarał się, aby jego najnowsze narzędzie bezproblemowo łączyło się większością współczesnych źródeł danych. Cześć konektorów jest jeszcze w formie bety, ale już teraz widać, że lista jest imponująca i (co najważniejsze) ciągle aktualizowana, co bardzo dobrze rokuje na przyszłość.
źródło: https://powerbi.microsoft.com/en-us/documentation/powerbi-desktop-data-sources/



Menu nawiązywania nowych połączeń jest bardzo przejrzyste i uporządkowane dzięki zastosowaniu kilku zbiorczych kategorii (pliki zewnętrzne, bazy danych, azure, serwisy online, inne).

Ocena: 5/5

TEST 2 - WIZUALIZACJA DANYCH

Drugi test to esencja naszej analizy i prawdziwe wyzwanie dla Power BI, gdyż najważniejsi konkurenci tacy jak Tableau Desktop, Qlik Sense i Tibco Spotfire wypadli tutaj całkiem nieźle.

Naszym zadaniem ponownie jest odwzorowanie prostego dashboardu sprzedażowego na podstawie poniższych wymagań.

Dashboard miał składać się z trzech głównych sekcji:
1)      Geograficzna wizualizacja sprzedaży oraz zyskowności poszczególnych sklepów.
2)      Zyskowność sprzedaży poszczególnych kategorii produktów w formie interaktywnych wykresów słupkowych z użyciem hierarchii produktów.
3)      Pokazanie trendów sprzedaży poszczególnych kategorii produktów na przestrzeni 3 lat za pomocą interaktywnych wykresów liniowych (w ujęciu miesięcznym)
Dla przypomnienia, źródłem danych jest płaski excel (.xlsx) zawierający dane na temat ponad 10 tys. transakcji zawartych w ciągu 3 lat. Efekt końcowy możecie obejrzeć poniżej:



Jak widać najnowsza wersja Power BI oferuję naprawdę spore możliwości w zakresie budowy dashboardów, a efekt finalny jest całkiem niezły. Obsługa geolokalizacji kodów pocztowych trochę jeszcze szwankuje i nie wszystkie z nich zostały prawidłowo rozpoznane. Możliwości zmiany kolorystyki i skali gradientu również mogłyby być trochę bardziej rozbudowane - w chwili obecnej edycja jest nieco toporna i bardzo przypomina mi pierwszą wersję Qlik Sense sprzed roku (zresztą nie tylko ta funkcja). Nie było natomiast żadnych problemów z wykorzystaniem customowej hierarchii oraz dowolnej konfiguracji interakcji pomiędzy każdą z wizualizacji - ta funkcjonalność jest niezwykle intuicyjna w Power BI. Interfejs aplikacji jest całkiem przejrzysty (jak w innych produktach Microsoftu), ale moim zdaniem troszkę zbyt ciemny. Intensywny żółty kolor, który dominuję na welcome screenie i we wszystkich materiałach webowych również potrafi trochę zmęczyć.

Power BI - welcome screen
Po kilkugodzinnym użytkowaniu programu odnoszę wrażenie, że Power BI jest obecnie sporo wolniejszy od Tableau czy Qlika - widać to już na etapie łączenia się z danymi, czy renderowania wizualizacji (szczególnie mapy). Być może jest to wina mojego peceta? (nie sądzę). Wygląda na to, że Microsoft ma jeszcze dużo pracy w sferze optymalizacji swojego silnika. Warstwę graficzną natomiast oceniam pozytywnie (poza okropnymi szarymi menusami z prawej strony).

Ocena: 4.5/5

TEST 3 - FUNKCJONALNOŚĆ

Dobrnęliśmy do ostatniego, jednak bardzo ważnego testu, który jest moją subiektywną oceną łatwości obsługi, możliwości analitycznych i wsparcia producenta.

  • łatwość obsługi - narzędzie Microsoftu posiada standardowy, dobrze znany interfejs charakterystyczny dla tej firmy (oparty na ribbonach). Wszystko jest tutaj na swoim miejscu, aczkolwiek panel panel edycji pól i wizualizacji wymaga jeszcze wielu poprawek. Póki co wygląda to trochę pokracznie, a czarny kolor tła zupełnie tutaj nie pasuje. Wydaje mi się, że nawet w raczkującym Watson Analytics wygląda to o niebo lepiej.
  • możliwości analityczne  - przyznam szczerze, że nie miałem okazji sprawdzić zbyt wielu funkcjonalności typowo analitycznych. Większość z nich jest tutaj nowa bądź ciągle rozwijana. Microsoft zdecydowanie ma kompetencje w tej dziedzinie, więc myślę, że w przyszłości będzie chciał się skupić na tych funkcjonalnościach żeby wyróżnić się czymś spośród licznej konkurencji (poza niezła integracją danych, którą Power Bi oferuję już dziś).
  • wsparcie producenta - pod tym względem Power BI wypada równie dobrze, jak Tableau. Na stronie producenta znajdziecie masę poradników i video tutoriali (guided learning), a społeczność użytkowników rośnie ostatnio w tempie wykładniczym. Pod tym względem jest naprawdę dobrze. Widać, że Microsoft wzoruję się tutaj na wieloletnich liderach branży oraz ich sprawdzonych rozwiązaniach w zakresie self-learningu.
 Oceny cząstkowe

łatwość obsługi: 5/5
możliwości analityczne: 4/5
wsparcie producenta: 5/5

PODSUMOWANIE

test
Power BI
waga testu
kompatybilność
5
0.3
wizualizacja
4.5
0.4
łatwość obsługi
5
0.1
możliwości analityczne
4
0.1
wsparcie producenta
5
0.1
SUMA
4.7
1

 Końcowy wynik naszego testu jest bardzo optymistyczny - według przyjętej rok temu metodologii, Power BI w wersji 2.42 tylko nieznacznie ustępuje Tableau Desktop 9, które otrzymało notę końcową na poziomie 4.85.
 Warto jednak zauważyć, że ubiegłoroczne rezultaty Tableau Desktop, Qlik Sense i Tibco Spotfire mogły również ulec zmianie w związku z licznymi aktualizacjami tych programów i wprowadzeniem wielu nowości/usprawnień, dlatego w najbliższym czasie zamierzam opublikować odświeżoną wersję rankingu dla Tableau Desktop 10.1, Qlik Sense 3.1 oraz Tibco Spotfire 7.6. Na tę chwilę mogę jedynie stwierdzić, że Power BI stał się wyjątkowo interesującym narzędziem i zasłużenie został wymieniony wśród liderów prestiżowego rankingu Gartnera już drugi rok z rzędu.

Moim zdaniem, różnica między produktem Microsoftu a najnowszą, dziesiąta już odsłoną Tableau jest natomiast na tyle duża, że ciągle warto dopłacić i wybrać to droższe narzędzie i takie rozwiązanie rekomendowałbym organizacjom, którym zależy przede wszystkim na rezultatach i najwyższej efektywności pracy - innowacja ma niestety swoją cenę. Power BI będę natomiast traktować jako ciekawą alternatywę skierowaną do mniej wymagającego odbiorcy. Przy obecnej wycenie z czystym sumieniem polecam to narzędzie mniejszym firmom i organizacjom pozarządowym, które zapewne korzystają już z innych rozwiązań Microsoftu. Za takie pieniądze na pewno nie znajdziecie lepszej alternatywy.

Na koniec zamieszczam graficzną reprezentację testu Power BI:

piątek, 17 lutego 2017

Tableau ponownie jednym z trzech liderów rynku BI

Magic Quadrant for Business Intelligence and Analytics Platforms 2017



Gartner właśnie opublikował pierwsze informacje na temat tnajnowszej odsłony swojego badania dotyczącego rynku BI oraz platform analitycznych. W prównaniu do ubiegłorocznej edycji zmiany są raczej niewielkie - wśród liderów pozostali trzej najważniejsi gracze z 2016 (Tableau, Microsoft, Qlik), Warto jednak zwrócić uwagę na ciągle powieksząjąca się stratę QlikView do pozostałych konkurentów, którzy wyraźnie konkurują o miano samodzielnego lidera rynku BI. Tableau konsekwentnie realizuję swoją długoterminową strategię przenoszenia się do chmury oraz inwestowania w autorskie projekty takie jak Project Maestro (ETL), czy przejmowanie konkurencyjnych rozwiązań (austriacki Hyper), które mają na celu stworzenie lepszej, w pełni skalowalnej oferty zarówno dla małych, jak i dużych przedsiębiorstw. Na pewno duża w tym zasługa nowego CEO (Adam Selipsky, ex-Amazon, twórca niezaprzeczalnego sukcesu platformy AWS), który ostro wziął się do działania od samego początku swojej kadencji. Jeśli większość z nowości zapowiedzianych na ostatniej konferencji Data16 zostanie wprowadzonych w ciągu najbliższych lat, to możemy być spokojni o przyszłość Tableau. Póki co polecam lekturę notki z tego wydarzenia, która przedstawia ogólną strategię Amerykanów z Seattle na najbliższe 3 lata. Obiecuję, że postaram się wrócić do tego tematu i omówić go bardziej szczegółowo już wkrótce.

Tableau ciągle pozostaję liderem w egzekwowaniu swojej strategii, jednak Power BI coraz bardziej depcze mu po piętach i ponownie został oceniony najwyżej pod kątem kompletności wizji - jest to z pewnością efekt bardzo cięzkiej pracy Microsoftu, który zrobił w ciągu ostatniego roku naprawdę wiele, aby zniwelować swoją stratę do Tabelau. Trzeba przyznać, że Power BI jest ostatnimi czasy bardzo mądrze rozwijany i w obecnym stadium posiada już znaczną wiekszość funkcjonalności Tableau, które są oferowane za zdecydowanie mniejsze pieniądze w modelu subskrypcji. Oczywiście Microsoft jako jeden z największych gigantów może sobię na to pozwolić - widać to szczególnie po zwiększonych nakładach marketingowych. Polecam śledzenie oficjalnego bloga produktowego Power BI, na którym co miesiąc pojawiają się bardzo szczegółowe informacje na temat aktualizacji produktu. W najbliższym czasie postaram się opublikować kilkukrotnie zapowiadany obszerniejszy materiał na temat Power BI - stay tuned!

Ostatnim liderem rankingu jest szwedzko-amerykański Qlik, który wyraźnie traci swoją pozycję na rzecz swoich młodszych konkurentów. Jest to niestety efekt niezbyt przemyślanej strategii produktowej, w ramach której od przeszło 3 lat Qlik oferuję nowe narzędzi Qlik Sense mające konkurować z ofertą Tableau i Microsoft w dynamicznie rozwijającym się obszarze data discovery. Na rynku ciągle dostępny jest również ceniony pakiet QlikView, a sam producent chyba trochę pogubił się już w pozycjonowaniu tych narzędzi i nie wiadomo, do kogo są one kierowane. Sytuacja na rynku Bi jest na tyle ciekawe, że warto byłoby pokusić się o szersze porównanie flagowych produktów liderów Tableau vs Microsoft vs Qlik - w ramach możliwości postaram się róównież przyjrzeć temu zagadnieniu.

Pełny raport Gartnera dla rynku BI w 2017 roku pojawi się już pod koniec lutego - wtedy też z pewnością wrócimy do tego tematu i rozłożymy go na czynniki pierwsze :)

wtorek, 31 stycznia 2017

Tableau 10.2 - nowości ciąg dalszy

Wygląda na to, że jesteśmy już coraz bliżej kolejnej wersji Tableau o numerze 10.2! Od 18 stycznia mamy dostęp do programu Tableau 10.2 Beta 2, który oferuję jeszcze więcej nowych funkcjonalności i bug fixów względem pierwotnej wersji bety opublikowanej w grudniu 2016. Na liście nowości znalazły się między innymi:
  • dodanie funkcji kowariancji i korelacji (ku uciesze statystyków)
  • ułatwienia dotyczące table calculations
  • ulepszony web authoring (edycja workbooków z poziomu tableau server)
  • automatyczna funkcja autosave dla Tableau Desktop (na wypadek nagłych crashów aplikacji)
  • show version number - pokazuje version history każdego workbooka i zapamiętuję wersję, za pomocą której został utworzony
  • liczne usprawnienia w większości wydanych to tej pory API
  • możliwość użycia unikalnego formatowania dla każdej z miar nawet, gdy wykorzystujemy kilka z nich na jednej wizualizacji (znacznie ułatwi formatowanie tabel i wykresów)

Jak zwykle zachęcam do zapoznania się z oficjalną listą zmian na stronie producenta.
Według informacji podanej na wewnętrznej stronie Tableau Beta, obecne testy potrwają do 13 marca 2017 roku, co może sugerować ostateczny release wersji 10.2 jeszcze w tym kwartale.

Zachęcam do zaglądania na bloga w lutym, kiedy to planuję opublikować dalszą cześć cyklu nauki kalkulacji w Tableau (tym razem LoD) oraz pierwsze spojrzenie na alternatywę Tableau prosto od Microsoftu, czyli zyskujący ostatnio na popularności pakiet Power BI. Nie możemy również zapomnieć o najnowszym raporcie Gartnera dla narzędzi Business Intelligence, który powinien ukazać się już 4 lutego. Do zobaczenia wkrótce!