
Automatyzacja procesów biznesowych modelami AI w chmurze Azure
Ostatnie lata w świecie systemów IT to wzrost popularności rozwiązań opartych na chmurze obliczeniowej. Związane jest to między innymi z korzyściami, jakie można osiągnąć przez wdrożenie rozwiązań chmurowych w organizacji: Zmniejszenie kosztów infrastruktury Zmniejszenie kosztów utrzymania systemów Zwiększenie możliwości skalowalności systemów Skrócenie czasu tworzenia nowych aplikacji poprzez stosowanie gotowych komponentów Łatwość integracji komponentów i usług chmury Bezpieczeństwo przetwarzania danych Możliwość ...
Czytaj Dalej
Czytaj Dalej

Hurtownia danych w chmurze – czemu nie!
Hurtownie danych jako źródła dla raportów i analiz są powszechnie stosowane w celu zwiększenia mocy obliczeniowych zarówno dla odbiorców raportów oraz analiz jak i dla korzystających z systemu transakcyjnego. Wyobraźmy sobie sytuację, że dane źródłowe systemu transakcyjnego przechowujemy w relacyjnej bazie danych. Następnie raz na dzień są one przenoszone przez procesy ETL do hurtowni danych na której realizowane jest raportowanie ...
Czytaj Dalej
Czytaj Dalej

NVIDIA Ampere w służbie Data Science
14 maja 2020 nastąpił historyczny moment w świecie przetwarzania danych, NVIDIA zaprezentowała najnowszą architekturę nowych akceleratorów GPU. Nowy model NVIDIA A100 Tensor Core GPU bazuje na najnowszej architekturze Ampere wykonanej w litografii 7nm. A100 jest wysoko skalowalnym rozwiązaniem do obliczeń wykonywanych w stacjach roboczych, serwerach, klastrach i centrach danych. Nowa architektura wprowadza również trzecią generację Tensor Core, która zwiększa przepływowość ...
Czytaj Dalej
Czytaj Dalej

Tableau 2020.2
Tableau po raz kolejny wychodzi naprzeciw oczekiwaniom i potrzebom klientów wprowadzając znaczące ulepszenia, które jeszcze bardziej ułatwią nam analityczną podróż po naszych danych. Najnowsza wersja platformy analitycznej obsługuje szereg nowych, interesujących funkcji. Oto najważniejsze z nich. Użyj relacji, aby połączyć dane z więcej niż jednej tabeli Na początek naprawdę głęboki ukłon w kierunku tej grupy użytkowników, która zmuszona jest odpowiadać ...
Czytaj Dalej
Czytaj Dalej

Tableau 2019.2
Tableau nie zawodzi! Jeszcze nie opadł kurz po nowościach zaprezentowanych w wersji 2019.1, a już możemy opisać kolejne rozwiązania, zaprezentowane w wersji Tableau 2019.2. A to dopiero połowa drugiego kwartału! Tradycyjnie już, liczba i spektrum usprawnień i ulepszeń może powodować zawrót głowy. Uporządkujmy zatem to, do czego będziemy musieli przywyknąć przez najbliższe kilka miesięcy, zanim światło dzienne ujrzy kolejna wersja ...
Czytaj Dalej
Czytaj Dalej

Tableau 2019.1
W przededniu premiery kolejnej wersji Tableau Desktop, omówimy najciekawsze rozwiązania zaprezentowane w bieżącym wydaniu tego popularnego narzędzia do wizualnej analizy danych, a mianowicie wersji 2019.1. Zapytaj dane Niewątpliwie najbardziej spektakularną nowością, dostępną, póki co, w wersji Tableau Server i Tableau Online jest Ask Data, czyli interfejs użytkownika przetwarzający język naturalny. Słowem, wystarczy zadać pytanie skierowane do Tableau dotyczące opublikowanego źródła ...
Czytaj Dalej
Czytaj Dalej

Nowości w SPSS Modeler 18.2
W ostatnich dniach roku 2018, po przeszło 12 miesiącach zbierania informacji zwrotnych od klientów, IBM opublikował nowe wersje produktów z rodziny SPSS – IBM SPSS Modeler 18.2 oraz IBM SPSS Collaboration & Deployment Services 8.2. W niniejszym artykule przedstawimy zmiany wprowadzone w pierwszym z nich. Podstawowym oczekiwaniem użytkowników, zidentyfikowanym przez IBM była modernizacja interfejsu oraz dodanie możliwości nowoczesnej, wizualnej prezentacji ...
Czytaj Dalej
Czytaj Dalej

Jak stworzyć dashboard idealny? – 7 porad
Decyzje strategiczne są fundamentem każdej organizacji. Dla efektywnego podejmowania decyzji strategicznych, tworzone są kokpity menadżerskie, które na pierwszy rzut oka pokazują kondycję firmy. Dobrze zaprojektowany raport powinien obrazować najważniejsze informacje, trendy czy problemy z jakimi boryka się organizacja. Warunkiem efektywności każdego dashboardu jest jego przejrzysty projekt, tak więc w kilku punktach pokażemy Ci jak zmaksymalizować jakość wykonywanych raportów. 1. Poznaj ...
Czytaj Dalej
Czytaj Dalej

Działanie algorytmu XGBoost w SPSS Modeler na przykładzie modelu dla kampanii CRM
W ostatnich tygodniach roku 2018, dla jednego z naszych klientów, mieliśmy przyjemność budować model predykcyjny wybierający najlepszą grupę klientów do kampanii x-sell. Była to dla nas świetna szansa na przetestowanie algorytmu, o którym jest ostatnio bardzo głośno w świecie analityki – Drzew XG Boost. Czym jest więc algorytm, który w ostatnich miesiącach zawojował platformę Kaggle oraz serca i rozumy analityków? ...
Czytaj Dalej
Czytaj Dalej

SPSS Modeler – podsumowanie zmian w roku 2017 i perspektywy na 2018
Rok 2017 przyniósł dwie nowe wersje narzędzia analitycznego SPSS Modeler: 18.1 i 18.1.1. Pod koniec czerwca zaprezentowano wersję 18.1, zawierającą szereg nowych rozwiązań, z czego kluczowe wydają się być rozwiązania integrujące Modelera z narzędziami open source. W wydaniu tym po raz pierwszy zaprezentowano węzły napisane w języku Python (XG Boost, SMOTE czy SVM z jedną klasą). Przebudowie uległy węzły do ...
Czytaj Dalej
Czytaj Dalej

Tableau 10.5 beta – rewolucyjne zmiany!
Nie opadły jeszcze emocje po wydaniu aktualizacji Tableau 10.4.1, która niosła szereg nowych udoskonaleń, a już czekamy na kolejną wersję, mianowicie Tableau 10.5. Nadszedł czas kiedy, każdy z Nas już wkrótce powinien uaktualnić Tableau Desktop oraz Tableau Server do wersji 10.5, a wszystko przez rewolucyjny szereg usprawnień amerykańskiego producenta. Tableau 10.5 będzie najciekawszą aktualizacją roku, która przede wszystkim bazować będzie ...
Czytaj Dalej
Czytaj Dalej

Nowości w SPSS Modeler 18.1 – SVM z jedną klasą
Kolejnym algorytmem, który pojawił się w SPSS Modeler 18.1, a który postanowiliśmy Państwu przybliżyć jest metoda wektorów nośnych (ang. Support Vector Machines) z jedną klasą. Algorytm ten może służyć do wykrywania anomalii i detekcji nowości w zbiorze danych, co znajduje swe praktyczne zastosowanie m.in. przy wykrywaniu zmian treści internetowych, fraudów, różnic na zdjęciach satelitarnych, czy monitorowaniu pracy maszyn. Czym jest ...
Czytaj Dalej
Czytaj Dalej

Co nowego w Tableau 10.4 beta?
Dużymi krokami zbliża się premiera najnowszej wersji Tableau: 10.4. Tymczasem producent zachęca nas do wzięcia udziału w programie testowym Pre-Release i udostępnia członkom społeczności Tableau do wypróbowania wersję 10.4 beta. Po zarejestrowaniu się w programie możemy poczuć przedsmak tego, co nas czeka w najnowszej pełnej wersji programu. Co nowego w Tableau 10.4 beta? Tableau w swojej najnowszej odsłonie postanowiło pomóc ...
Czytaj Dalej
Czytaj Dalej

Nowości w SPSS Modeler 18.1 – SMOTE
Zgodnie z zapowiedziami z poprzedniego artykułu rozpoczynamy serię artykułów opisujących zaimplementowane w języku Python algorytmy, które pojawiły się w najnowszej wersji narzędzia IBM SPSS Modeler. Na początek algorytm SMOTE. SMOTE (z ang. Synthetic Minority-class Oversampling Technique) to algorytm służący do balansowania niezrównoważonych próbek danych poprzez zbudowanie sztucznych obserwacji klasy mniejszościowej. Dlaczego niezrównoważone dane stanowią problem? Większość ...
Czytaj Dalej
Czytaj Dalej

SPSS Modeler 18.1.
Dwudziestego czerwca premierę miała kolejna wersja flagowego narzędzia analitycznego IBM – SPSS Modeler. W narzędziu nie brakuje nowości, z których najciekawsze koncentrują się wokół integracji z narzędziami open source. Kluczową nowością są węzły pozwalające korzystać z techniki, która w ostatnich miesiącach bardzo mocno zyskała na popularności wśród ludzi zajmujących uczeniem maszynowym, co odzwierciedlają m.in. wyniki konkursów na platformie kaggle – ...
Czytaj Dalej
Czytaj Dalej

Akceleracja Tableau
Czym jest Tableau? Tableau jest doskonałym narzędziem dającym możliwość interaktywnego analizowania danych. Jednym ze źródeł sukcesu Tableau, obok doskonałego interfejsu, jest możliwość załadowania kopii danych do Tableau w postaci ekstraktów danych. Dzięki nim Tableau niemal natychmiast modyfikuje wizualizacje i tabele na żądanie użytkownika. Ekstrakty to struktury danych zapisane przez silnik Tableau zawierające kopię informacji źródłowych, często zagregowane w celu zmniejszenia ...
Czytaj Dalej
Czytaj Dalej

Wykorzystanie narzędzia analitycznego do integracji i czyszczenia danych
Często podczas rozmów na temat pożądanych funkcji idealnego rozwiązania analitycznego dyskusja schodzi w kierunku liczby dostępnych algorytmów budowy modeli data mining oraz liczby możliwych do zmiany parametrów tych modeli (np. liczba powłok ukrytych w sieci neuronowej). Podobnie sytuacja wygląda w przypadku zapytań ofertowych. Wymagania opisane powyżej stanowią zazwyczaj 80% wszystkich wymagań. Podobnie jak w ekonomii, tak i w tym przypadku ...
Czytaj Dalej
Czytaj Dalej

SPSS Modeler 18
W połowie marca miała miejsce premiera kolejnej, już 18, wersji programu IBM SPSS Modeler. W produkcie pojawiło się kilka zmian, które w większości są kontynuacją zmian zapoczątkowanych w wersjach 15-16, czyli dotyczą one integracji z Big Data oraz Open Source. Integracja z Big Data W wersjach 16, 17 oraz 17.1 narzędzie IBM SPSS Modeler zostało wzbogacone o 9 algorytmów, które ...
Czytaj Dalej
Czytaj Dalej

Jak działają najpopularniejsze algorytmy dostępne w narzędziu SPSS Modeler?
W związku z tym, że analitycy korzystający z narzędzi powinni wiedzieć, jak działają algorytmy w nich zaimplementowane, postanowiłem w niniejszym wpisie opisać logikę działania 7 najpopularniejszych algorytmów dostępnych w narzędziu IBM SPSS Modeler. 1. Drzewa decyzyjne Drzewa decyzyjne należą do najpopularniejszych klasyfikatorów. Celem klasyfikatorów jest przypisanie obserwacji do jednej ze zdefiniowanych klas (grup), np. kobieta lub mężczyzna. Zmienną, która identyfikuje ...
Czytaj Dalej
Czytaj Dalej

SPSS Modeler & Spark
W ostatnich dnia września wypuszczona została nowa wersja programu IBM SPSS Modeler – wersja 17.1. Główną funkcjonalnością owej wersji jest integracja z silnikiem przetwarzania danych Apache SPARK. Wspomniana integracja oznacza, że wszystkie procedury, dla których dostępna była opcja Hadoop-Pushback, mogą być wykonane nie tylko z wykorzystaniem MapReduce, ale także Sparka, przy czym w pierwszej kolejności SPSS będzie wykorzystywał Sparka, a ...
Czytaj Dalej
Czytaj Dalej

Dokumentacja SPSS Modeler dostępna w języku polskim!
Od kilku dni dokumentacja SPSS Modeler dostępna jest także w języku polskim. 1. Pełny podręcznik użytkownika IBM SPSS Modeler. pobierz 2. Szczegółowy opis wszystkich węzłów modelowania w IBM SPSS Modeler. pobierz Dla zainteresowanych dostępna jest również dokumentacja do: IBM SPSS Modeler Social Network Analysis ...
Czytaj Dalej
Czytaj Dalej

Sieci neuronowe ukryte w SPSS Modeler
Kontynując poprzedni temat chciałbym podzielić się odkryciem, którego dokonałem podczas przeglądania dokumentacji SPSS Modeler i Python. Odkrycie to sprowadza się do wniosku, iż w narzędziu IBM SPSS Modeler istnieją dwa węzły do budowy sztucznych sieci neuronowych. Jeden z węzłów dostępny jest standardowo w palecie węzłów na karcie modele, natomiast drugi, a właściwie pierwszy, można wywołać jedynie korzystając ze skryptu: import ...
Czytaj Dalej
Czytaj Dalej

IBM SPSS Modeler i Python
W pierwszym wpisie po wakacjach chciałem pochylić się nad zagadnieniem wykorzystania języka programowania Python w narzędziu IBM SPSS Modeler. W celu zobrazowania działania owego języka w IBM SPSS Modeler posłużę się, często wykorzystywanym przeze mnie, przykładem pętli, w której kolejne wartości z tabeli wyjściowej (węzeł Tabela) wykorzystywane są iteracyjnie w węźle Selekcja. Zbudowany przepływ danych wygląda następująco: Węzeł Selekcja wykorzystuje ...
Czytaj Dalej
Czytaj Dalej

SPSS Modeler 17 Fix Pack 1
W ostatnim dniu czerwca IBM opublikował Fix Pack 1 do programu SPSS Modeler 17. Oprócz zwykłych poprawek Fix Pack zawiera dwa nowe węzły służące do budowy modeli bezpośrednio na platformie Hadoop. (Czyżby ktoś się nie wyrobił na marcową premierę?:)) Pierwszy z węzłów umożliwia budowę modeli drzew decyzyjnych Chaid, a drugi modeli liniowych. Są to kolejne węzły dedykowane budowie modeli bezpośrednio na ...
Czytaj Dalej
Czytaj Dalej

And the winner is….
Z lekkim opóźnieniem, ale także z wielką dumą chciałbym poinformować, że technologia IBM SPSS zdobyła nagrodę Rozwiązanie Roku 2014 na kongresie BIG DATA: THINK BIG CEE CONGRESS. Nagroda przyznana została za rozwiązanie, którego celem biznesowym było zwiększenie liczby odsłon i czasu przebywania użytkowników na stronie www. Dzięki wykorzystaniu technik data mining odwiedzający stronę są przydzielani do segmentu adekwatnego do ich ...
Czytaj Dalej
Czytaj Dalej

Pean na cześć repozytorium
Dziś kilka zdań o centralnej części środowiska analitycznego jaką jest repozytorium modeli analitycznych. Na pomysł napisania o repozytorium wpadłem na początku roku podczas rozmów z klientami wykorzystującymi środowisko analityczne IBM SPSS. Po kilku miesiącach pracy z repozytorium nie wyobrażają sobie oni pracy analityków bez niego. Repozytorium nie udostępnia dodatkowych algorytmów, ani funkcji analitycznych. Dlatego też, podczas negocjacji klienci w pierwszej kolejności ...
Czytaj Dalej
Czytaj Dalej

Analizuj mecze Roland Garros na żywo.
Wszystkich fanów tenisa zachęcam do zapoznania się ze zbudowaną specjalnie na turniej French Open aplikacją IBM SLAMTRACKER. Aplikacja analizuje mecze w czasie rzeczywistym i dostarcza szeregu danych na temat przebiegu pojedynków. Co prawda więcej w niej raportowania, ale i dla analiz predykcyjnych znalazło się miejsce. Dla mnie najciekawsza okazała się zakładka Keys To The Match, w której publikowane są wyodrębnione ...
Czytaj Dalej
Czytaj Dalej

Pay as you drive
Czy zgodziłbyś się na zamontowanie w swoim samochodzie czujnika, który zbierałby dane o Twoim położeniu, prędkości i obrotach silnika? A co jeżeli Twój ubezpieczyciel zaoferowałby w zamian duże zniżki? Montowanie w samochodach czujników zbierających dane stało się w ostatnich latach coraz bardziej popularne. Jest to oczywiście związane z rozwojem branży IT. Najstarsze znane mi przypadki łączenia branży samochodowej z branżą ...
Czytaj Dalej
Czytaj Dalej

Analizy przestrzenne dla korporacji taksówkarskich
W ostatnich dniach zbudowałem w programie IBM SPSS Modeler przepływ danych, którego celem była analiza rozmieszczenia klientów hipotetycznej korporacji taksówkarskiej Algomine Taxi oraz kierowców zatrudnionych w tej korporacji. Gotowy przepływ danych wyglądał następująco: Na potrzeby przeprowadzonej analizy założyłem, że dane o położeniu klientów i kierowców pobieram dzięki aplikacji mobilnej zainstalowanej na ich telefonach. Zakładam, że zarówno klienci, jak i kierowcy ...
Czytaj Dalej
Czytaj Dalej

Gdzie znaleźć dokumentacje do produktów IBM SPSS?
W odpowiedzi na często padające pytanie dot. dokumentacji do programów z rodziny IBM SPSS podaję linki do dokumentacji dla wszystkich produktów: IBM SPSS Modeler IBM SPSS Statistics IBM SPSS Collaboration & Deployment Services IBM SPSS Decision Management IBM SPSS Analytic Server IBM SPSS Data Collection ...
Czytaj Dalej
Czytaj Dalej

Możliwości wykorzystania języka R w środowisku IBM SPSS
Zgodnie z zapowiedzią sprzed prawie dwóch tygodni chciałbym napisać kilka słów o możliwościach wykorzystania języka R w ramach środowiska analitycznego IBM SPSS. Na początek trochę o historii: Synergia środowiska IBM SPSS z językiem R pojawiła się po raz pierwszy już w wersji szesnastej programu IBM SPSS….Statistics! Użytkownicy dostali wtedy możliwość korzystania z kodu R w ramach Edytora Komend programu IBM SPSS ...
Czytaj Dalej
Czytaj Dalej

Nowości w SPSS Modeler 17
W ostatnich dniach IBM udostępnił nową, 17. już wersję flagowego produktu z rodziny SPSS – IBM SPSS Modeler. Nowości dodane w bieżącej wersji wydają się być konsekwencją znaczących zmian wprowadzonych 15 miesięcy temu. Zmianą, która jest najbardziej widoczna po uruchomieniu programu są nowe węzły umożliwiające wczytywanie podanych m.in. w formacie ESRI danych geoprzestrzennych, modyfikację tych danych, a także budowanie modeli ...
Czytaj Dalej
Czytaj Dalej