Blog

Start / Inne / Blog

Jak stworzyć dashboard idealny? – 7 porad

Decyzje strategiczne są fundamentem każdej organizacji. Dla efektywnego podejmowania decyzji strategicznych, tworzone są kokpity menadżerskie, które na pierwszy rzut oka pokazują kondycję firmy. Dobrze zaprojektowany raport powinien obrazować najważniejsze informacje, trendy czy problemy z jakimi boryka się organizacja. Warunkiem efektywności każdego dashboardu jest jego przejrzysty projekt, tak więc w kilku punktach pokażemy Ci jak zmaksymalizować jakość wykonywanych raportów. 1. Poznaj ...
Czytaj Dalej

Działanie algorytmu XGBoost w SPSS Modeler na przykładzie modelu dla kampanii CRM

W ostatnich tygodniach roku 2018, dla jednego z naszych klientów, mieliśmy przyjemność budować model predykcyjny wybierający najlepszą grupę klientów do kampanii x-sell. Była to dla nas świetna szansa na przetestowanie algorytmu, o którym jest ostatnio bardzo głośno w świecie analityki – Drzew XG Boost. Czym jest więc algorytm, który w ostatnich miesiącach zawojował platformę Kaggle oraz serca i rozumy analityków? ...
Czytaj Dalej

SPSS Modeler – podsumowanie zmian w roku 2017 i perspektywy na 2018

Rok 2017 przyniósł dwie nowe wersje narzędzia analitycznego SPSS Modeler: 18.1 i 18.1.1. Pod koniec czerwca zaprezentowano wersję 18.1, zawierającą szereg nowych rozwiązań, z czego kluczowe wydają się być rozwiązania integrujące Modelera z narzędziami open source. W wydaniu tym po raz pierwszy zaprezentowano węzły napisane w języku Python (XG Boost, SMOTE czy SVM z jedną klasą). Przebudowie uległy węzły do ...
Czytaj Dalej

Tableau 10.5 beta – rewolucyjne zmiany!

Nie opadły jeszcze emocje po wydaniu aktualizacji Tableau 10.4.1, która niosła szereg nowych udoskonaleń, a już czekamy na kolejną wersję, mianowicie Tableau 10.5. Nadszedł czas kiedy, każdy z Nas już wkrótce powinien uaktualnić Tableau Desktop oraz Tableau Server do wersji 10.5, a wszystko przez rewolucyjny szereg usprawnień amerykańskiego producenta. Tableau 10.5 będzie najciekawszą aktualizacją roku, która przede wszystkim bazować będzie ...
Czytaj Dalej

Nowości w SPSS Modeler 18.1 – SVM z jedną klasą

Kolejnym algorytmem, który pojawił się w SPSS Modeler 18.1, a który postanowiliśmy Państwu przybliżyć jest metoda wektorów nośnych (ang. Support Vector Machines) z jedną klasą. Algorytm ten może służyć do wykrywania anomalii i detekcji nowości w zbiorze danych, co znajduje swe praktyczne zastosowanie m.in. przy wykrywaniu zmian treści internetowych, fraudów, różnic na zdjęciach satelitarnych, czy monitorowaniu pracy maszyn. Czym jest ...
Czytaj Dalej

Co nowego w Tableau 10.4 beta?

Dużymi krokami zbliża się premiera najnowszej wersji Tableau: 10.4. Tymczasem producent zachęca nas do wzięcia udziału w programie testowym Pre-Release i udostępnia członkom społeczności Tableau do wypróbowania wersję 10.4 beta. Po zarejestrowaniu się w programie możemy poczuć przedsmak tego, co nas czeka w najnowszej pełnej wersji programu. Co nowego w Tableau 10.4 beta? Tableau w swojej najnowszej odsłonie postanowiło pomóc ...
Czytaj Dalej

Nowości w SPSS Modeler 18.1 – SMOTE

Zgodnie z zapowiedziami z poprzedniego artykułu rozpoczynamy serię artykułów opisujących zaimplementowane w języku Python algorytmy, które pojawiły się w najnowszej wersji narzędzia IBM SPSS Modeler. Na początek algorytm SMOTE.           SMOTE (z ang. Synthetic Minority-class Oversampling Technique) to algorytm służący do balansowania niezrównoważonych próbek danych poprzez zbudowanie sztucznych obserwacji klasy mniejszościowej. Dlaczego niezrównoważone dane stanowią problem? Większość ...
Czytaj Dalej

SPSS Modeler 18.1.

Dwudziestego czerwca premierę miała kolejna wersja flagowego narzędzia analitycznego IBM – SPSS Modeler. W narzędziu nie brakuje nowości, z których najciekawsze koncentrują się wokół integracji z narzędziami open source. Kluczową nowością są węzły pozwalające korzystać z techniki, która w ostatnich miesiącach bardzo mocno zyskała na popularności wśród ludzi zajmujących uczeniem maszynowym, co odzwierciedlają m.in. wyniki konkursów na platformie kaggle  – ...
Czytaj Dalej

Akceleracja Tableau

Czym jest Tableau? Tableau jest doskonałym narzędziem dającym możliwość interaktywnego analizowania danych. Jednym ze źródeł sukcesu Tableau, obok doskonałego interfejsu, jest możliwość załadowania kopii danych do Tableau w postaci ekstraktów danych. Dzięki nim Tableau niemal natychmiast modyfikuje wizualizacje i tabele na żądanie użytkownika. Ekstrakty to struktury danych zapisane przez silnik Tableau zawierające kopię informacji źródłowych, często zagregowane w celu zmniejszenia ...
Czytaj Dalej

Wykorzystanie narzędzia analitycznego do integracji i czyszczenia danych

Często podczas rozmów na temat pożądanych funkcji idealnego rozwiązania analitycznego dyskusja schodzi w kierunku liczby dostępnych algorytmów budowy modeli data mining oraz liczby możliwych do zmiany parametrów tych modeli (np. liczba powłok ukrytych w sieci neuronowej). Podobnie sytuacja wygląda w przypadku zapytań ofertowych. Wymagania opisane powyżej stanowią zazwyczaj 80% wszystkich wymagań. Podobnie jak w ekonomii, tak i w tym przypadku ...
Czytaj Dalej

SPSS Modeler 18

W połowie marca miała miejsce premiera kolejnej, już 18, wersji programu IBM SPSS Modeler. W produkcie pojawiło się kilka zmian, które w większości są kontynuacją zmian zapoczątkowanych w wersjach 15-16, czyli dotyczą one integracji z Big Data oraz Open Source. Integracja z Big Data W wersjach 16, 17 oraz 17.1 narzędzie IBM SPSS Modeler zostało wzbogacone o 9 algorytmów, które ...
Czytaj Dalej

Jak działają najpopularniejsze algorytmy dostępne w narzędziu SPSS Modeler?

W związku z tym, że analitycy korzystający z narzędzi powinni wiedzieć, jak działają algorytmy w nich zaimplementowane, postanowiłem w niniejszym wpisie opisać logikę działania 7 najpopularniejszych algorytmów dostępnych w narzędziu IBM SPSS Modeler. 1. Drzewa decyzyjne Drzewa decyzyjne należą do najpopularniejszych klasyfikatorów. Celem klasyfikatorów jest przypisanie obserwacji do jednej ze zdefiniowanych klas (grup), np. kobieta lub mężczyzna. Zmienną, która identyfikuje ...
Czytaj Dalej

SPSS Modeler & Spark

W ostatnich dnia września wypuszczona została nowa wersja programu IBM SPSS Modeler – wersja 17.1. Główną funkcjonalnością owej wersji jest integracja z silnikiem przetwarzania danych Apache SPARK. Wspomniana integracja oznacza, że wszystkie procedury, dla których dostępna była opcja Hadoop-Pushback, mogą być wykonane nie tylko z wykorzystaniem MapReduce, ale także Sparka, przy czym w pierwszej kolejności SPSS będzie wykorzystywał Sparka, a ...
Czytaj Dalej

Dokumentacja SPSS Modeler dostępna w języku polskim!

Od kilku dni dokumentacja SPSS Modeler dostępna jest także w języku polskim. 1. Pełny podręcznik użytkownika IBM SPSS Modeler.   pobierz 2. Szczegółowy opis wszystkich węzłów modelowania w IBM SPSS Modeler.   pobierz Dla zainteresowanych dostępna jest również dokumentacja do: IBM SPSS Modeler Social Network Analysis ...
Czytaj Dalej

Sieci neuronowe ukryte w SPSS Modeler

Kontynując poprzedni temat chciałbym podzielić się odkryciem, którego dokonałem podczas przeglądania dokumentacji SPSS Modeler i Python.  Odkrycie to sprowadza się do wniosku, iż w narzędziu IBM SPSS Modeler istnieją dwa węzły do budowy sztucznych sieci neuronowych. Jeden z węzłów dostępny jest standardowo w palecie węzłów na karcie modele, natomiast drugi, a właściwie pierwszy, można wywołać jedynie korzystając ze skryptu: import ...
Czytaj Dalej

IBM SPSS Modeler i Python

W pierwszym wpisie po wakacjach chciałem pochylić się nad zagadnieniem wykorzystania języka programowania Python w narzędziu IBM SPSS Modeler. W celu zobrazowania działania owego języka w IBM SPSS Modeler posłużę się, często wykorzystywanym przeze mnie, przykładem pętli, w której kolejne wartości z tabeli wyjściowej (węzeł Tabela) wykorzystywane są iteracyjnie w węźle Selekcja. Zbudowany przepływ danych wygląda następująco: Węzeł Selekcja wykorzystuje ...
Czytaj Dalej

SPSS Modeler 17 Fix Pack 1

W ostatnim dniu czerwca IBM opublikował Fix Pack 1 do programu SPSS Modeler 17. Oprócz zwykłych poprawek Fix Pack zawiera dwa nowe węzły służące do budowy modeli bezpośrednio na platformie Hadoop. (Czyżby ktoś się nie wyrobił na marcową premierę?:)) Pierwszy z węzłów umożliwia budowę modeli drzew decyzyjnych Chaid, a drugi modeli liniowych. Są to kolejne węzły dedykowane budowie modeli bezpośrednio na ...
Czytaj Dalej

And the winner is….

Z lekkim opóźnieniem, ale także z wielką dumą chciałbym poinformować, że technologia IBM SPSS zdobyła nagrodę Rozwiązanie Roku 2014 na kongresie BIG DATA: THINK BIG CEE CONGRESS. Nagroda przyznana została za rozwiązanie, którego celem biznesowym było zwiększenie liczby odsłon i czasu przebywania użytkowników na stronie www. Dzięki wykorzystaniu technik data mining odwiedzający stronę są przydzielani do segmentu adekwatnego do ich ...
Czytaj Dalej

Pean na cześć repozytorium

Dziś kilka zdań o centralnej części środowiska analitycznego jaką jest repozytorium modeli  analitycznych. Na pomysł napisania o repozytorium wpadłem na początku roku podczas rozmów z klientami wykorzystującymi środowisko analityczne IBM SPSS. Po kilku miesiącach pracy z repozytorium nie wyobrażają sobie oni pracy analityków bez niego. Repozytorium nie udostępnia dodatkowych algorytmów, ani funkcji analitycznych. Dlatego też, podczas negocjacji klienci w pierwszej kolejności ...
Czytaj Dalej

Analizuj mecze Roland Garros na żywo.

Wszystkich fanów tenisa zachęcam do zapoznania się ze zbudowaną specjalnie na turniej French Open aplikacją IBM SLAMTRACKER. Aplikacja analizuje mecze w czasie rzeczywistym i dostarcza szeregu danych na temat przebiegu pojedynków. Co prawda więcej w niej raportowania, ale i dla analiz predykcyjnych znalazło się miejsce. Dla mnie najciekawsza okazała się zakładka Keys To The Match, w której publikowane są wyodrębnione  ...
Czytaj Dalej

Pay as you drive

Czy zgodziłbyś się na zamontowanie w swoim samochodzie czujnika, który zbierałby dane o Twoim położeniu, prędkości i obrotach silnika? A co jeżeli Twój ubezpieczyciel zaoferowałby w zamian duże zniżki?  Montowanie w samochodach czujników zbierających dane stało się w ostatnich latach coraz bardziej popularne. Jest to oczywiście związane z rozwojem branży IT. Najstarsze znane mi przypadki łączenia branży samochodowej z branżą ...
Czytaj Dalej

Analizy przestrzenne dla korporacji taksówkarskich

W ostatnich dniach zbudowałem w programie IBM SPSS Modeler przepływ danych, którego celem była analiza rozmieszczenia klientów hipotetycznej korporacji taksówkarskiej Algomine Taxi oraz kierowców zatrudnionych w tej korporacji. Gotowy przepływ danych wyglądał następująco: Na potrzeby przeprowadzonej analizy założyłem, że dane o położeniu klientów i kierowców pobieram dzięki aplikacji mobilnej zainstalowanej na ich telefonach. Zakładam, że zarówno klienci, jak i kierowcy ...
Czytaj Dalej

Gdzie znaleźć dokumentacje do produktów IBM SPSS?

W odpowiedzi na często padające pytanie dot. dokumentacji do programów z rodziny IBM SPSS podaję linki do dokumentacji dla wszystkich produktów: IBM SPSS Modeler IBM SPSS Statistics IBM SPSS Collaboration & Deployment Services IBM SPSS Decision Management IBM SPSS Analytic Server IBM SPSS Data Collection ...
Czytaj Dalej

Możliwości wykorzystania języka R w środowisku IBM SPSS

Zgodnie z zapowiedzią sprzed prawie dwóch tygodni chciałbym napisać kilka słów o możliwościach wykorzystania języka R w ramach środowiska analitycznego IBM SPSS. Na początek trochę o historii: Synergia środowiska IBM SPSS z językiem R pojawiła się po raz pierwszy już w wersji szesnastej programu IBM SPSS….Statistics! Użytkownicy dostali wtedy możliwość korzystania z kodu R w ramach Edytora Komend programu IBM SPSS ...
Czytaj Dalej

Nowości w SPSS Modeler 17

W ostatnich dniach IBM udostępnił nową, 17. już wersję flagowego produktu z rodziny SPSS – IBM SPSS Modeler. Nowości dodane w bieżącej wersji wydają się być konsekwencją znaczących zmian wprowadzonych 15 miesięcy temu. Zmianą, która jest najbardziej widoczna po uruchomieniu programu są nowe węzły umożliwiające wczytywanie podanych m.in. w formacie ESRI danych geoprzestrzennych, modyfikację tych danych, a także budowanie modeli ...
Czytaj Dalej