SPSS Modeler 18

Start / Blog / SPSS Modeler 18

W połowie marca miała miejsce premiera kolejnej, już 18, wersji programu IBM SPSS Modeler. W produkcie pojawiło się kilka zmian, które w większości są kontynuacją zmian zapoczątkowanych w wersjach 15-16, czyli dotyczą one integracji z Big Data oraz Open Source.

Integracja z Big Data

W wersjach 16, 17 oraz 17.1 narzędzie IBM SPSS Modeler zostało wzbogacone o 9 algorytmów, które mogły zostać obliczone jedynie na platformie Hadoop, do czego konieczne było posiadanie konektora SPSS Analytic Server.


Obraz 1

Algorytmy te to:
   •     GLE (Uogólnione modele liniowe)
   •     Liniowy – AS (Modele liniowe);
   •     LSVM (Liniowa metoda wektorów nośnych);
   •     Drzewa Losowe (Lasy losowe);
   •     Drzewo AS (Drzewa decyzyjne);
   •     TCM (Modele przyczynowe szeregów czasowych);
   •     STP (Predykcja przestrzenno-czasowa);
   •     Dwustopniowa – AS (Dwustopniowe grupowanie);
   •     Reguły asocjacyjne;


Algorytmy te zaprojektowane zostały w sposób umożliwiający wykorzystanie równoległej architektury silników MapReduce i Spark. Teraz mogą być one również obliczane na serwerze SPSS Modeler i to w sposób wielowątkowy.

W wersji 18 odświeżony został węzeł Szereg Czasowy. Nowa wersja węzła respektuje zmienne, których rola w węźle typy ustawiona została na Separacja. Jest to bardzo przydatne np. do prognozowania popytu na poszczególne produkty. W poprzednich wersjach programu podział mógł być jedynie robiony z wykorzystaniem instrukcji warunkowych. Dodatkowo, węzeł umożliwia podział zmiennych na: zmienną celu, zmienne wejściowe oraz zdarzenia i interwencje.


Integracja z Open Source

W wersji 16 powstała możliwość tworzenie własnych okien dialogowych (węzłów) z wykorzystaniem składni R. W wersji 17.1 dodano opcję tworzenia własnych okien dialogowych z wykorzystaniem języka PySpark. Ich działanie wymagało konektora do Hadoop – SPSS Analytic Server. W wersji 18 PySpark działa już natywnie na serwerze SPSS Modeler.

Dodatkowo użytkownicy SPSS Modeler mogą w opisany powyżej sposób korzystać także z innych bibliotek uczenia maszynowego, które napisane zostały w Pythonie, np. num-py, scipy, scikit-kearn oraz Pandas.


Pozostałe

Nowa wersja przynosi istotne uproszenie w dostępie do rozszerzeń oraz w sposobie ich instalacji.. Rozszerzenie dla starszych wersji można było pobrać m.in. z IBM-owskiego Github-a, a następnie konieczna była ich manualna instalacja. W obecnej wersji programu, w górnym menu, pojawiła się nowa opcja – Rozszerzenia. Pozwala ona pobrać i zainstalować dodatkowe rozszerzenia w sposób automatyczny z poziomu GUI SPSS Modeler.


Obraz2


W menu Pomoc pojawiły się dwie nowe pozycje: Fora SPSS oraz Społeczność IBM SPSS Predictive Analytics. Opcje te przenoszą nas do stron www łączących użytkowników narzędzia IBM SPSS. Strony te dają dostęp do wielu ciekawych dyskusji, dodatkowych plików i rozszerzeń oraz umożliwiają kontakt z osobami odpowiedzialnymi za produkt ze strony IBM.


Obraz3


Na koniec kilka informacji technicznych:
   •     SPSS Modeler dostępny jest na systemach operacyjnych MAC OS oraz Windows;
   •     In-database mining dostępny jest dla bazy DB2 in Z/os, także z akceleratorem IDAA. Dostępne algorytmy to Drzewa Decyzyjne, Drzewa regresyjne, Metoda k-średnich, Naiwny klasyfikator Bayesowski oraz Dwustopniowe Grupowanie.


Obraz4


P.S. Tego samego dnia światło dzienne ujrzała także nowa wersja programu IBM SPSS Statistics – wersja 24. Podobnie, jak w przypadku poprzednich wersji zmiany są dużo mniejsze niż w narzędziu IBM SPSS Modeler. Główne udogodnienia to: ułatwienie importu plików Excel oraz csv, odświeżenie wyglądu tabel w raportach wynikowych oraz zwiększenie liczby procedur statystycznych dostępnych w ramach pakietu Custom Tables.