Maria Czekańska , Gabriela Siwka wpis utworzony wpis edytowany
#SendGuard: wywiad z prof. dr hab. inż. Grzegorz J. Nalepa
Powrót do listy wpisówGabriela Siwka: Profesor jest autorem wielu publikacji naukowych, szczególnie z zakresu sztucznej inteligencji — co jest pana specjalnością. Co takiego jest w AI, że wybrał Pan właśnie ją jako swoją ścieżkę naukową?
prof. dr hab. inż. Grzegorz J. Nalepa: AI zawsze mnie fascynowało, m.in. ze względu na swoją interdyscyplinarność, natomiast sama tematyka moich zainteresowań zmieniała się na przestrzeni lat. Dość długo zajmowałem się modelowaniem i inżynierią wiedzy czy systemami automatycznego wnioskowania. Natomiast był to dla mnie jedynie punkt wyjścia, dlatego stopniowo zacząłem zajmować się również systemami, które realizują swoje zadania na podstawie inteligentnej analizy danych, metod uczenia maszynowego oraz eksploracji danych. Od kilku lat moją jedną z moich specjalności jest budowa systemów hybrydowych, gdzie nie tylko wykorzystujemy uczenie maszynowe, bo to jest oczywiście teraz bardzo popularny paradygmat, ale również budujemy system, w którym staramy się łączyć komponent uczenia maszynowego i eksploracji danych z komponentem wnioskowania. W ostatnich latach ważna tematyka, która się pojawiła w mojej pracy badawczo-naukowej, a dokładniej powróciła, to jest tematyka objaśnialnej sztucznej inteligencji (XAI). Dość często mamy do czynienia z sytuacją, gdy wielu ekspertów od uczenia maszynowego nie jest w stanie precyzyjnie odpowiedzieć na pytanie: dlaczego system popełnia jakieś błędy? Wzrosło więc zapotrzebowanie na to, żeby eksperci byli w stanie zrozumieć współzależności pomiędzy błędnym działaniem systemu a danymi, które zostały użyte do jego zbudowania.
Dlaczego powiedziałem, że ten temat wraca? Obecnie objaśnialna sztuczna inteligencja pojawia się jako coś nowego w kontekście uczenia maszynowego. Natomiast we wcześniejszych okresach rozwoju sztucznej inteligencji ważność zależności pomiędzy działaniem systemu a jego rozumieniem była dość oczywista.
Dość często mamy do czynienia z sytuacją, gdy wielu ekspertów od uczenia maszynowego nie jest w stanie precyzyjnie odpowiedzieć na pytanie: dlaczego system popełnia jakieś błędy?
Jak pan sądzi, jaką rolę odgrywa i odegra w najbliższym czasie sztuczna inteligencja w branży e-mail marketingowej?
Myślę, że ta rola jest niezwykle ważna i robi się coraz istotniejsza. Branża bardziej docenia sztuczną inteligencję z dwóch powodów. Po pierwsze, ważne są tu metody rekomendacji i personalizacji treści. Po drugie niezwykle istotna jest automatyzacja procesów, dzięki którym systemy marketingowe mogą być lepiej skalowalne. Może nam ona uprościć np. budowanie nowych kampanii czy też rozsyłanie większej ilości e-maili do większej ilości użytkowników z większym prawdopodobieństwem, że te maile mogą zostać otwarte. Natomiast dzięki wspomnianej personalizacji może wzrastać konwersja. Chcemy wiedzieć, że wysłane e-maile będą po prostu przydatne — dla odbiorców, użytkowników i firm.
W tym momencie AI jest używane przez takie firmy jak FreshMail, natomiast nie mam wątpliwości, że inne firmy z tej branży zainteresują się rozwiązaniami z zakresu technologii sztucznej inteligencji.
To prawda, tutaj dopasowanie treści, myślę, że jest ważne dla nas z punktu widzenia również i użytkowników. Skoro jesteśmy przy temacie AI w email marketingu, nie sposób nie wspomnieć o FreshMailowym projekcie SendGuard, przy którym pełnił pan rolę koordynator zespołu naukowego. Zdaniem profesora, czy wypracowane przez nas rozwiązanie wprowadzi coś nowego w dziedzinie AI w email marketingu? Jakich zmian czy korzyści możemy się spodziewać?
Jako osoba związana z projektem mam tutaj nie tylko wiedzę na jego temat, ale również pozytywny stosunek do tego, jakie znaczenia mają wypracowane przez nas rezultaty. Myślę, że najistotniejsze elementy projektu, który moim zdaniem przełożą się na innowacje dla całej branży, to kwestie związane z analizą behawioralną, czyli co, dlaczego i kiedy klienci robią z mailami. To może przełożyć się na większą skuteczność tego marketingu, a taki jest między innymi core business FreshMaila.
Drugi bardzo ważny element to bezpieczeństwo. Jest cienka granica między mailem marketingowym a czymś, co użytkownik odbiera jako e-mail niechciany, czyli właśnie SPAM. I jest to powiązane z tą pierwszą częścią, czyli personalizacją. We FreshMailu mamy dobrze opracowane to, żeby wysyłać jedynie takie e-maile, na które użytkownik wyraził zgodę. Natomiast niejednokrotnie zdarza się, że treść jest niedopasowana do potrzeb użytkownika, a przez to jest odbierana jako e-mail niechciany.
Rozwiązania, które wypracowaliśmy w projekcie, przełożyły się na pewno na poprawienie rozumienia tego, gdzie leży granica pomiędzy nieprzydatnym a niechcianym e-mailem. Czyli z jednej strony poprawiliśmy funkcjonowanie różnego rodzaju zabezpieczeń, a z drugiej strony powiązaliśmy element personalizacji i analizy behawioralnej właśnie z elementem bezpieczeństwa. Dlatego rozwiązania SendGuarda są, moim zdaniem, nowatorskie.
Na niektórych konferencjach biznesowych można się spotkać z pewnym poziomem naiwności, że wystarczy mieć dużo danych, zapłacić wystarczająco dużo ekspertowi od machine learningu i chwilę poczekać, aby wydobyć nowatorskie efekty z AI.
A jeśli chodzi o samą pracę przy projekcie, jakie były wg pana największe wyzwania na poszczególnych etapach?
Takie, które często zdarzają się w projektach R&D. W pewnym sensie to co powiem nie będzie niczym nowym dla osób, które są w jakiś sposób związane z projektami.
Jednym z pierwszym wyzwań jest skompletowanie dobrego zespołu po obu stronach. Tzn. połączenie prac i działań inżynierów w firmie, którzy świetnie znają swoją branżę, z pracą zespołu naukowego, który ma bardzo dużą wiedzę teoretyczną i praktyczną. Reżim pracy badawczo-rozwojowej jest całkiem inny niż reżim pracy w firmie o charakterze komercyjnym. Jednakże nie tylko skompletowanie zespołu okazuje się być tu wyzwaniem, ale także jego utrzymanie w sprawnym działaniu przez kilka lat. Jeśli się to uda, tak jak nam się udało, to już jest to spore osiągnięcie.
Drugie wyzwanie, które również jest dość typowe, to jest dostępność właściwych danych. Faktem jest, że firmy mają bardzo dużo różnorodnych danych. Natomiast dopiero przy realizacji projektów o charakterze badawczo-rozwojowym często okazuje się, że właściwe przygotowanie i przetworzenie danych, które firma już ma, jest samo w sobie trudne i czasochłonne.
Na niektórych konferencjach biznesowych można się spotkać z pewnym poziomem naiwności, że wystarczy mieć dużo danych, zapłacić wystarczająco dużo ekspertowi od machine learningu i chwilę poczekać, aby wydobyć nowatorskie efekty z AI. A jeśli chcemy mieć szybkie efekty… to wystarczy kilku więcej specjalistów od machine learningu. (śmiech) Dlatego też często okazuje się, że wyzwaniem jest to, aby firma nieco zmieniła swój sposób myślenia.
Natomiast trzecie wyzwanie to zmieniające się wymagania w trakcie wykonywania projektu, np. ze strony rynku. Projekty typu SendGuard mają to do siebie, że są bardzo ambitne, ale też długotrwałe. A sytuacja na rynku i w biznesie potrafi pędzić.
Dodatkowo, w trakcie realizacji projektu wybuchła pandemia. Myślę, że tu należą się duże brawa dla całego zespołu po obu stronach za to, że zmiana trybu pracy ze stacjonarnego w zdalny nie przełożyła się w żaden negatywny sposób na realizację projektu.
I ostatnia rzecz, która też jest typowa dla projektów badawczo-rozwojowych, to dopasowywanie wstępnych założeń do rzeczywistości. Pisząc wniosek projektowy robimy pewne założenia co do tego, jakie będą wyniki i jakimi metodami je uzyskamy, a potem konfrontujemy to z rzeczywistością. Jest to dla mnie najciekawsze wyzwanie, bo jest to zderzenie teorii z praktyką.
Często w projektach badawczo-rozwojowych możemy się dowiedzieć w trakcie realizacji, że sposób, jaki początkowo sobie założyliśmy nie będzie tym, którym tak naprawdę to osiągniemy. Więc dziękuję bardzo za zaznaczenie tego. Jakie funkcje czy modele, wypracowane w czasie trwania projektu, uważa profesor za najbardziej przydatne biznesowo?
W gruncie rzeczy to są funkcjonalności, które nawiązują do obszarów, o których mówiłem już wcześniej. Było bardzo dużo ciekawych wyników związanych z analizą niechcianych treści. Jednak nie w takim typowym ujęciu. Bo tak, jak powiedzieliśmy wcześniej: jeżeli chcemy tylko odróżnić zwykły spam od reszty e-maili, wydaje się to proste. Natomiast kiedy chcemy odróżnić e-maile o charakterze marketingowym od reszty poczty, wydaje się to już trudniejsze. Jak już mówiłem, dla wielu osób maile marketingowe są z definicji spamowe. Podobnie jest z wiadomościami, które mają niedopasowane do użytkownika treści — wzbudzają irytację i mogą zostać oznaczone jako spam.
Nasz projekt powstał głównie po to, aby zapobiegać spamowi i phishingowi. Jak wiemy — jest to problem globalny, który wciąż narasta. Czy będzie on wciąż rósł, czy właśnie dzięki takim projektom jak SendGuard będziemy ostatecznie bliscy jego wykluczenia?
Jest to jeden z kluczowych obszarów projektu. Natomiast myślę, że w dłuższej perspektywie czasowej wartość SendGuardu dla branży zmieni, miejmy nadzieję, postrzeganie SPAMu, spamu branżowego, spamu związanego z marketingiem. Natomiast osobiście jestem pesymistą jeśli chodzi o zalew niechcianej treści czy też szumu informacyjnego, myślę że to nie jest coś, co zaniknie, a na ile sztuczna inteligencja pomoże nam pomoże — nie wiadomo.
Marka, która padła ofiarą takiego ataku, pod którą ktoś się podszył, może mieć trudności z kontynuacją swojego biznesu.
Rozumiem, czyli będziemy obserwować zmiany tak naprawdę w rzeczywistości. W naszym projekcie prowadziliśmy analizę płytką oraz głęboką linków. Czy może profesor wyjaśnić dlaczego taka analiza jest ważna z punktu widzenia spamu/phishingu?
Analiza linków jest jednym z najskuteczniejszych elementów do wychwytywania phishingu. Z kolei phishing jest jednym z najniebezpieczniejszych postaci e-maili, które są kojarzone z marketingiem i bardzo często są krzywdzące dla całej branży. Są to wiadomości wysyłane w celu pozyskania danych wrażliwych, najczęściej danych związanych z dostępem do jakichś systemów finansowych. Wyglądają jak e-maile marketingowe natomiast intencja jest inna. No właśnie, bo jednym z elementów projektu była analiza intencji, czyli odpowiedź na pytanie: o co tak naprawdę w tym mailu może chodzić? I tu badaliśmy głównie treść, robiliśmy głęboką analizę linków czyli czym są odnośniki w danym mailu, jak głęboko sięgają, czyli przez jakie ilości połączeń przechodzą itd. Wszystko po to, by dowiedzieć się, czy jest to e-mail marketingowy czy atak phishingowy. Moduły, które zostały opracowane w SendGuardzie do wychwytywania wspomnianych maili są o tyle istotne, że te fałszywe wiadomości powodują ogromne szkody — zarówno dla odbiorców, jak i dla firm. Bo marka, która padła ofiarą takiego ataku, pod którą ktoś się podszył, może mieć trudności z kontynuacją swojego biznesu.
Przed nami ostatnie pytanie, jakie będą następne projekty, w których będzie profesor zaangażowany po SendGuardzie?
Ani ja, ani moi współpracownicy się nie nudzimy. W branży projektów badawczo-rozwojowych jest tak, że osoby, które cieszą się pewną renomą (śmiech) są przeważnie niezwykle zajęte i mają do czynienia z przeciążeniem.
Nadal współpracujemy z pewnymi firmami z branży marketingowej. Natomiast jesteśmy zaangażowani również bardziej badawczo, tzn. na nieco niższych poziomach gotowości technologicznej. Ale to może się w przyszłości przerodzić w projekty z zastosowań sztucznej inteligencji w Przemyśle 4.0, bo to jest bardzo ciekawy i perspektywiczny obszar, gdzie mamy interesujące wyniki.
Mamy interesujące międzynarodowe projekty z partnerami przemysłowymi. Oczekujemy uzyskania wartościowych wyników nie tylko naukowych, ale też, mamy nadzieję, że biznesowych.
Bardzo dziękuję i życzę powodzenia w dalszych badaniach!
Bardzo dziękuję i życzyłbym wszystkim firmom, żeby ich projekty badawczo-rozwojowe były tak dobrze i skutecznie realizowane jak SendGuard! (uśmiech)