Article image

Wszystko o śledzeniu i profilowaniu w sieci – to musisz wiedzieć

9 min czytania
04.03.2019

Obecnie bardzo poważnym problemem rozwijającego się internetu jest spór o prywatność. Problem dotyczy między innymi tematu, jaki model finansowania treści dostępnych w sieci jesteśmy gotowi zaakceptować i wspierać i czy jesteśmy w stanie wyobrazić sobie internet bez targetowania reklam na określoną grupę odbiorców. Dzięki zebranym w sieci informacjom na temat tego, jakie strony najczęściej odwiedzasz, jakie zakupy robisz lub co na dany moment jest Ci potrzebne, w różnych miejscach, wyświetlają Ci się reklamy produktów, którymi faktycznie możesz być zainteresowany. Media mają prawo zarabiać na serwowanych treściach i to robią. Naszym zdaniem nie ma w tym nic złego, takie rozwiązanie często przynosi dużo korzyści zarówno dla internauty, jak również właściciela danej firmy oferującej produkty czy usługi.

Wysoka klikalność reklam i zwiększenie dochodów

Głównym zamiarem reklamodawców i wydawców, jest zapewnienie jak najwyższej klikalności banerów reklamowych. Bardzo często, nieświadomi użytkownicy dziwią się, że po przeglądaniu jednego sklepu z obuwiem, w sieci proponowanych jest nam więcej takich miejsc, wystarczy kliknąć w wyświetlaną reklamę by przenieść się na stronę innego sklepu, gdzie np. możesz znaleźć dużo atrakcyjniejszą ofertę. Mieszane uczucia budzi również fakt, że przebywając w danej lokalizacji, wyświetlają nam się okoliczne restauracje, bary, miejsca gdzie możemy przenocować itd. Temat takiego rozwiązania często budzi kontrowersje, niektórzy są zadowoleni, dla innych stawką w grze jest kontrola nad ich cyfrowym “ja”.

Wiele osób twierdzi, że śledzenia i profilowania użytkowników w sieci staje się coraz bardziej inwazyjne i niemal narusza prywatność każdego z nas. Pobierane dane, dotyczą przecież zdrowia, często naruszają życie prywatne, sytuacji finansowej, pochodzenia etnicznego, relacji osobistych, nałogów, słabości i marzeń a wyświetlane reklamy pojawiają się bez jasnej zgody internauty. Proponowane reklamy mogą nam jednak sporo ułatwić, w wielu przypadkach, szybciej znajdziemy dobre miejsce noclegowe, smaczną restaurację czy dobry sklep z konkretnymi produktami.

Na podstawie danych, które zebrane zostały z różnych źródeł sporządziliśmy dla Was raport z 2019, który nieco dosadniej pozwoli rozwikłać zagadkę śledzenia i profilowania użytkowników.

Jak działa komercyjny internet w 2019 roku

Z pewnością mało osób wie, że w 2019 roku obchodzimy 25 urodziny pierwszego zamieszczonego w sieci baneru reklamowego. Od tego czasu świat internetu uległ wręcz radykalnej zmianie, widoczne jest to np. w przypadku stron internetowych, które na przestrzeni lat zmieniły się nie do poznania. Od tamtego czasu, zmieniło się również traktowanie danych osobowych. Szacuje się, że wartość rynkowa wszystkich dostępnych danych, przetwarzanych w 2020 roku na terenie Unii Europejskiej osiągnie wysokość 739 miliardów euro – dużo prawda?

Już od kilku dekad, przeróżne branże, gromadzą dane o potencjalnych Klientach i trafnie je wykorzystują. Obecnie techniki śledzenia w sieci nie są już zagadką dla żadnego marketera a wręcz przeciwnie, pomagają mu usprawnić pracę. Dzięki temu, firma ma możliwość “efektywnego inwestowania środków”, przygotowane banery lub reklamy kierowane są do najbardziej dochodowych grup odbiorców. Dokładna analiza zainteresowań, potrzeb i słabości danych użytkowników sieci służy między innymi do kategoryzowania i hierarchizowania użytkowników w sieci – na grupy bardziej lub mniej dochodowe. Nie pozostaje to jednak bez plusów dla samej grupy odbiorców – otrzymują oni trafne propozycje, rzeczy lub usług, którymi realnie mogą być zainteresowani. Strategie i modele biznesowe firm, opierają się obecnie na ilości i jakości trafnych danych, dzięki dostępnym narzędziom, możliwe jest zebranie w stu procentach opłacalnej grupy odbiorców.

W naszej opinii błędem jest sformułowanie, iż internauci są ofiarami śledzenia danych, nie jest to bowiem działanie mające na celu uprzykrzyć życie ale pomóc w wyszukaniu wartościowych dla siebie stron internetowych. W efekcie obydwie ze stron otrzymują realną korzyść, internauta miejsce, gdzie może skorzystać z oferty, która go interesuje a właściciel firmy zwiększenie dochodów pochodzących z ich sprzedaży.

Sama definicja śledzenia w sieci może wydawać się negatywnym rozwiązaniem. Drobne i poważniejsze decyzje podejmowane w sieci zostają nieustannie analizowane i zapisywane, każdy ruch, relacje społeczne, zainteresowania itd, zostają nieustannie rejestrowane, zapisywane i oceniane.

Wydatki na reklamy internetowe w Polsce

W 2018 roku w Polsce wydatki na reklamę online osiągnęły kwotę ok. 4,3 mld złotych. Z kolei na poziomie Europejskim, wartość rynku w ciągu 5 lat wzrosła dwukrotnie do poziomu 48 mld euro. Uwaga – te wydatki dotyczą wyłącznie powierzchni reklamowej, nie są nimi objęte koszty zakupu danych, tak więc rzeczywista wartość rynku reklamy internetowej może być nawet wielokrotnie większa.

Urządzenia mobilne, aplikacje, sensory

W dobie elektroniki i smartfonów to właśnie one stały się głównym katalizatorem i kluczowym narzędziem śledzenia i profilowania na potrzeby komercyjne. Nadeszły czasy, w których wręcz nie rozstajemy się z telefonami komórkowymi. Korzystanie z aplikacji moblinych generuje metadane: adres IP, czas dostępu, długość trwania sesji, rodzaj oprogramowania, lokalizacja urządzenia i inne. Z generowanych metadanych, w połączeniu z informacjami o tym, w jaki sposób określona osoba korzysta z danej aplikacji, czy usługi powstaje profil użytkownika, który obejmuje między innymi cechy osobowości, opis przyzwyczajeń, indywidualnego trybu życia, zachowań w sieci i innych. Dzięki właśnie takim danym możliwe jest śledzenie w sieci, to właśnie one mają niejednokrotnie wrażliwy charakter i w dużym stopniu ingerują w prywatność.

Ciekawostka: Pewnie nie do końca zdajesz sobie sprawę z faktu, iż zwykły przeciętny człowiek korzysta aktywnie z około 27 aplikacji miesięcznie. Mało kto decyduje się na zapoznanie z regulaminem i polityką prywatności. Badania przeprowadzone przez naukowców Carnegie Mellon University wykazują, że dostępna w aplikacjam mobilnych polityka prywatności liczy około 2500 słów, co sprawia, że w zasadzie nikomu nie chce się tego czytać, są one również często nieczytelne dla potencjalnego użytkownika. 

Czym są Dark patterns

Są to elementy w interfejsów w aplikacjach. Dzięki specjalnemu projektowi nakłaniają użytkowników do wybranej opcji korzystnej zarówno dla niego, jak również dla firmy zarabiającej. Odpowiednie zaprojektowanie aplikacji sprawia, że użytkownik nakłoniony poprzez kolory czy kształty, klika dokładnie w to co zaproponuje mu aplikacja. Tak dzieje się w przypadku zgody na śledzenie – użytkownik klika, a jego dane pobierane są automatycznie.

Głównie stosowane Dark patterns to:

  • ustawienia domyślne,
  • wydłużona ścieżka zmiany ustawień, dla tych, którzy chcą zadbać o prywatność,
  • wskazujące konkretne okna z ustawieniami prywatności,
  • takie, które grożą utratą ważnych funkcjonalności lub usunięciem konta, w sytuacji kiedy użytkownik nie zgodzi się na przekazywanie dodatkowych danych,
  • interpretowanie przypadkowych akcji.

Pozyskiwane dane – na co zgadza się użytkownik?

Aby dowiedzieć się, do czego przyznajesz dostęp wystarczy przejrzeć politykę prywatności udostępnianą przez aplikacje mobilne. Użytkownik najczęściej zgadza się na dostęp do:

  • kalendarza,
  • kontaktów,
  • historii przeglądarki,
  • wrażliwych logów aplikacji systemowych,
  • aplikacji aktywnych na urządzeniu.

Skąd aplikacje wiedzą gdzie jesteś

Prawdą jest, że aplikacje mobilne śledzą naszą lokalizację. Dzięki łatwemu dostępowi do wszystkich danych mogą łatwo odczytać gdzie w danym momencie się znajdujesz. Jest to przybliżona lokalizacja, którą mogą odczytać dzięki:

  • danym do logowania telefony do stacji przekaźnikowych, dostępu do GPS,
  • location logs,
  • historii zapamiętanych sieci Wi-Fi,
  • historii adresów IP,
  • metadanych,
  • współrzędnych geograficznych,
  • odcisku palca przeglądarki,
  • adresu zapamiętanego w przeglądarce lub aplikacji.

Pozyskiwanie takich informacji nie wymaga wiedzy ani zgody i ciężko jest to całkowicie wyłączyć. Nie jest to jednak aż tak złe jak sobie wyobrażamy. Dzięki zapisywanym danym i śledzeniu w sieci, otrzymujemy podpowiedzi, które mogą sporo ułatwić np. znaleźć miejsce noclegowe lub dobrą restaurację w okolicy.

Targetowanie przekazu

Dzięki śledzeniu w internecie możliwe jest odpowiednie targetowanie behawioralne reklam. Dzięki temu osoba zainteresowana zakupem łóżeczka dla dziecka, otrzyma z sieci propozycje sklepów, które w ofercie posiadają taki produkt. Dzieje się to w różny sposób np. jeżeli dana osoba chociaż raz weszła na Twoją stronę, nieświadomie zapisała się na liście i to właśnie do niej kierowane będą reklamy Twojej działalności. Można więc śmiało powiedzieć, że internet ma olbrzymią przewagę nad innymi tradycyjnymi środkami przekazu. Reklamy w telewizji często są pomijane i zapominane, Internetowa reklama sprawia, że użytkownicy w nią klikają, przechodzą na stronę i jeżeli oferta im się spodoba, dokonują zakupu. Oczywiście nie jest to takie proste, właściciel firmy musi bowiem odpowiednio tą ofertę przygotować i tak dostosować, aby rzeczywiście była dla użytkownika atrakcyjna, to wymaga analizy rynku.

Czym jest reklama interaktywna?

Reklama targetowana/behawioralna/profilowana – dopasowane do preferencji użytkownika, który ją odwiedza.

Reklama kontekstowa – dopasowana do treści strony,

Reklama internetowa – wszystkie formaty reklam wykorzystywanych w internecie np. reklamy displayowe.

Udostępniana reklama ma przede wszystkim generować sprzedaż produktów i usług. Obecnie mniej liczy się to ile osób zobaczyło reklamę, a bardziej to jakie przyniosła ona efekty. Pożądane jest wejście na stronę i wykonanie określonego działania, czyli konwersja. Zarobki firm i zwroty w inwestycję reklamy wyświetlanej w internecie zależne są od tego, ile osób kliknie w reklamę i ile z nich zdecyduje się dokonać zakupu (cost per sale – CPS). Dzięki temu, zbierane są również dane kontaktowe (cost per lead – CPL) , co sprawia, że możliwe jest kierowanie odpowiedniej reklamy do zainteresowanej grupy odbiorców.

Taka tendencja i wzrost zainteresowania przedsiębiorców na kierowanie reklam do określonej grupy odbiorców sprawiło, że wymagania wzrosły. Jeżeli sprzedawca chce zapewnić potencjalnym Klientom jak najlepszą jakość reklam, musi nastawić się na zgromadzenie jak najwięcej potrzebnych informacji, tym samym wzrastają wymagania, które z kolei przekładają się na konieczność zagwarantowania jeszcze lepszego śledzenia. Działania marketingowe wymagają dokładnej wiedzy na temat wieku, miejsca zamieszkania, cech osobowości. Okazuje się, że internauci często nie do końca są świadomi, że takie dane udostępniają

Mechanizm RTB – real-time bidding

Real-time bidding oznacza licencję w czasie rzeczywistym. Przedmiotem impresji są pojedyncze wyświetlenia reklamy przez potencjalnego odbiorcę. Dostawcy treści internetowych wystawiają profile użytkowników na sprzedaż, a także wyświetlają im przestrzeń reklamową za pomocą Supply Side Platforms – SSP. Jest to wysokiej klasy oprogramowanie, które w czasie rzeczywistym umożliwia komunikację z innymi graczami na giełdzie. Profil zamieszczony na platformie nie zawiera danych identyfikujących użytkownika. Tutaj dane takie jak imię i nazwisko a także adres zamieszkania nie mają większego znaczenia, ważniejsze są natomiast specjalne numery użytkownika, do których profil jest przypisany, dane, jakie są tam zawarte to między innymi:

  • zainteresowania,
  • siła nabywcza,
  • stan zdrowia,
  • ważne momenty w życiu np. narodziny dziecka..

Korzystający z urządzeń mobilnych użytkownicy posiadają również swoje własne identyfikatory. Na urządzeniach z systemem Android jest to Google Advertising AAID, na Apple – numer IDFA, Identifier for Advertising.

Zajmijmy się teraz komputerami, tu jest trochę inaczej niż w przypadku smartfonów lub innych urządzeń mobilnych. Tutaj sprawa wygląda tak, że ilu dostawców treści i pośredników tyle różnych identyfikatorów. Ważną kwestią, którą należy poruszyć, jest cookie syncing czyli ciasteczka odpowiadające za synchronizację i odpowiednie dopasowanie – jest to proces, w którym firmy przekazują sobie wzajemnie informacje o nadanych użytkownikom indywidualnych identyfikatorach i profilach. Data Management Platforms to wyspecjalizowane platformy, które odpowiadają za katalogowanie identyfikatorów i profili od różnych pośredników. Platformy popytu, czyli Demand Side Platforms odbierają i analizują gromadzone dane, które zaprojektowane są tak, by wyszukać użytkowników o określonym profilu.

Agencje mediowe określają profile poszukiwanych użytkowników. Działa to na zasadzie – przychodzę do Ciebie, a Ty daj mi Klienta, który jest zainteresowany moją ofertą i z niej skorzysta. Aby wszystko zadziałało firma musi wygenerować odpowiednie informacje o użytkownikach, jest to możliwe dzięki systemowi zarządzania relacjami CRM. Indywidualny, hipotetyczny profil użytkownika to tak zwane look-alike, która jest mieszanką twardych danych, które pochodzą od reklamodawców i statystycznej wiedzy o ludziach. Wszystkie pobierane dane poparte są twardą analizą. 

Cały proces kierowania reklam przez giełdy reklamowe ma za zadanie uwidocznić oferowaną ofertę osobom realnie nią zainteresowanym. Wskutek takich działań, reklama trafia w ręce odpowiedniego odbiorcy, co zwiększa możliwość zakupu i wygenerowania zysku. Dzięki specjalnym działaniom po stronie podaży generowana jest informacja o profilu użytkownika, który właśnie czeka na załadowanie konkretnej strony internetowej, w tej chwili możliwe jest wyświetlenie reklamy, po stronie popytu jest profil look-alike, który poszukiwany jest przez agencje mediowe. Dopasowanie odpowiednich reklam trwa zaledwie kilka sekund.

W jaki sposób wysyłane są dane

Tutaj nic nie dzieje się przypadkowo, wszystkie firmy, które chcą wziąć udział w licytacji RTB, muszą spełnić określone wytyczne i być zgodne z wymogami Google oraz Internet Advertising Bureau, czyli branżowej organizacji firm działających na rynku reklamy interaktywnej. Standardy techniczne ustalane są za pomocą systemów RTB – ustalają one standardy techniczne i organizacyjne dla pozostałych graczy. To właśnie te wytyczne dyktują jakie informacje o użytkownikach wysyłane są przez platformę podaży na giełdę oraz jakie dane trafiają do innych platform DSP.

Co zawiera bid request:

  1. Płeć
  2. Identyfikator nadany użytkownikowi przez SSP.
  3. Full referral URL.
  4. Rok urodzenia.
  5. Lokalizację.
  6. Numer IP.
  7. Zainteresowania
  8. i inne dane.

Proces licytacji przebiega wedle standardów, jest w pełni zautomatyzowany i zdominowany przez algorytmy.

Jak bardzo jesteśmy śledzeni

W poprzednich częściach wspominaliśmy, jak zbierane są dane i do kogo kierowane są reklamy. W obecnym czasie śledzenie w sieci rozwinięte jest na naprawdę wysokim poziomie. Dane, jakie są pozyskiwane na temat danego użytkownika, zależne od ilości i rodzaju usług, z jakich korzysta. Prawdziwą skarbnicą informacji są portale społecznościowe, gdzie o danym użytkowniku możesz dowiedzieć się najwięcej. Takie portale wymagają zalogowania i umożliwiają ciągłe gromadzenie informacji i danych behawioralnych w połączeniu ze stabilnym identyfikatorem. Jak się okazuje nawet wobec braku zweryfikowanych i łatwo dostępnych danych dostawcy treści internetowych tworzą wielowarstwowe profile użytkowników, na nie składają się:

  • płeć,
  • wiek,
  • stan cywilny,
  • sektor zatrudnienia,
  • poziom dochodów,
  • profil etniczny,
  • profil religijny,
  • dane o lokalizacji,
  • dane techniczne,
  • ustawienia przeglądarki,
  • zainteresowania, słabości,
  • ważne momenty,
  • cechy osobowości.

Na tej podstawie tworzone są dokładnie zdefiniowane kategorie, które powiązane zostają z cechami konkretnej usługi lub produktu, które mają za zadanie zapewnić sprzedaż. Podobnie jest z portalami społecznościowymi. Facebook jest w stanie generować nawet tysiące szczegółowych kategorii związanych z określonymi produktami, markami, usługami itd. Zbierane dane osobowe mają różne źródła i charakter. Pochodzą bezpośrednio od użytkownika lub są zadeklarowane np. na podstawie badania czy przeprowadzonej ankiety. W takich miejscach jesteśmy w stanie niejako kontrolować to co udostępniamy lub jakich informacji udzielamy w ankietach. Drugą warstwę tworzą wyniki behawioralne, które bardzo trudno kontrolować, często pobierane są one w sposób niejawny np. dzięki słowom wypowiadanym do mikrofonu, lokalizacji i ogólnego sposobu korzystania z urządzeń mobilnych. Istnieje również warstwa trzecia, gdzie w zasadzie kontrolowanie jest niemożliwe. Są to dane wywnioskowane oparte na analizie statycznej. Są to jedynie przypuszczenia na temat zachowań, cech itd konkretnego użytkownika, które wygenerowane zostały na podstawie danych osobistych. Pozyskane dane mówią mniej konkretnie o osobie a zdecydowanie więcej o “statycznym użytkowniku, który reprezentuje określony styl życia.

Jak widać, śledzenie użytkowników w internecie, w obecnych czasach jest na bardzo rozwiniętym poziomie. Trudno tutaj mówić o całkowitej wolności i prywatności w sieci. Nie jest to jednak do końca złe rozwiązanie. Dzięki gromadzonym danym możliwe jest podsyłanie użytkownikowi informacji, które są z korzyścią dla niego samego. Nie musisz godzinami przeszukiwać ofert dostępnych poprzez wpisanie hasła w wyszukiwarce, na podstawie tych danych sieć sama pokazuje Ci miejsca, gdzie możesz kupić dany produkt lub skorzystać z usługi. Śledzenie w sieci, ma wiele zalet, o których często nie do końca mamy pojęcie.