Błędne dane o lokalizacji są problemem branży reklamowej, szczególnie w przypadku urządzeń mobilnych. Wychodząc naprzeciw obecnej sytuacji, Blisopracował szereg norm, które muszą spełniać dane – nawet kilkadziesiąt procent danych lokalizacyjnych jest przez nas odrzucanych ze względu na ich wątpliwą jakość. Dlaczego tak się dzieje? Wychodzimy z założenia, że dane są „winne do momentu udowodnienia, ze są niewinne” (guilty until proven innocent), a złe dane w większość eliminujemy za pomocą następujących filtrów:

  • Centroidy: centroidy są powszechnie używane, gdy użytkownik odmawia zgody na wykorzystanie danych GPS przez wydawcę. W takich przypadkach wydawca szacuje lokalizację na podstawie luźnych założeń, wiążąc użytkownika z najbliższym adresem IP. Nie jest to problem w sytuacji, gdy chcemy trafić do mieszkańców konkretnego miasta lub kraju – dane o lokalizacji na tym poziomie są dokładne.
    Jeśli jednak chcemy trafić do osób odwiedzających konkretne miejsca (np. salony samochodowe lub centra handlowe), to dane lokalizacyjne przekazane na podstawie luźnych założeń zaburzają rzeczywistość. Zwizualizowane dane z centroidów umieszczają ludzi w przewidywalnych wzorach i kształtach na mapie, co sugeruje, że ludzie żyją i poruszają się po liniach prostych wzdłuż siatki. To wyraźnie nie pasuje do prawdziwych ludzkich zachowań. Tego typu dane są zatem usuwane.
  • Precyzja: usuwamy wszystkie dane o lokalizacji, które mają mniej niż 3 stopnie dziesiętne dla długości i szerokości geograficznej
  • Unikalność: duże nagromadzenie danych dla jednej pary długość/szerokość geograficzna (czyli bardzo małego obszaru) sprawia, że dane te są usuwane3 wymienione powyżej filtry usuwają bardzo wiele niedokładnych danych, jednak dane lokalizacyjne sprawdzane są również pod kątem następujących kryteriów:
  • VPN: algorytmy Blis pozwalają na wychwycenie i usunięcie danych pochodzących z VPN, które zakłamują realne miejsce pobytu użytkownika
  • Lokalizacja wskazuje na równik lub południk zerowy: dane o długości oraz szerokości geograficznej, w której znajduje się użytkownik mogą mieć od 3 do 8 miejsc po przecinku. Jeśli jedna z nich (długość lub szerokość) zwraca wartość 0, oznacza to że użytkownik znajduje się na równiku lub południku zerowym. Taka wartość spowodowana jest najczęściej błędem, więc dane te nie są wykorzystywane w kampaniach
  • Brak kodu kraju lub kod kraju nieprawidłowy: jeśli para długość/szerokość geograficzna wskazuje, że dany użytkownik znajduje się obecnie na terytorium Polski, lecz nie został przekazany kod kraju (lub jest on błędny, bo wskazuje np. na USA) dane klasyfikowane są przez nas jako bezużyteczne i nie są wykorzystywane w kampaniach.

Powyższe filtry pozwalają na usunięcie nawet 75% błędnych danych lokalizacyjnych (np. w Wielkiej Brytanii). W Polsce skala niedokładności danych jest nieco mniejsza i wynosi 46% – tyle danych nie przechodzi przez nasze filtry. Mamy oczywiście świadomość, że skala jest ważna, lecz wychodzimy z założenia, że lepiej zrobić mniejszą i dokładniejszą kampanię, która będzie bardziej skuteczna, gdyż oparta jest o zwalidowane i jakościowe dane lokalizacyjne.

Screen z systemu BLIS pokazujący ile % danych lokalizacyjnych w Polsce jest odrzucanych