Przejdź do głównej treści
SalesMeUp
Wszystkie artykuły
· Dobrosław Duszyński · pl

Jak odczarować bazę danych: Wnioski z 11 lat doświadczenia w lead generation

11 lat w lead generation, jeden powtarzalny wniosek: 77 na 100 wyników w Sales Navigator nie spełnia co najmniej jednego kryterium filtra. Praktyczne prompty i narzędzia (ChatGPT, Gemini, Google AI Studio, Apollo, Clay) do czyszczenia danych B2B przed wysyłką.

1. Dane są jak ropa, równie cenne i równie esencjalne

„Data is the new oil” — Clive Humby

Sformułowanie „Dane to nowa ropa naftowa” przypisuje się brytyjskiemu matematykowi i pionierowi analizy danych, Clive’owi Humby’emu. Wypowiedział je 20 lat temu, w 2006 roku, podczas konferencji Association of National Advertisers. Humby, który stał za sukcesem karty lojalnościowej Clubcard sieci Tesco, nie miał na myśli jedynie samej wartości danych, ale przede wszystkim proces ich przetwarzania.

Oryginalny cytat brzmiał nieco szerzej:

„Dane to nowa ropa. Są wartościowe, ale jeśli nie zostaną przetworzone, nie można ich tak naprawdę użyć. Muszą zostać zamienione w gaz, plastik czy chemikalia, aby stworzyć wartościowy produkt… tak samo dane muszą zostać przeanalizowane, aby nabrały wartości.”

Dlaczego to porównanie stało się sławne?

Choć Humby był pierwszy, metafora zyskała drugie życie i globalną popularność dzięki:

  • Peterowi Sondergaardowi (Gartner), który w 2011 roku dodał: „Informacja to ropa XXI wieku, a analityka to silnik spalinowy”.
  • Publikacji w „The Economist” z 2017 roku, gdzie w artykule okładkowym stwierdzono, że najbardziej wartościowym zasobem na świecie nie jest już ropa, lecz właśnie dane.

Wielu współczesnych ekspertów polemizuje z tym stwierdzeniem, zauważając, że ropa się kończy po zużyciu, a dane można wykorzystywać wielokrotnie. Moim zdaniem to nie do końca prawda, ponieważ istnieje dużo danych śmieciowych, które są powoli usuwane, czyli wypisz wymaluj zostają spalinami. I tak jak spaliny, zostają z nami i zanieczyszczają nasze bazy danych. Jaki to ma wpływ na prospecting i sprzedaż? Taki jak spaliny na Twoje płuca, przerażająco ogromny.

2. Ile danych w bazie zgadza się z Twoim zapotrzebowaniem. Badanie MeetAlfred vs Sales Navigator

Ciekawym zbiegiem okoliczności w 2006 roku powstał LinkedIn, który do dzisiaj jest największą i najbardziej aktualną platformą danych o biznesie na świecie. Na bazie informacji, które dostarcza LinkedIn, powstały chyba wszystkie znane Wam narzędzia, w których możecie szukać danych kontaktowych do osób decyzyjnych z niemal wszystkich znanych branż.

Wiele osób żyje w przekonaniu, że płacąc za nowoczesne bazy danych takie jak ZoomInfo, Lusha czy Apollo, kupuje „czyste” dane. Ci którzy korzystają z agentów AI, są przekonani, że „czyszczenie” bazy wykona agent, i to bezbłędnie. Rzeczywistość jest jednak zupełnie inna i pokazuje, że algorytmy często zawodzą w kwestii precyzji.

Postanowiliśmy to sprawdzić, analizując jakość danych w zestawieniu MeetAlfred (często używany do automatyzacji LinkedIn) w starciu z surowymi wynikami z Sales Navigatora.

Parametry badania

Na potrzeby testu wyciągnęliśmy dane 100 osób, które według filtrów powinny spełniać bardzo konkretne kryteria:

  • CEO
  • Firmy 51-200 osób
  • Lokalizacja: Wielka Brytania
  • Branża: transportowa

Kluczowe wnioski

Błędy w stanowiskach: aż 11 na 100 osób (11%) w ogóle nie pasowało do zadeklarowanego stanowiska.

Niezgodność branżowa: 33 na 100 wyników (33%) stanowiło „luźne” potraktowanie filtru branżowego.

Niezgodny rozmiar firmy: wyszukiwanie zwróciło 42 podmioty w 8 różnych rozmiarach firm, mimo że filtr był ustawiony na 1.

Lokalizacja: to jedyna kategoria, w której dane się zgadzały.

Sedno

Płacisz 80-120 USD za subskrypcję Sales Navigatora, by uzyskać dostęp do danych miliarda osób. Ale gdy faktycznie zagłębiasz się w bazę, proste badanie wykazuje surową rzeczywistość:

  1. 77 na 100 wyników nie spełniało co najmniej 1 kryterium zapytania.
  2. Tylko 1 kryterium było zgodne w 100% (a zdarza się, że i 0 zgodnych w 100%).
  3. Ostatecznie tylko 33 na 100 osób nadawało się do dalszego procesowania (sytuacja finansowa, painpoints, zgodność z ICP).

Wnioski z badania są proste. Aby zbudować bazę, której możesz użyć, musisz każdy rekord weryfikować ręcznie albo zastosować bardzo konkretną strategię kwalifikacji. Często oznacza to od 2 do 5 godzin żmudnej pracy nad jednym zestawem danych. Bez tego „nowoczesna sprzedaż” zamienia się w spamowanie przypadkowych ludzi. Zamiast budować relacje, palisz reputację i marnujesz pieniądze na narzędzia, za które i tak płacisz za dużo.

A nie doszliśmy jeszcze do tego, ile osób nigdy nie aktualizuje swoich profili online albo wprowadzająco opisuje, czym się zajmują…

3. Gdzie realizować prompty do baz danych

Skoro wiemy już, że surowe bazy danych są zanieczyszczone jak „chrzczona” benzyna od szwagra, musimy znaleźć sposób na ich efektywną rafinację. Ręczne sprawdzanie każdego rekordu to praca tak żmudna, że nikt nie ma na nią czasu. Nowoczesny handlowiec w praktyce, albo rezygnuje z automatyzacji całkowicie i nie uzyskuje skali, albo ma odpowiedni zestaw promptów i liczy się z marginesem błędu.

Zanim stworzyłem aplikację SOutreach, stosowałem prompty. Dlatego wiem, jak ważny jest wybór odpowiedniego LLM-a:

ChatGPT

Wykonywanie w nim zadań doprowadzało mnie do szewskiej pasji. Nauczyłem się, że w prompcie należy przewidzieć maksymalnie jedno zadanie. Nawet w wersji płatnej, wszelkie wyniki wykonywane są partiami. Są one tym dokładniejsze, im mniejsza partia jest procesowana na raz. Jeśli masz kilkaset wierszy do przerobienia, licz się z tym, że spędzisz cały dzień na odbieraniu wyników. Za to GPT jest świetny do pisania promptów dla innych LLM-ów.

Gemini

Podobnie jak płatna wersja ChatGPT, jest przydatnym narzędziem do obróbki danych, o ile baza nie przekracza 100 do 200 wierszy.

Google AI Studio

Wybawieniem okazało się narzędzie deweloperskie od Google. Znajdziecie w nim dostęp do najnowszych modeli językowych i jest to chyba jedyne tego typu rozwiązanie, które w sposób skuteczny umożliwia przeglądanie danych ze stron internetowych. Zdecydowanie polecam.

4. Jak odczarować bazę danych prostymi promptami?

Jest kilka obowiązkowych, podstawowych informacji, których nie dostarczają ogólnodostępne bazy, a które musisz ustalić, żeby zminimalizować swój margines błędu. Nie łudź się, błędy się zdarzają nawet gdybyś nie automatyzował.

Dowiedz się, czym tak naprawdę zajmują się firmy z którymi chcesz się kontaktować

Poniżej mój sprawdzony prompt (użyj Google AI Studio):

Jako ekspert ds. analizy rynku i business intelligence, Twoim zadaniem jest
przetworzenie dostarczonej listy firm.

Dla każdego wiersza zawierającego nazwę firmy i jej domenę wykonaj
następujące kroki:
1. Przeanalizuj nazwę i domenę, aby zidentyfikować profil działalności
   firmy (korzystając ze swojej wiedzy).
2. Wygeneruj jedno, rozbudowane i konkretne zdanie opisujące główną ofertę
   tej firmy.
3. Zachowaj styl wypowiedzi zgodny z poniższym wzorem:
   Wzór: "EUROVIA Polska S.A. jest generalnym wykonawcą specjalizującym się
   w budowie i utrzymaniu infrastruktury drogowej..."

Zasady krytyczne:
- Nie wolno pomijać żadnego wiersza z listy wejściowej.
- Jeśli nie posiadasz szczegółowych informacji, wywnioskuj branżę i ofertę
  z nazwy i domeny, ale nie zmyślaj nieprawdziwych faktów.
- Wynik przedstaw wyłącznie w formacie CSV (gotowym do Excela).
- Format kolumn: Nazwa Firmy, Domena, Główna Oferta
- Opisy ujęte w cudzysłów, by przecinki nie zepsuły CSV.
- Jeśli plik wejściowy ma 100 wierszy, wynik MUSI mieć 100 wierszy.

Strategia optymalizacji poprawek

  • Zasada nadrzędna: zawsze pozwalaj LLM-owi pomagać Ci tworzyć prompt. Zużyjesz mniej tokenów, prompt będzie bardziej logiczny.
  • Dobierz odpowiedni set danych: dla Google AI Studio max 400 wierszy, 800 też przejdzie, ale już nie przy generowaniu treści. Optimum: 200 wierszy na raz.
  • Stosując poprawki, uwzględniaj je w przyszłej strukturze prompta. Zawsze. Nigdy inaczej.

5. Na co zwracać uwagę w narzędziach oferujących dane

Są ludzie, którzy kupują najnowszy iPhone i narzekają, że taki drogi a do niczego. Są też inni, mega-zadowoleni po zakupie tego samego urządzenia. Co ich różni w 98% przypadków? Wiedza o tym, na co zwracać uwagę podczas użytkowania.

Apollo

Dane, które widzisz, niekoniecznie są aktualne. Dane Apollo tworzą jego Użytkownicy, poprzez dodatek scrapujący. W związku z tym tych danych jest bardzo dużo, ale bez funkcji „data enrichment” nie wiesz, czy widzisz aktualne dane. Dobrą praktyką jest stosowanie data enrichmentu.

Jeśli stosujesz tu prompty, uważaj! Dane często generowane są dynamicznie. Mogą się zmienić, gdy użyjesz ich w kampanii, a ich podgląd przed wysyłką również bywa zwodniczy. Prompty w Apollo podlegają też limitowaniu. Jeśli wykorzystujesz 3-4 dodatkowe kolumny, uważaj, by nie zabrakło Ci limitu na data enrichment.

HubSpot

Nie posiada własnej wbudowanej bazy. Umieszczam tu CRM, bo większość narzędzi do automatyzacji, i słusznie, wrzuca dane do CRM-ów takich jak HubSpot. Co to oznacza? Zmianę ilości i rodzaju przechowywanych danych. Jeśli nie zadbałeś o odpowiednio dobrą jakościowo integrację z dostawcami danych, będzie Ci brakować istotnych informacji. Jeśli zadbałeś o dobrą integrację, ale nie czyściłeś danych na etapie prospectingu, to kiedy przyjdzie do lead nurturingu, dalej powinieneś wykonywać prospecting na danych. Inaczej Twój CRM zostanie śmietnikiem.

Lusha

Postrzegana jako bardziej wyspecjalizowane narzędzie, koncentrujące się przede wszystkim na bezpośrednich danych kontaktowych (numery telefonów, e-maile) o wysokiej skuteczności dotarcia. Brzmi pięknie, ale Lusha skupia się na danych kontaktowych. Jej główną siłą jest wtyczka do przeglądarki, która pozwala błyskawicznie „wyciągnąć” dane z profili LinkedIn. Fajnie, mamy mnóstwo aktualnych danych kontaktowych, a co z danymi o firmach? To właśnie te ostatnie decydują o powodzeniu kampanii. W B2B kontaktujesz się z reprezentantem firmy. Co z tego, że masz e-mail do CEO dużej firmy z branży finansowej, kiedy okazuje się, że Ty sprzedajesz do firm windykacyjnych, a on jest prezesem portalu z kryptowalutami.

Sales Navigator

Wydawałoby się, że skoro 77 na 100 osób może nie pasować do kryteriów zapytania, to nie należy korzystać z tego narzędzia. Nic bardziej mylnego. To właśnie tam znajdują się najbardziej aktualne dane. To na nich opierają się prawie wszystkie inne bazy. Wyjątek stanowią oficjalne rejestry spółek, ale te dane są drogie, trudno dostępne (o ile w ogóle) i sortowane według kryteriów prawnych, nie biznesowych. Korzystaj, ale wiedząc, jaka praca jest przed Tobą do wykonania.

6. Dlaczego Clay Ci nie pomoże?

A co, jeśli ktoś opracował metodę na zautomatyzowane wzbogacanie i odczarowywanie danych? Na rynku pojawił się Clay, supernarzędzie, które przeczesuje wiele różnych baz danych na raz. Pomyślałem, że to niemal cud. Wykupując subskrypcję, miałem już w głowie obraz tego, jak sprawnie poprowadzę kampanie dla klientów SalesMeUp. I co? Nic z tego. Narzędzie jest tak strasznie źle ułożone, że potrzeba osobnego szkolenia, żeby z niego poprawnie korzystać. Paradoksalnie, dowodem na poziom skomplikowania są międzynarodowe zawody w korzystaniu z Clay (Clay Cup). To jak zawody w programowaniu. A jeśli musisz się nauczyć programować, żeby sprzedawać, to czy dalej jesteś Handlowcem, czy Prompt Engineerem?

Konkretne problemy z Clay

Najadłem się wstydu, ponieważ aktualizacja danych o profile LinkedIn wykazała, że ponad 51% danych nie pokrywa się z LinkedIn.

Do tego America First. Dane podmiotów europejskich są mocno ograniczone, w Apollo jest ich znacznie więcej.

Narzędzie jest drogie i błyskawicznie wyczerpuje limity, które są podstawą abonamentu. Jeśli chciałbyś tam cokolwiek zbadać, musisz być bogatym człowiekiem.

Clay ma ambicje być narzędziem od bazy danych, wysyłki i wzbogacania danych naraz. W efekcie masz małą bazę wewnątrz, więc musisz dokupić dane z zewnątrz. Wysyłka i umiejętność dostarczania wiadomości to dwie różne sprawy. Wysyłasz maile? Woodpecker i Apollo mają najwyższą dostarczalność. Wysyłasz na LinkedIn? Musisz kupić osobne narzędzie. Dostawcy cold mailingu są słabi w LinkedIn i na odwrót. Możesz być dobrym specjalistą od wszystkiego, taką złotą rączką, ale nie bez konsekwencji. Wyprzedzi Cię ktoś, kto będzie najlepszym ekspertem w jednej rzeczy.

7. Najważniejsze wnioski z 11 lat outbound sales (firma ponad kontakt)

Prowadzę outbound sales od 2015 roku. Te lata nauczyły mnie kilku rzeczy:

Po pierwsze: firma ponad kontakt

W B2B precyzyjne dane o firmie są ważniejsze niż dane kontaktowe. Te ostatnie są dostępne publicznie. Nie trzeba wiele wysiłku, by je pozyskać. Maile można nawet zgadnąć, jeśli pamiętacie narzędzia typu Hunter.io, i to na masową skalę.

Pozostałe wnioski

  • Narzędzia się zmieniają, zawsze wypróbowuj nowości.
  • Dokładność danych zależy od ludzi, nie od maszyn. To ludzie aktualizują dane o sobie. Nie ma doskonałej bazy.
  • Tworzenie zapytań do baz danych to sztuka. Zapytajcie Administratorów Baz Danych, dopóki jeszcze są, zanim AI ich zastąpi.
  • Dobre dane na wejściu = dobre dane na wyjściu. Aby ten schemat był spełniony, potrzebna jest praca na danych.

8. Q&A

Dlaczego porównanie danych do ropy naftowej jest wciąż aktualne, mimo upływu 20 lat?

Metafora Clive’a Humby’ego z 2006 roku podkreśla, że same dane, podobnie jak surowa ropa, są bezużyteczne, dopóki nie zostaną przetworzone. W sprzedaży oznacza to, że posiadanie listy 1000 kontaktów nie ma wartości, jeśli nie zostaną one poddane „rafinacji” (weryfikacji i analizie). Artykuł dodaje nową warstwę: nieaktualne dane są jak spaliny, zanieczyszczają bazy i niszczą efektywność prospectingu.

Czy płacąc za drogie narzędzia typu Sales Navigator lub Apollo, mam gwarancję czystych danych?

Niestety nie. Badanie opisane w artykule wykazało, że nawet w precyzyjnych filtrach Sales Navigatora aż 77 na 100 wyników nie spełniało co najmniej jednego kryterium (błędna branża, stanowisko lub rozmiar firmy). Narzędzia te są świetnym punktem wyjścia, ale bez ręcznej lub algorytmicznej weryfikacji ryzykujesz spalenie budżetu i wizerunku.

Który model AI najlepiej nadaje się do czyszczenia baz danych?
  • ChatGPT: dobry do tworzenia promptów, ale frustrujący przy dużych zestawach danych ze względu na procesowanie partiami.
  • Gemini: sprawdza się przy małych bazach (do 200 wierszy).
  • Google AI Studio: rekomendowane jako najbardziej efektywne narzędzie „deweloperskie”, które najlepiej radzi sobie z przeglądaniem stron www firm i wyciąganiem z nich konkretnych informacji.
Jak sprawdzić, czym naprawdę zajmuje się firma, nie wchodząc na każdą stronę z osobna?

Najlepiej wykorzystać zaawansowany prompt dla LLM (np. w Google AI Studio), który zmusi model do odwiedzenia domeny i wygenerowania jednego, konkretnego zdania opisu w formacie CSV. Kluczem jest narzucenie AI sztywnych ram (np. „jeśli lista ma 100 wierszy, wynik musi mieć 100 wierszy”), co zapobiega halucynacjom i ułatwia import do Excela.

Dlaczego popularne narzędzie Clay może okazać się rozczarowaniem?

Mimo ogromnych możliwości, Clay jest narzędziem niezwykle skomplikowanym (autor porównuje korzystanie z niego do zawodów programistycznych). Dodatkowo: dane o firmach europejskich są w nim uboższe niż w Apollo, błyskawicznie zużywa drogie limity, wymaga bycia bardziej „Prompt Engineerem” niż handlowcem.

Co jest ważniejsze w B2B: dane kontaktowe czy dane o firmie?

Artykuł stawia jasną tezę: precyzyjne dane o firmie są kluczowe. E-mail czy telefon do CEO można dziś stosunkowo łatwo zdobyć lub zgadnąć. Jednak wysłanie oferty do prezesa firmy kryptowalutowej, myśląc, że zarządza on firmą windykacyjną, to błąd, którego nie naprawi nawet najlepszy copywriting.

Jakie są najważniejsze wnioski z 11 lat doświadczenia w outbound sales?
  • Ludzie, nie maszyny, decydują o jakości danych (bo to ludzie je aktualizują).
  • Dobre dane na wejściu = dobre wyniki na wyjściu (Garbage In, Garbage Out).
  • Narzędzia do wysyłki maili (Woodpecker, Apollo) i narzędzia do LinkedIn to dwa różne światy, rzadko kto jest mistrzem w obu naraz.

Chcesz sprawdzić, co poprawić w swoim prospectingu? Służę pomocą, umów rozmowę.

P.S. Jeśli chcesz potestować nowy sposób prospectingu, zapisz się na Beta Testy SOutreach.

Tagi

jakość danychLLMpromptySales NavigatorApolloClaylead generation

Pogadajmy?

Umów 30-minutową rozmowę z Dobrym.

Bez prezentacji, bez sztucznej presji, szczera analiza Twojego pipeline i tego, gdzie dane intencyjne mogą zrobić różnicę.

Umów 30-min rozmowę zapoznawczą