Season 1 Episode 69
Zanim świat oszalał na punkcie modeli językowych, praca z danymi była domeną dla cierpliwych. Vadim Makarenko, który tworzył pierwszy w Polsce redakcyjny dział danych, zabiera nas do czasów, gdy wyciągnięcie informacji z pliku PDF było pracochłonnym zadaniem, a analiza ogromnych zbiorów przypominała pracę detektywistyczną.
Kulminacją tego podejścia było śledztwo Panama Papers – gigantyczny, nieustrukturyzowany zbiór danych, w którym trzeba było znaleźć polskie wątki. Jak sam wspomina: "To jest bardzo trafna metafora, że to jest po prostu albo hałda węgla, albo ogromna kupa siana i po prostu z tego siana my musimy coś wyciągnąć. Nieustająco w nim grzebiemy, zanim się czegoś złapiemy".
Ta opowieść doskonale pokazuje, jak bardzo zmieniły się narzędzia, ale też jak fundamentalne pozostały ciekawość i umiejętność nieszablonowego myślenia.
Posłuchajcie sami!
Published on 3 weeks, 3 days ago
If you like Podbriefly.com, please consider donating to support the ongoing development.
Donate