Podcast Episode Details

Back to Podcast Episodes

Data jsou ropou online světa. A Češi je umí skvěle těžit, tedy i vydělávat


Episode 21903


Článek Ondřeje Katze. Bez „web scrapingu“ by nebyl Google ani velké jazykové modely typu ChatGPT. Všichni web scraping používají ke stahování dat, na kterých trénují AI modely. K radosti zakladatelů Apify, české platformy pro automatizaci webu.

V digitálním světě mají data obrovskou cenu. Chce je každý, získat je ale není snadné. A právě proto existuje web scraping – technologie, která umožňuje automatizovaně stahovat a zpracovávat veřejně dostupné informace z internetu. Funguje to tak, že softwarový robot navštíví web, stejně jako běžný uživatel, přečte jeho obsah a vytáhne z něj potřebná data. Na konci leží strukturovaný dataset, který pak firmy používají pro monitoring trhu, analýzy konkurence nebo třeba automatizaci interních procesů.

Celý článek čtěte zde

  • Další články, ale také podcasty, komentáře a videa najdete na zpravodajském serveru Seznam Zprávy
  • Své názory, návrhy, otázky, stížnosti nebo pochvaly nám můžete posílat na adresu audio@sz.cz.
  • Sledujte @SeznamZpravy na sociálních sítích: Twitter // Facebook // Instagram.
  • Seznam Zprávy jsou zdrojem původních informací, nezávislé investigace, originální publicistiky.


Published on 2 weeks, 5 days ago






If you like Podbriefly.com, please consider donating to support the ongoing development.

Donate