Někdy je struktura pro XPath u stejných informací odlišná, takže nemusíme vytěžit všechny informace, které vidíme. To lze snadno ověřit, kdybychom se rozhodli ID získat metodou:
//div[contains(@data-bt,’id’)]/@data-bt (poznámka: to samé co udělá OpenRefine v bodě 4)
A pak v GoogleDocs jen vystřihnu ID přes vzoreček:
=RIGHT(LEFT(A1;FIND(“,”;A1)-1);FIND(“,”;A1)-7)
Když dáme sloupce se jménem a URL vedle ID, zjistíme, že ID bychom získali více.
Proto se naskýtá otázka, jestli není lepší zjistit nejdřív ID a pak k nim dohledat jména a URL.