Z diskuse s Luďkem K.:
Pro vypsání jména a URL zadáme do XPath:
//div[@class=”_4_yl”]/div/div/div/div – odstavec s výpisem uživatele
div[@class=”_zs fwb”]/a – jméno
div[@class=”_zs fwb”]/a/@href – url profilu
To se vyexportuje do exelu a nahraje do OpenRefine.
Pro získání ID:
1.klikneš na sloupec s URL a dáš Edit Column -> Add column based on column
2. dáš tam příkaz: value.split(“/”)[2].split(“?”)[0] – to ti oddělí ty jména od zbytku URL
3. pak dáš na tom novém slouci Edit Column -> Add column by fetching URLs based on column
4. zadáš příkaz “http://graph.facebook.com/” + value
5. To ti vypíše všechny hodnoty pod opengraphem do jednoho sloupce
6. dáš na sloupce Edit Column -> Add column based on column URL
7. vložíš funkci value.parseJson()[“id”] – to ti vypíše jen ID