Как загрузить контент из URL с помощью Jsoup и Java
У меня есть этот код, который извлекает все ссылки из URL с помощью JSOUP. Мне нужно поместить весь контент из этих ссылок в txt. Как я могу сделать это с помощью Java? +сильный текст
public class Main {
public static void main(String[] args) {
Document doc, content;
try {
doc = Jsoup.connect("http://fmi.unibuc.ro/ro").get();
System.out.print(doc);
Elements links = doc.select("a[href]");
for (Element link : links) {
System.out.println("nlink : " + link.attr("href"));
}
} catch (IOException e) {
e.printStackTrace();
}
}
}
2 ответов:
Вам нужно извлечь URL из ссылок следующим образом:
for (Element link : links) System.out.println(Jsoup.connect(link.baseUri()).get());Он будет печатать содержимое всех ссылок на консоли.
В качестве альтернативы вы можете сделать следующее:
for (Element link : links) { System.out.println(Jsoup.connect(link.absUrl("href")).get()); }
Comments