Как загрузить контент из URL с помощью Jsoup и Java



У меня есть этот код, который извлекает все ссылки из URL с помощью JSOUP. Мне нужно поместить весь контент из этих ссылок в txt. Как я могу сделать это с помощью Java? +сильный текст



public class Main {
public static void main(String[] args) {
Document doc, content;
try {


doc = Jsoup.connect("http://fmi.unibuc.ro/ro").get();
System.out.print(doc);

Elements links = doc.select("a[href]");
for (Element link : links) {

System.out.println("nlink : " + link.attr("href"));
}

} catch (IOException e) {
e.printStackTrace();
}

}

}
770   2  

2 ответов:

Вам нужно извлечь URL из ссылок следующим образом:

for (Element link : links) 
    System.out.println(Jsoup.connect(link.baseUri()).get());

Он будет печатать содержимое всех ссылок на консоли.

В качестве альтернативы вы можете сделать следующее:

for (Element link : links) {
    System.out.println(Jsoup.connect(link.absUrl("href")).get());
}

Comments

    Ничего не найдено.