最佳答案
我找不到任何好的基于 Java 的 web 抓取 API。我需要抓取的站点也没有提供任何 API; 我想使用一些 pageID
迭代所有的网页,并在其 DOM 树中提取 HTML 标题/其他内容。
除了网页抓取还有其他方法吗?