这是一个对HTML进行分析的快速实时的解析器,可以通过DOM或CSS选择器来查找,提取数据。
下面例子展示此解析器的用法,例子还用到了上方提到的Java采集引擎。
package cfw.test;
import cfw.html.TagSearchRange;
imp...
二十画生
7年前 (2018-04-10) 1279℃ 0评论
3喜欢
此采集引擎利用HttpClient实现,支持http与https,支持自定义UserAgent,自定义Header,支持Proxy,支持HTML抓取,也支持图片抓取。此框架分三个部分:WebClient,Webquest以及ResponseResult,其中WebClient为引...
二十画生
7年前 (2018-04-01) 1217℃ 0评论
3喜欢
记得在hosts文件中加
0.0.0.0 account.jetbrains.com
EB101IWSWD-eyJsaWNlbnNlSWQiOiJFQjEwMUlXU1dEIiwibGljZW5zZWVOYW1lIjoibGFuIHl1IiwiYXNzaWduZWVOYW1lI...
二十画生
7年前 (2018-03-26) 1083℃ 0评论
4喜欢