抓取的页面
API + MCPGET/v3/site-explorer/crawled-pages
查询参数
selectstring必填
以逗号分隔的返回字段列表。可用字段:url、http_code、last_crawled、first_seen、last_attempt、url_rating、title。
order_bystring
用于对结果排序的字段,可选指定排序方向。格式:field_name:asc 或 field_name:desc(默认 desc)。可用字段:url、http_code、last_crawled、first_seen、last_attempt、url_rating、title。
wherestring
支持的字段:
- url
- http_code
- last_crawled
- first_seen
- last_attempt
- url_rating
- title
Filter 是一个表示布尔表达式的 JSON 字符串,应遵循以下结构:
<bool_filter> ::= { "and" : <bool_filter>+ }
| { "or" : <bool_filter>+ }
| { "not" : <bool_filter> }
| <expr>
<expr> ::= {
"field" : <dimension|metric>,
? "is": <condition>,
}
<condition> ::= [ "eq", <value> ]
| [ "neq", <value> ]
| [ "gt", <value> ]
| [ "gte", <value> ]
| [ "lt", <value> ]
| [ "lte", <value> ]
| [ "substring", <value> ]
| [ "isubstring", <value> ]
| [ "phrase_match", <value> ]
| [ "iphrase_match", <value> ]
| [ "prefix", <value> ]
| [ "suffix", <value> ]
limitinteger
要返回的结果数量。
默认:1000
protocolstring
目标的协议。
允许的值:bothhttphttps
默认:both
modestring
基于你输入的目标所确定的搜索范围。
允许的值:exactprefixdomainsubdomains
默认:subdomains
targetstring必填
搜索目标:域名或 URL。
outputstring
输出格式。
允许的值:jsoncsvxmlphp
响应
pagesarray<object>
first_seenstring
Ahrefs 首次发现该 URL 的时间戳。
http_codeinteger
上次抓取该页面时返回的 HTTP 状态码。
last_attemptstring
上次抓取尝试的时间戳。
last_crawledstring
上次成功抓取的时间戳。
titlestring or null
页面的 meta 标题。
urlstring
已抓取页面的 URL。
url_ratingnumber
页面在上次抓取时的 URL 评分,采用 100 分制。
errorstring
errorstring
errorstring
errorstring
errorstring