Docs
搜索文档...⌘K

抓取的页面

API + MCP
GET/v3/site-explorer/crawled-pages

查询参数

selectstring必填

以逗号分隔的返回字段列表。可用字段:urlhttp_codelast_crawledfirst_seenlast_attempturl_ratingtitle

order_bystring

用于对结果排序的字段,可选指定排序方向。格式:field_name:ascfield_name:desc(默认 desc)。可用字段:urlhttp_codelast_crawledfirst_seenlast_attempturl_ratingtitle

wherestring

支持的字段:

  • url
  • http_code
  • last_crawled
  • first_seen
  • last_attempt
  • url_rating
  • title

Filter 是一个表示布尔表达式的 JSON 字符串,应遵循以下结构:

<bool_filter> ::= { "and" : <bool_filter>+ }
              |   { "or" : <bool_filter>+ }
              |   { "not" : <bool_filter> }
              |   <expr>

<expr> ::= {
             "field" : <dimension|metric>,
             ? "is": <condition>,
           }

<condition> ::= [ "eq", <value> ]
            |   [ "neq", <value> ]
            |   [ "gt", <value> ]
            |   [ "gte", <value> ]
            |   [ "lt", <value> ]
            |   [ "lte", <value> ]
            |   [ "substring", <value> ]
            |   [ "isubstring", <value> ]
            |   [ "phrase_match", <value> ]
            |   [ "iphrase_match", <value> ]
            |   [ "prefix", <value> ]
            |   [ "suffix", <value> ]
limitinteger

要返回的结果数量。

默认:1000
protocolstring

目标的协议。

允许的值:bothhttphttps
默认:both
modestring

基于你输入的目标所确定的搜索范围。

允许的值:exactprefixdomainsubdomains
默认:subdomains
targetstring必填

搜索目标:域名或 URL。

outputstring

输出格式。

允许的值:jsoncsvxmlphp

响应

pagesarray<object>
first_seenstring

Ahrefs 首次发现该 URL 的时间戳。

http_codeinteger

上次抓取该页面时返回的 HTTP 状态码。

last_attemptstring

上次抓取尝试的时间戳。

last_crawledstring

上次成功抓取的时间戳。

titlestring or null

页面的 meta 标题。

urlstring

已抓取页面的 URL。

url_ratingnumber

页面在上次抓取时的 URL 评分,采用 100 分制。