Formato de saída: API v2 | Documentação v2 | Website Categorization API | API WhoisXML

Formato de saída: API v2

{
    "categories": [
        {
            "tier1": {
                "confidence": 0.6479678859489982,
                "id": "IAB-379",
                "name": "News and Politics"
            },
            "tier2": {
                "confidence": 0.9644738361093003,
                "id": "IAB-390",
                "name": "Weather"
            }
        }
    ],
    "domainName": "cnn.com",
    "websiteResponded": true
}

Parâmetros de saída

domainName
URL do site
websiteResponded

Determina se o site estava ativo durante o rastreamento. O site é considerado ativo se:

  • Responde dentro de 20 segundos de tempo limite (tempo limite de conexão - 10s, tempo limite de leitura da resposta - 10s)
  • Responde com  200 HTTP code
  • Envia o cabeçalho Content-Type que é text/html ou text/plain
categories

A lista de possíveis categorias do site. Obtenha todas as categorias possíveis aqui.

categories[0].tier1

O objeto de categoria de nível superior.

A Website Categorization API realiza a classificação com base na Taxonomia de Conteúdo 2.2 do IAB.

Inicialmente, a taxonomia do IAB usava até quatro níveis para algumas categorias. Entretanto, as categorias de nível inferior são muito restritas, então combinamos os níveis inferiores e reduzimos a taxonomia para 2 níveis para melhorar a precisão e a legibilidade. Todos os IDs originais são mantidos sem alterações, portanto você pode restaurar o caminho completo dos arquivos IAB, se necessário.

  • Tier 1: reflete a categoria de nível superior do conteúdo. Normalmente, essas categorias são muito amplas e apontam apenas para um tópico geral do conteúdo.
  • Tier 2: reflete os níveis 2, 3 e 4 do IAB. Essas categorias são mais restritas e descrevem o conteúdo mais especificamente.

Normalmente, a Website Categorization API retorna várias categorias classificadas pela relevância em ordem decrescente. Sem o parâmetro "minConfidence" a API retorna todas as categorias que tenham uma relevância maior que 0,5. Todos os resultados são classificados por sua relevância em ordem ordem decrescente. A relevância é calculada como o máximo das probabilidades de ambas as camadas. Por exemplo, se a probabilidade da camada 1 for 0,90 e a da camada 2 for 0,99, a relevância geral do conjunto será 0.99. E vice-versa, se a probabilidade da camada 1 for 0,98 e a da camada 2 for 0,8, a probabilidade final será 0,98.

categories[0].tier2
O objeto de categoria de segundo nível (se presente).
categories[0].tier1.id
O identificador exclusivo da categoria.
categorias[0].tier1.confidence
A probabilidade de como a categoria pode ser relevante para o site.
categories[0].tier1.name
O nome legível da categoria.