Perguntas sobre o uso da categorização de sites | Website Categorization API | WhoisXML API


FAQs

Como os domínios parked são categorizados?

Todos os domínios estacionados (parked) são atribuídos à categoria "Internet e Telecom".

Taxonomia de conteúdo do IAB

A Website Categorization API realiza a classificação com base na Taxonomia de Conteúdo 2.2 do IAB.

Inicialmente, a taxonomia do IAB usava até quatro níveis para algumas categorias. Entretanto, as categorias de nível inferior são muito restritas, então combinamos os níveis inferiores e reduzimos a taxonomia para 2 níveis para melhorar a precisão e a legibilidade. Todos os IDs originais são mantidos sem alterações, portanto você pode restaurar o caminho completo dos arquivos IAB, se necessário.

  • Tier 1: reflete a categoria de nível superior do conteúdo. Normalmente, essas categorias são muito amplas e apontam apenas para um tópico geral do conteúdo.
  • Tier 2: reflete os níveis 2, 3 e 4 do IAB. Essas categorias são mais restritas e descrevem o conteúdo mais especificamente.

Normalmente, a Website Categorization API retorna várias categorias classificadas pela relevância em ordem decrescente. Sem o parâmetro "minConfidence" a API retorna todas as categorias que tenham uma relevância maior que 0,5. Todos os resultados são classificados por sua relevância em ordem ordem decrescente. A relevância é calculada como o máximo das probabilidades de ambas as camadas. Por exemplo, se a probabilidade da camada 1 for 0,90 e a da camada 2 for 0,99, a relevância geral do conjunto será 0.99. E vice-versa, se a probabilidade da camada 1 for 0,98 e a da camada 2 for 0,8, a probabilidade final será 0,98.

A lista completa das categorias e os guias de implementação estão disponíveis em: