Tipos de ficheiros
O Document AI suporta os seguintes tipos de imagens.
Para obter informações sobre o tamanho dos ficheiros e os limites de páginas, consulte a página Quotas e limites.
Nome | Extensões de ficheiros | Tipo MIME |
---|---|---|
Portable Document Format (PDF) | .pdf |
application/pdf |
Graphics Interchange Format (GIF) | .gif |
image/gif |
Tag Image File Format (TIFF) | .tiff , .tif |
image/tiff |
Joint Photographic Experts Group (JPEG) | .jpg , .jpeg |
image/jpeg |
Portable Network Graphics (PNG) | .png |
image/png |
Mapa de bits (BMP) | .bmp |
image/bmp |
WebP | .webp |
image/webp |
Linguagem de Marcação de Hipertexto (HTML) | .html |
text/html |
Microsoft Word Office Open XML (OOXML) (pré-visualização) | .docx |
application/vnd.openxmlformats-officedocument.wordprocessingml.document |
Microsoft PowerPoint OOXML (pré-visualização) | .pptx |
application/vnd.openxmlformats-officedocument.presentationml.presentation |
Microsoft Excel OOXML (pré-visualização) | .xlsx |
application/vnd.openxmlformats-officedocument.spreadsheetml.sheet |
Tenha em atenção que alguns destes formatos de imagem são "com perdas" (por exemplo, JPEG). A redução dos tamanhos dos ficheiros para formatos com perdas pode resultar numa degradação da qualidade da imagem e da precisão dos resultados da IA Documentos.
Resolução da digitalização de documentos
Para obter os resultados de OCR mais precisos do Document AI, as digitalizações de documentos devem ter, no mínimo, 200 ppp (pontos por polegada). Geralmente, 300 ppp e superior produzem os melhores resultados. A precisão da OCR depende da resolução e do tamanho mínimo do tipo de letra, juntamente com outros fatores, como a qualidade do documento (e, se for escrita manual, da escrita manual), pelo que é recomendável fazer testes. A funcionalidade de análise da qualidade da imagem pode ajudar a avaliar problemas de resolução.
NOTA: são necessários 2000 x 3000 píxeis para a imagem do verso da carta de condução dos EUA, de modo a ler o código de barras.