Osvědčené postupy SEO podporují shodu s ADA pro digitální přístupnost

Web, na kterém pracuji, obsahuje několik stovek souborů PDF. Nemyslím si, že jsem někdy viděl, že by se někdo z nich vrátil při hledání, ale jsou tam odkazy přímo z webu. Jsou také plná klíčových slov, protože se jedná o produktové dokumenty.

Je třeba udělat něco zvláštního, aby Google nebo jiné vyhledávače mohly procházet?

Existují nějaká tvrdá a rychlá pravidla pro vytváření souborů PDF, aby se Googlu líbily víc? Například bych je měl spustit přes ghostscript, abych vyčistil rozbité tagy PDF, které Adobe vytváří během generování?

  • Přidejte si do svého XML souboru Sitemap a ujistěte se, že o nich vědí?

Google určitě indexuje soubory PDF a přidáním můžete vyhledávat pouze soubory PDF filetype:pdf na váš vyhledávací dotaz (příklad).

Řekl bych, že hlavní věci, které je třeba udělat pro optimalizaci PDF, aby byl snadno indexován, by byly:

  • Dejte mu smysluplný název souboru
  • Vyplňte všechny vlastnosti metadat dokumentu (název, autor, klíčová slova atd.)
  • Ujistěte se, že váš PDF obsahuje skutečný text, nikoli naskenované obrázky
  • Zajistěte dobrý obsah se správným použitím nadpisů, stejně jako u dokumentu HTML

Další tipy najdete v článku Optimalizace dokumentů PDF a jedenáct tipů pro optimalizaci souborů PDF pro vyhledávače

  • odkaz labs.justsearching.co.uk/optimizing-pdf-documents-621.html již nefunguje
  • @Christofian Díky - aktualizoval jsem odkaz. Nechám na čtenáři, aby ocenil ironii společnosti SEO přejmenovávající jejich odkazy bez přesměrování 301!
  • @DanDiplo, pokud jde o SEO souborů PDF, doporučuji přidat do obsahu odkaz, pokud je to možné.

Nejsem si jistý jinými vyhledávači, ale pokud jde o Google, hlavním pravidlem by bylo nevyloučit je pomocí robots.txt

Toto bylo jejich první oznámení o podpoře vyhledávání PDF.

Stejně jako to, že vaše webové stránky vyhoví vašemu SEO, nemohou ublížit vašemu SEO, stejně tak ani vaše PDF nemůže ublížit. Vestavěná kontrola přístupnosti Adobe zdaleka není dokonalá, ale alespoň oprava těchto oblastí vám pomůže.

Pravděpodobně trávím 5 minut na každých 4 nebo 5, většinou textových PDF, které vložíme online. Čas roste rovnoměrně v závislosti na počtu stránek a jejich složitosti.

Za předpokladu, že máte úpravy v aplikaci Adobe Acrobat Pro:

  • Spustit úplnou kontrolu přístupnosti. (Rychlá kontrola je pro mě docela zbytečná)
  • Aktualizujte meta informace ve vlastnostech dokumentu (klíčová slova, předmět, jazyk atd.)
  • Zkontrolujte, zda jsou přidány značky
  • Ujistěte se, že je text označen jako text, obrázky jako obrázky, pozadí jako pozadí
  • Označte zbytečné chmýří (jako dekorace nebo design) jako pozadí
  • Přidejte do obrázků dobrý alternativní text
  • Ujistěte se, že v pořadí čtení je text správně uspořádán
  • Na panelu nástrojů obsahu zkontrolujte, zda text není duplikován nebo překládán nesprávně
  • Na naskenovaných stránkách použijte skener OCR

Pro pokročilejší úpravy, jako jsou tabulky a opravdu divné chyby Adobe, používáme plugin s názvem CommonLook. CommonLook tuto práci zvládne, ale nenávidím ji téměř stejně jako nenávidím nástroje Adobe.

Seznamte se s nástrojem Opravit pořadí čtení, panel nástrojů Značky, panel nástrojů pořadí čtení a panel nástrojů Obsah. Moje práce vyžaduje před vydáním na webu plně kompatibilní dokumenty, ale někdo by mohl těžit z některých jednoduchých značek a vlastností dokumentu.

  • Náš web obsahoval více než 5 000 souborů PDF, které jsme museli vrátit zpět a dosáhnout úplné shody 508. Naučit se nějakou dobu trvalo, doporučil Adobe, aby trenérovi nepomohlo, ale jakmile se to naučíte, můžete je opravdu zazipovat.

Pracoval pro vás: Charles Robertson | Chcete nás kontaktovat?

užitečné informace