{"id":35968,"date":"2007-05-23T10:24:57","date_gmt":"2007-05-23T08:24:57","guid":{"rendered":"https:\/\/mancomun.gal\/ocropus-ocr-para-gnulinux\/"},"modified":"2007-05-23T10:24:57","modified_gmt":"2007-05-23T08:24:57","slug":"ocropus-ocr-para-gnulinux","status":"publish","type":"post","link":"https:\/\/mancomun.gal\/es\/ocropus-ocr-para-gnulinux\/","title":{"rendered":"OCRopus, OCR para GNU\/Linux"},"content":{"rendered":"<p align=\"justify\"><a href=\"http:\/\/code.google.com\/p\/ocropus\/\" target=\"_blank\" title=\"http:\/\/code.google.com\/p\/ocropus\/\" rel=\"noopener\">OCRopus<\/a>  \u00e9 un sistema de an\u00e1lise de documentos e reco\u00f1ecemento \u00f3ptico de caracteres. O motor de OCRopus est\u00e1 desenvolvido e esponsorizado en Google Code. Inicialmente estase a desenvolver para plataformas GNU\/Linux x86 e x86\/64 baixo Ubuntu 6.10. O c\u00f3digo poder\u00eda ser facilmente portado a outras distribuci\u00f3ns GNU\/Linux ou outras plataformas.<\/p>\n<p align=\"justify\">Empregando OCRopus p\u00f3dese reco\u00f1ecer o contido dunha imaxe e retornar unha sa\u00edda en HTML, en concreto ao <a href=\"http:\/\/microformats.org\/wiki\/Main_Page\" target=\"_blank\" title=\"http:\/\/microformats.org\/wiki\/Main_Page\" rel=\"noopener\">microformato<\/a>  hOCR.<\/p>\n<p align=\"justify\">Un exemplo para converter o texto dunha imaxen PNG a HTML dende a li\u00f1a de comandos:<\/p>\n<pre style=\"border-style: none none none solid; border-color: -moz-use-text-color -moz-use-text-color -moz-use-text-color #cccccc; border-width: medium medium medium 2.5pt; padding: 0cm 0cm 0cm 0.05cm; margin-bottom: 0.5cm\">.\/ocropus ocr test-page.png > output.html<\/pre>\n<p align=\"justify\"> Dende o wiki est\u00e1n detalladas todas as <a href=\"http:\/\/code.google.com\/p\/ocropus\/wiki\/CommandLine\" target=\"_blank\" title=\"http:\/\/code.google.com\/p\/ocropus\/wiki\/CommandLine\" rel=\"noopener\">opci\u00f3ns por li\u00f1a de comando<\/a>.<\/p>\n<p><\/p>\n<p align=\"justify\">hOCR \u00e9 un formato para a representaci\u00f3n da sa\u00edda OCR, inclu\u00edndo informaci\u00f3n da maquetaci\u00f3n,  caracteres confidenciais, caixas ligadas e informaci\u00f3n do estilo. Esta informaci\u00f3n \u00e9 invisible sendo gardada en formato HTML est\u00e1ndar. Ao estar gardada en formato HTML est\u00e1ndar p\u00f3dese traballar de forma autom\u00e1tica por calquera linguaxe de programaci\u00f3n. Para traballar co formato hOCR est\u00e1n dispo\u00f1ibles as hocr-tools que son un conxunto de ferramentas para manipular e avaliar o formato hOCR e representar os resultados do formato multilingua OCR e inclu\u00edlos dentro de c\u00f3digo HTML.<\/p>\n<div align=\"justify\"> <\/div>\n<p align=\"justify\">P\u00f3dense seguir os <a href=\"http:\/\/code.google.com\/p\/ocropus\/wiki\/GettingStarted\" target=\"_blank\" title=\"http:\/\/code.google.com\/p\/ocropus\/wiki\/GettingStarted\" rel=\"noopener\">pasos de instalaci\u00f3n<\/a>  de OCRopus dende o wiki do proxecto.<\/p>\n<div align=\"justify\">   <\/div>\n<p align=\"justify\">Para m\u00e1is informaci\u00f3n do formato hOCR consultar o seguinte <a href=\"http:\/\/pubs.iupr.org\/DATA\/2007-IUPR-09Feb_1608.pdf\" target=\"_blank\" title=\"http:\/\/pubs.iupr.org\/DATA\/2007-IUPR-09Feb_1608.pdf\" rel=\"noopener\">PDF<\/a>.<\/p>\n","protected":false},"excerpt":{"rendered":"<p align=\"justify\"><a href=\"http:\/\/code.google.com\/p\/ocropus\/\" target=\"_blank\" title=\"http:\/\/code.google.com\/p\/ocropus\/\" rel=\"noopener\">OCRopus<\/a>  \u00e9 un sistema de an\u00e1lise de documentos e reco\u00f1ecemento \u00f3ptico de caracteres. O motor de OCRopus est\u00e1 desenvolvido e esponsorizado en Google Code. Inicialmente estase a desenvolver para plataformas GNU\/Linux x86 e x86\/64 baixo Ubuntu 6.10. O c\u00f3digo poder\u00eda ser facilmente portado a outras distribuci\u00f3ns GNU\/Linux ou outras plataformas.<\/p>\n<p align=\"justify\">Empregando OCRopus p\u00f3dese reco\u00f1ecer o contido dunha imaxe e retornar unha sa\u00edda en HTML, en concreto ao <a href=\"http:\/\/microformats.org\/wiki\/Main_Page\" target=\"_blank\" title=\"http:\/\/microformats.org\/wiki\/Main_Page\" rel=\"noopener\">microformato<\/a>  hOCR.<\/p>\n<p align=\"justify\">Un exemplo para converter o texto dunha imaxen PNG a HTML dende a li\u00f1a de comandos:<\/p>\n<pre style=\"border-style: none none none solid; border-color: -moz-use-text-color -moz-use-text-color -moz-use-text-color #cccccc; border-width: medium medium medium 2.5pt; padding: 0cm 0cm 0cm 0.05cm; margin-bottom: 0.5cm\">.\/ocropus ocr test-page.png > output.html<\/pre>\n<p align=\"justify\"> Dende o wiki est\u00e1n detalladas todas as <a href=\"http:\/\/code.google.com\/p\/ocropus\/wiki\/CommandLine\" target=\"_blank\" title=\"http:\/\/code.google.com\/p\/ocropus\/wiki\/CommandLine\" rel=\"noopener\">opci\u00f3ns por li\u00f1a de comando<\/a>.<\/p>\n","protected":false},"author":5,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[],"tags":[],"class_list":["post-35968","post","type-post","status-publish","format-standard","hentry"],"acf":[],"_links":{"self":[{"href":"https:\/\/mancomun.gal\/es\/wp-json\/wp\/v2\/posts\/35968","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/mancomun.gal\/es\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/mancomun.gal\/es\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/mancomun.gal\/es\/wp-json\/wp\/v2\/users\/5"}],"replies":[{"embeddable":true,"href":"https:\/\/mancomun.gal\/es\/wp-json\/wp\/v2\/comments?post=35968"}],"version-history":[{"count":0,"href":"https:\/\/mancomun.gal\/es\/wp-json\/wp\/v2\/posts\/35968\/revisions"}],"wp:attachment":[{"href":"https:\/\/mancomun.gal\/es\/wp-json\/wp\/v2\/media?parent=35968"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/mancomun.gal\/es\/wp-json\/wp\/v2\/categories?post=35968"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/mancomun.gal\/es\/wp-json\/wp\/v2\/tags?post=35968"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}