quinta-feira, 5 de dezembro de 2013

Scan Processing Software

Scan Processing Software (by Gizmo)


[Requisitos Mínimos]

- MS Windows XP / MS Windows 7 / MS Windows 8.1 / MS Windows 10
- 120MB disco livre
- Java 1.5/1.6/1.7/1.8 (o software detecta se e qual a versão que têm instalado)


[Instalação]
- Basta apenas descomprimirem o ficheiro RAR para uma directoria e fazer double-click sobre o ficheiro "scanprocessor.bat".

[Limitações]
1) Embora se possam utilizar "long filenames", tanto as directorias, como os nomes dos ficheiros não deverão ter caracteres com acentos, cedilhas ou & (é uma limitação da shell/linguagem Batch do DOS).
2) Ainda não foi testado em MS Windows Vista


Como fã que sou de BD em formato digital, tenho tentado ao logo deste último ano melhorar os processos de restauro. Dada a quantidade crescente de scans para tratar, lembrei-me que provavelmente seria boa ideia tentar automatizar alguns dos procedimento que se tornam repetitivos e morosos, dada a quantidade de páginas muitas vezes envolvidas (imaginem separar e endireitar 300 páginas - uma vez fiz isso a um Hiper Disney e foi coisa para 4 horas)....

Pois é, mas e se depois de corrigirem as cores, brilho, contraste, etc, fosse só carregar num botão para:

1) Separar cada uma das páginas duplas em páginas simples
2) Endireitar cada uma das páginas automaticamente (deskew)
3) Deixar uma margem branca igual em todos os lados à volta da página

??? E agora é possível e não demora 4h!...podem ir tomar um café ou almoçar enquanto as páginas dos scans são separadas, rodadas/endireitadas e margens ajustadas automaticamente!

Para tal criei um scripts (ficheiro scanprocessor.bat) que funciona em ambientes windows (ver nota sobre sistemas compatíveis) e que em conjunto com um pacote de software (incluído no download também) grátis chamado ImageMagik (http://www.imagemagick.org/script/index.php) vos permite simplesmente seleccionar uma diretoria com ficheiros e o script faz o resto!!!

Já agora, o software NÃO DESTRÓI os vossos ficheiros originais. Todo o output é guardado dentro de uma directoria "./out", deixando os vossos ficheiros jpg originais intactos!!

A taxa de fiabilidade anda muito próxima dos 100%. Convém claro seguir algumas sugestões:

1) Devem limpar as margens das páginas e pô-las a branco (RGB: 255, 255, 255)
2) Para os casos em que as páginas duplas estão "pegadas", convém separá-las um pouco para o software conseguir fazer bem a divisão!
3) No caso de terem ficheiros misturados com 1 e com 2 paginas na mesma directoria, basta correrem o "mixedpages.bat"! O software auto-detecta o conteúdo de cada ficheiro e processa-o de acordo! :)
4) Caso fiquem alguns pixeis com outra cor que nao o branco (RGB: 255,255,255), o software baralha-se um pouco e cria ficheiros adicionais com uma linha apenas, outros com rectangulos a branco.Por esta razao, depois de aplicar o script, convém ver todos os ficheiros gerados e apagar os ficheiros que não ficarem bem...

Mesmo assim acho que facilita ainda bastante o trabalho...

Nota:
O que não consegui ainda automatizar foi o processo de correcção das cores, brilho, contraste, etc...isso ainda vão ter sempre de fazer manualmente utilizando o vosso software preferido de tratamento digital de imagens (ex.: Adobe Photoshop, Corel, Paint Shop Pro, etc). Porém a maioria do software, permite a gravação de acções/scripts que permitem aplicar o mesmo tratamento a todos os ficheiros de uma directoria...

(convém ter algums scans à mão para processarem :)



[Change Log]
V1.2.8 - 2016.12.25
- Adicionada opção inicial (pergunta ao utilizador) sobre se as margens brancas a deixar no final são grandes (bom para livros com texto só no centro da pagina) ou pequenas (para Banda Desenhada)

V1.2.6 - 2013.12.04
- O Software e script e' neste momento compativel com MS Windows XP/7/8.1/10
- Adicionada opção inicial (pergunta ao utilizador) sobre se o output é em formato grande (L) ou pequeno (S).
Sugestão:
Opção "S" ou "s", produz paginas com altura configurada no ficheiro de configuração para PEQUENO FORMATO
Opção "L" ou "l", produz paginas com altura configurada no ficheiro de configuracao para GRANDE FORMATO

- Ficheiro de Configuracao renomado para "config.cmd"
- Adicionada opção de drive temporaria 'a configuracao

O ficheiro de configuração contem as seguintes variaveis:

SET OUTPUT_JPEG_COMPRESSION=80
SET OUTPUT_IMAGE_HEIGHT_LARGE=x2600
SET OUTPUT_IMAGE_HEIGHT_SMALL=x1400
SET TEMP_DRIVE=D:\

E' aconselhavel que modifiquem o valor da variavel TEMP_DRIVE para uma drive existente no vosso computador (ex: D:\)

V1.2.5 - 2013.07.14
- Adicionada opção inicial sobre se o output é em formato A5/B5 ou não - e.g.: A4 - e redimensiona de acordo.
 
V1.2.4 - 2013.01.27
- Permite especificação da taxa de compressão para o formato jpeg de saída
- Movidos vários parâmetros para um ficheiro de configuração ("config.ini").

V1.2.3 - 2013.01.26
- As imagens finais já processadas são redimensionadas automaticamente para formato jpg com uma altura de 2400 pixeis (a largura é proporcional e calculada automaticamente para não deformar a imagem) - resulta tipicamente num ficheiro jpeg com 1.5MB-1.7MB de tamanho.

- Removidos scripts "dualpages.bat" e "singlepages.bat", pois o script principal ("mixedpages.bat") assume o tipo de páginas através das dimensões: Scan em página dupla (largura > altura) ; Scan em página simples (altura > largura)


V1.2.2 - 2012.07.27
Adicionado cálculo do tempo decorrido desde o início do processamento.

V1.2.1 - 2012.06.15
Melhoria na qualidade final. Todos os sub-processamentos das imagens são agora feitos em formato PNG (formato lossless) e gravados em jpg apenas no final.

V1.2.0 - 2012.06.12
Adicionado novo script (pdf2jpeg.bat) para conversão de multiplos ficheiros PDF em formato JPEG (@300dpis) em modo batch. Adicionado pacote GhostScript V9.05.

V1.1.0 - 2012.06.03
Adicionada nova opção que processa a directoria e auto-detecta (para cada um dos ficheiros jpg), se é uma página simples ou dupla, processando-a de acordo.

V1.0.0 - 2012.05.29
Primeira versão do software. Existe uma opção para processar um conjunto de scans em página dupla e outro para processar um conjunto em páginas simples (neste caso apenas endireita as imagens e acerta as margens).



Espero que este software vos permita poupar algum tempo no restauro de scans! Para sugestões ou dúvidas, sugiro que visitem o fórum Tralhas Várias:


Divirtam-se e se gostarem desde pacote, porque não fazer um donativo* para incentivar o autor (isto é eu) a melhorar e a implementar novas funcionalidades?

* Podem dar uma ajuda através do formulário Paypal do blog em http://tralhasvarias.blogspot.com

Gd abraço e fico à espera do vosso feedback no fórum!

Gizmo

16 Comentários :

  1. Mas que genial isso! Vou tentar assim que tiver um tempo, obrigado Gizmo!

    ResponderEliminar
    Respostas
    1. Viva Jorge!
      Obrigado, se tiveres dúvidas ou precisares de ajuda, por favor usa o fórum...assim ajuda os outros users que queiram usar o programa...:)

      Gd abco,
      Giz

      Eliminar
  2. Funciona muito bem, Jorge! E poupa muito tempo! Experimenta! E não te esqueças de felicitar o Gizmo por esta grande ajuda... ;)

    ResponderEliminar
  3. Isto vai ser muito bom.
    Com a falta de tempo que tenho para tratar as imagens e scannar vai dar muito jeito. Vou experimentar.
    Um abraço.

    ResponderEliminar
    Respostas
    1. bom dia!
      Para as revistas pequenas quando se scanna 2 páginas de cada vez, dá um jeitão. Mas atenção que a separar e endireitar deve ser feito depois de corrigir as cores/brilho/contraste, pois a cor do papel necessita de estar branca mesmo...senão o software não consegue separar as imagens...:)

      Abcos,
      Gizmo

      Eliminar
  4. valeu Gizmo é tudo que estou precisando vou experimentar! um grande abraço!!

    ResponderEliminar
  5. Boas!
    Experimenta e depois diz-me se funciona....
    Espero que te seja útil.
    Abços,
    Gizmo

    ResponderEliminar
  6. Boas.

    Software ou scripts que facilitem o trabalho são sempre bem vindos, mas por vezes não são parceiros para efectuar um trabalho de qualidade. Quer o facto de ser necessário que as margens sejam Branco RGB 255-255-255, quer o facto de ser regravado um ficheiro JPG, utilizando novamente compressão Lossy (com perdas) contribui para páginas demasiado saturadas, com excesso de brilho e pouco contraste e também para uma qualidade final um pouco duvidosa, mais ainda quando ampliamos os JPGs!

    ResponderEliminar
    Respostas
    1. Bom dia outra vez Guru!
      Infelizmente não é humanamente possível tratar o volume de scans que chegam ao blog de modo totalmente manual, pelo que sempre que possível faço processamento em batch das páginas, definindo "settings" de correcção de brilho/contraste e cores com numa amostragem de algumas páginas da revista.

      Quanto à perca de qualidade, é verdade, mas não há muito mais a fazer, em formato png, as imagens seriam bastante maiores e sem grandes ganhos adicionais.

      Sempre que possível tento fazer com os scans me cheguem às mãos com uma boa resolução (250/300dpis) de modo a minimizar a perca por estar em formato jpeg.

      Mas as coisas são assim mesmo...:)

      Gd abco e obrigado uma vez mais pelos comentários,
      Gizmo

      Eliminar
  7. Amigo, parabéns pelo indicação do programa e pelos seus scripts fantásticos. Não tenho nem palavras para descrever como eu gostei. Muito obrigado. Valeu demais!

    ResponderEliminar
    Respostas
    1. Ola hjbraz!
      Nao tem nada que agrqdecer...
      Fiz os scripts para mim, mas decidi partilhar, pois de certeza que nao era o unico com este problema....;)

      Se precisar de alguma ajuda..estou a disposicao!
      Obrigao pela visita,
      Gizmo

      Eliminar
  8. Não entendi patavinas. Extrai a pasta e cliquei no arquivo .bat, tal como você falou... Aparece a mensagem "No directory specified. Please choose a directory!". Afinal, onde e como seleciono a pasta com os arquivos a serem editados?

    ResponderEliminar
    Respostas
    1. vc clicou no arquivo mixedpages.bat?

      Deve ter aberto uma janelinha prêta onde vc pode ver o progresso do processamento dos ficheiros e uma segunda janela vai abrir também a perguntar qual a directoria onde vc tem os ficheiros a processar (ficheiros em formato jpg).

      Também tem de ter o Java instalado...

      Podes enviar-me uma captura do ecran para o meua email pleaz para ver melhor o teu problema? (gramps.gramps@gmail.com)..

      Ate já e obrigado por experimentar o proggie! :)

      Giz

      Eliminar
  9. Este comentário foi removido pelo autor.

    ResponderEliminar

Olá amigo! Se gostaste deste POST, partilha e/ou deixa um pequeno comentário...não custa nada :) Também podes ajudar o Tralhas com os teus scans! Vê como nos podes ajudar >Aqui<.
Obrigado por nos visitares
Gizmo