;---- Djvu2txt v.0.1. ---------
; Скрипт распознает  из djvu книг  первые 5 страниц и записывает их в txt файл,
; возможно будет полезен при создании библиографических каталогов и баз данных,
; поиска дубликатов, поиска по названию, автору, ISBN и др.
; Для работы необходимы ABBYY FR, DjvuDecode.
; поместить скрипт в папку с djvu фийлами и запустить.
; **Внимание:
;   **Скорость работы ~2-3 файла/минуту.
;   **Скрипт использует буфер обмена.
;                                               U235.
;___________________________________________________24.01.08__________
;---------------------------------------------------------------------

$decode_path="c:\DjVuLibre-3.5.17-win32\GENCHO\decoder\"; путь к Djvudecoder'у
$FR8_path="C:\Program Files\ABBYY FineReader 8.0 Professional Edition\" ;путь к FR'у

$search = FileFindFirstFile("*.djv*")  

If $search = -1 Then
    MsgBox(0, "Error", "No files/directories matched the search pattern")
    Exit
EndIf

While 1
    $file = FileFindNextFile($search)
    If @error Then ExitLoop
    $txt_file=StringLeft($file, StringInStr($file, ".djv"))
    If FileExists($txt_file&"txt") Then ContinueLoop; если файл txt уже существует, то переходим к следующей книге.
     RunWait($decode_path&"DjvuDecode.exe --output-format=tif --page-range=1-5 """&$file&""" pic.tif","",@SW_HIDE );; OCR  первые 5 стр.
     RunWait($FR8_path&"FineOCR.exe pic.tif /lang Russian English /send Clipboard","",@SW_HIDE )
      $bak = ClipGet()
   
      $file_wr = FileOpen($txt_file&"txt", 1)
      FileWrite($file_wr, $bak)
      FileClose($file_wr)
WEnd

FileClose($search)

Hosted by uCoz