Djvu2txt.au3

;---- Djvu2txt v.0.1. ---------
; Скрипт распознает из djvu книг первые 5 страниц и записывает их в txt файл,
; возможно будет полезен при создании библиографических каталогов и баз данных,
; поиска дубликатов, поиска по названию, автору, ISBN и др.
; Для работы необходимы ABBYY FR, DjvuDecode.
; поместить скрипт в папку с djvu фийлами и запустить.
; **Внимание:
;   **Скорость работы ~2-3 файла/минуту.
;   **Скрипт использует буфер обмена.
;                                               U235.
;___________________________________________________24.01.08__________
;---------------------------------------------------------------------

$decode_path="c:\DjVuLibre-3.5.17-win32\GENCHO\decoder\"; путь к Djvudecoder'у
$FR8_path="C:\Program Files\ABBYY FineReader 8.0 Professional Edition\" ;путь к FR'у

$search = FileFindFirstFile("*.djv*")

If $search = -1 Then
    MsgBox(0, "Error", "No files/directories matched the search pattern")
    Exit
EndIf

While 1
    $file = FileFindNextFile($search)
    If @error Then ExitLoop
$txt_file=StringLeft($file, StringInStr($file, ".djv"))
If FileExists($txt_file&"txt") Then ContinueLoop; если файл txt уже существует, то переходим к следующей книге.
     RunWait($decode_path&"DjvuDecode.exe --output-format=tif --page-range=1-5 """&$file&""" pic.tif","",@SW_HIDE );; OCR первые 5 стр.
RunWait($FR8_path&"FineOCR.exe pic.tif /lang Russian English /send Clipboard","",@SW_HIDE )
  $bak = ClipGet()

  $file_wr = FileOpen($txt_file&"txt", 1)
  FileWrite($file_wr, $bak)
  FileClose($file_wr)
WEnd

FileClose($search)