;---- Djvu2txt v.0.1. ---------
; Скрипт распознает из djvu книг первые 5 страниц и записывает их в txt файл,
; возможно будет полезен при создании библиографических каталогов и баз данных,
; поиска дубликатов, поиска по названию, автору, ISBN и др.
; Для работы необходимы ABBYY FR, DjvuDecode.
; поместить скрипт в папку с djvu фийлами и запустить.
; **Внимание:
; **Скорость работы ~2-3 файла/минуту.
; **Скрипт использует буфер обмена.
; U235.
;___________________________________________________24.01.08__________
;---------------------------------------------------------------------
$decode_path="c:\DjVuLibre-3.5.17-win32\GENCHO\decoder\"; путь к Djvudecoder'у
$FR8_path="C:\Program Files\ABBYY FineReader 8.0 Professional Edition\" ;путь к FR'у
$search = FileFindFirstFile("*.djv*")
If $search = -1 Then
MsgBox(0, "Error", "No files/directories matched the search pattern")
Exit
EndIf
While 1
$file = FileFindNextFile($search)
If @error Then ExitLoop
$txt_file=StringLeft($file, StringInStr($file, ".djv"))
If FileExists($txt_file&"txt") Then ContinueLoop; если файл txt уже существует, то переходим к следующей книге.
RunWait($decode_path&"DjvuDecode.exe --output-format=tif --page-range=1-5 """&$file&""" pic.tif","",@SW_HIDE );; OCR первые 5 стр.
RunWait($FR8_path&"FineOCR.exe pic.tif /lang Russian English /send Clipboard","",@SW_HIDE )
$bak = ClipGet()
$file_wr = FileOpen($txt_file&"txt", 1)
FileWrite($file_wr, $bak)
FileClose($file_wr)
WEnd
FileClose($search)