КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
PDF документ
Вказівка. Використайте файл PDF.pdf. Одним з найбільш популярних форматів представлення електронних документів в Internet, архівах і так далі є формат PDF (Portable Document Format). Програма ABBYY Finereader допоможе вам розпізнати PDF документи і зберегти розпізнаний текст у вибраний вами формат або передати його в зовнішнє застосування. За допомогою ABBYY Finereader ви також можете розпізнати зображення і зберегти текст в PDF файл. Вибір типу PDF файлу залежить від того, як ви збираєтеся використовувати створений документ PDF надалі: Тільки текст і картинки Зберігається тільки розпізнаний текст і картинки в нім. Можливий пошук по тексту. Розмір PDF-файла невеликий. Режим оптимальний для документів з текстом і картинками на білому фоні (контракти, страхові поліси, листи, факси). Тільки зображення В даному файлі зберігається точне зображення сторінки. Отриманий документ невідмітний від оригіналу, але пошук по тексту неможливий. Режим рекомендується для пересилки по електронній пошті точних копій рахунків, сертифікатів і інших документів. Текст поверх зображення сторінки Зберігається фон і картинки первинного документа, поверх яких накладається розпізнаний текст. Даний тип PDF файлів оптимальний для документів з текстом на кольоровому фоні (рекламні буклети, брошури). Текст під зображенням сторінки Зберігається точне зображення первинного документа, під яким зберігається розпізнаний текст. Отриманий документ невідмітний від оригіналу, і в нім можливий пошук по тексту. Щоб встановити режими збереження у форматі PDF: Клацніть по кнопці Формати на закладці Зберегти в діалозі Опції (меню Сервіс>опціі) або натисніть Ctrl+shift+x. На закладці PDF діалогу Формати встановите необхідний режим. PDF є поширеним форматом для пересилки документів по електронній пошті або публікації документів на веб-сайтах. Природно, що при публікації на веб-сайтах дуже важлива висока швидкість відкриття документів. Документ, збережений з програми ABBYY Finereader у форматі PDF, відповідає подібним вимогам. Структура PDF така, що дозволяє відкривати в призначеному для користувача браузері для перегляду перші сторінки PDF документа, не чекаючи, коли весь файл цілком буде завантажений з веб-сервера. Проста таблиця. Вказівка. Використайте файл TABLE.TIF. Якщо зображення відскановане з правильними параметрами і таблиця має просту структуру (є всі чорні роздільники, таблиця не містить картинок, немає інвертованого або вертикального тексту), то її розпізнавання не вимагає установки яких-небудь спеціальних опцій. Таблиця з неповною кількістю чорних розділювачів. Вказівка. Використайте файл TABLESEP.TIF. Опис ситуації: всі рядки таблиці між чорними горизонтальними лініями (роздільниками) об'єднані в один рядок таблиці. Якщо в таблиці зустрічається змішане розділення на рядки і стовпці, при якому деякі рядки розділені чорними роздільниками, а деякі немає, програма може розбити таблицю на рядки неправильно. Рішення: Програму можна "змусити" виділяти кожен рядок тексту в окремий рядок таблиці. Для цього: у групі Розпізнати діалогу Додаткові опції відзначте опцію В кожному елементі таблиці не більш за один рядок тексту. Для того, щоб відкрити цей діалог, натисніть кнопку Додаткові опції на закладці Загальні в діалозі Опції (меню Сервіс>опції). Складна таблиця. Вказівка. Використайте файл TableDif.tif. Опис ситуації: неправильний аналіз таблиць з складною нерегулярною структурою: неправильне розділення таблиці на рядки і стовпці; неправильне виділення картинок в елементах таблиці; погане розпізнавання вертикального і інвертованого тексту. Рішення: Скористайтеся інструментами ручної розмітки таблиць, розташованими на панелі Зображення: - щоб додати вертикальну лінію; - щоб додати горизонтальну лінію; - щоб видалити лінію. Для елементів таблиці, що містять тільки картинки, в діалозі Властивості блоку (меню Вигляд > Властивості), відзначте пункт Вважати осередок за картинку. Для виділення картинок усередині комірок з текстом в окремі блоки, скористайтеся інструментом на панелі Зображення: Для елементів таблиці, що містять вертикальний текст, в діалозі Властивості блоку (меню Вигляд > Властивості) в полі Напрям тексту вкажіть напрям тексту в осередку; для осередків з інвертованим текстом (світлий текст на темному фоні) у випадному списку Інверсія тексту виберіть пункт Інвертований. Візитні картки. Вказівка. Використайте файл CARDS.TIF. Одним з віянь нашого часу стали візитні картки. Ви отримуєте їх не тільки від партнерів по бізнесу, але і від друзів, знайомих. Звичайно, це дуже зручно - вся важлива інформація про людину сконцентрована на листку паперу невеликого формату. Але іноді лякає їх кількість, і ми витрачаємо масу часу для того, щоб їх упорядкувати, привести в систему, знайти зручний спосіб зберігання. Простий і зручний спосіб введення і зберігання візиток в комп'ютері за допомогою програми ABBYY Finereader. Всі візитки обробляються і зберігаються в пакеті програми. Використовуючи функцію повнотекстового пошуку по розпізнаних сторінках пакету, ви можете знайти потрібну візитку (при цьому пошук можливий за будь-якою розпізнаною інформацією з візитки - по назві компанії, прізвищу, телефону і так далі). Список знайдених візиток показується у вікні Пошук. Щоб відкрити візитку, виберіть запис в результатах пошуку. Ви можете поповнювати пакет новими візитками, редагувати вже розпізнані візитки у вікні Текст. Покладіть декілька візитних карток (стільки, скільки уміщатиметься) в сканер. Увага! Візитки мають бути розкладені так, щоб в результаті була отримана "таблична структура". Між рядами і колонками має бути деяка відстань. Допустимо горизонтальне (довші сторони візиток розташовані уздовж горизонталі), або вертикальне розміщення візиток на листі, але не обидва відразу. Встановіть наступні параметри сканування: роздільна здатність- 400-600 dpi (зазвичай візитні картки містять текст, набраний дрібним шрифтом, для хорошого розпізнавання якого потрібно відсканувати документ з вищим дозволом замість звичайних 300 dpi), тип зображення - сірий або кольоровий. Натисніть кнопку 1-сканувати. Для підвищення якості розпізнавання отримані зображення з візитками слід розділити так, щоб кожній візитці відповідала окрема сторінка пакету. В цьому випадку виправлення перекосу рядків, аналіз і розпізнавання проводитиметься для кожної візитки. Для цього в меню Зображення виберіть пункт Розбити зображення. У діалозі, що відкрився, Розбити зображення натисніть кнопку Зауваження: Якщо зображення було поділене на візитки невірно, то спробуйте поділити зображення уручну. Для цього скористайтеся кнопками Натисніть кнопку 2-розпізнати. Робота з презинтаціями Power Point. Вказівка. Використайте файл HandOuts.tif. Одним з популярних засобів створення сучасних презентацій є програма Microsoft Powerpoint. Презентація складається із слайдів, наочно і що інформативно представляють матеріал. Слайди презентацій, як правило, роздруковуються на одному або декількох листах паперу і лунають учасникам для поліпшення сприйняття і засвоєння інформації, а також внесення якихось заміток, що виникають в ході презентації, або пояснень. Можливо, повернувшись з подібного роду презентації, ви захочете перевести роздруки слайдів, що є у вас, в електронний вигляд. Зазвичай на одному листі розташовано 3-6 кадрів презентації, розпізнавання яких може бути утруднене із-за дрібного шрифту тексту слайдів. Для підвищення якості розпізнавання документа з презентацією рекомендується: У разі дрібного шрифту відсканувати документ з вищим дозволом - 400 -600 dpi (замість звичайних 300 dpi). Після того, як зображення з презентацією відскановане, розрізати його так, щоб кожному слайду відповідала окрема сторінка пакету. Для цього в меню Зображення виберіть пункт Розбити зображення Програмна роздруківка. Вказівка. Використайте файл LISTING.TIF. Опис ситуації:даний приклад має дві особливості, що впливають на якість розпізнавання: програма передає відступи від лівого краю листа не пропусками, а за допомогою завдання відступів абзацу; при експорті в.txt лівий відступ не зберігається; деякі рядки об'єднуються в один абзац і при експорті об'єднуються в один рядок; багато помилок при розпізнаванні конструкцій мов програмування. Рішення: Для розпізнавання таких документів існує спеціальна опція програми Розпізнати як форматований пропусками текст. Відзначте цю опцію в діалозі Додаткові опції в групі Розпізнати. Для того, щоб відкрити цей діалог, натисніть кнопку Додаткові опції на закладці Загальні діалогу Опції (меню Сервіс>Загальні). Для хорошого розпізнавання роздруків програм потрібно встановити спеціальну мову розпізнавання. Для цього: У списку мов на панелі Стандартна виберіть значення Вибір з повного списку мов і в діалозі, що відкрився, Мову розпізнаваного тексту виберіть пункт C++. Зауваження. Якщо розпізнаваний програмний роздрук окрім програмної коди містить текстові коментарі, то для хорошого розпізнавання необхідно вибрати декілька мов розпізнавання: мова програмування і мова, на якій написані коментарі.
Дата добавления: 2015-05-24; Просмотров: 454; Нарушение авторских прав?; Мы поможем в написании вашей работы! |