ΠŸΠΎΠΌΠΎΡ‰ΡŒ Π² написании студСнчСских Ρ€Π°Π±ΠΎΡ‚
АнтистрСссовый сСрвис

Π‘Ρ‚Ρ€ΡƒΠΊΡ‚ΡƒΡ€Π½Ρ‹Π΅ ΠΌΠ΅Ρ‚ΠΎΠ΄Ρ‹ распознавания слоТноорганизованных историчСских Ρ‚Π°Π±Π»ΠΈΡ‡Π½Ρ‹Ρ… Ρ„ΠΎΡ€ΠΌ

Π Π΅Ρ„Π΅Ρ€Π°Ρ‚ΠŸΠΎΠΌΠΎΡ‰ΡŒ Π² Π½Π°ΠΏΠΈΡΠ°Π½ΠΈΠΈΠ£Π·Π½Π°Ρ‚ΡŒ ΡΡ‚ΠΎΠΈΠΌΠΎΡΡ‚ΡŒΠΌΠΎΠ΅ΠΉ Ρ€Π°Π±ΠΎΡ‚Ρ‹

Π’ Ρ€Π°Π±ΠΎΡ‚Π΅ А. МаквСйг рассмотрСны вопросы, связанныС с Π°Π²Ρ‚ΠΎΠΌΠ°Ρ‚ΠΈΠ·ΠΈΡ€ΠΎΠ²Π°Π½Π½Ρ‹ΠΌ Ρ‡Ρ‚Π΅Π½ΠΈΠ΅ΠΌ Ρ‚Π°Π±Π»ΠΈΡ†, содСрТащих ΡΡ‚Π°Ρ‚ΠΈΡΡ‚ΠΈΡ‡Π΅ΡΠΊΡƒΡŽ ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΡŽ ΠΎ ΡΠ΅ΠΌΠ΅ΠΉΠ½ΠΎΠΌ ΠΏΠΎΠ»ΠΎΠΆΠ΅Π½ΠΈΠΈ людСй Π² Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹Ρ… Ρ€Π°ΠΉΠΎΠ½Π°Ρ… Π˜Ρ€Π»Π°Π½Π΄ΠΈΠΈ Π² XIX—XX Π²Π². ΠžΠ±Ρ€Π°Π±ΠΎΡ‚ΠΊΠ° ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½ΠΈΠΉ Π²Ρ‹ΠΏΠΎΠ»Π½ΡΠ»Π°ΡΡŒ OCR-систСмой ProLector. ΠŸΠΎΠ»ΡƒΡ‡Π΅Π½Π½Ρ‹ΠΉ Π² Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Π΅ Ρ€Π°Π±ΠΎΡ‚Ρ‹ OCR тСкстовый Ρ„Π°ΠΉΠ» подвСргался Π΄ΠΎΠΏΠΎΠ»Π½ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΠΉ ΠΏΡ€ΠΎΠ³Ρ€Π°ΠΌΠΌΠ½ΠΎΠΉ ΠΎΠ±Ρ€Π°Π±ΠΎΡ‚ΠΊΠ΅ с Ρ†Π΅Π»ΡŒΡŽ выявлСния ошибок (такая ΠΎΠ±Ρ€Π°Π±ΠΎΡ‚ΠΊΠ°… Π§ΠΈΡ‚Π°Ρ‚ΡŒ Π΅Ρ‰Ρ‘ >

Π‘Ρ‚Ρ€ΡƒΠΊΡ‚ΡƒΡ€Π½Ρ‹Π΅ ΠΌΠ΅Ρ‚ΠΎΠ΄Ρ‹ распознавания слоТноорганизованных историчСских Ρ‚Π°Π±Π»ΠΈΡ‡Π½Ρ‹Ρ… Ρ„ΠΎΡ€ΠΌ (Ρ€Π΅Ρ„Π΅Ρ€Π°Ρ‚, курсовая, Π΄ΠΈΠΏΠ»ΠΎΠΌ, ΠΊΠΎΠ½Ρ‚Ρ€ΠΎΠ»ΡŒΠ½Π°Ρ)

Π‘Ρ‚Ρ€ΡƒΠΊΡ‚ΡƒΡ€Π½Ρ‹Π΅ ΠΌΠ΅Ρ‚ΠΎΠ΄Ρ‹ распознавания слоТноорганизованных историчСских Ρ‚Π°Π±Π»ΠΈΡ‡Π½Ρ‹Ρ… Ρ„ΠΎΡ€ΠΌ

Π’.М. ΠšΠ»ΡΡ†ΠΊΠΈΠ½, Π•. Π’. Π©Π΅ΠΏΠΈΠ½, К. М. Π—ΠΈΠ½Π³Π΅Ρ€ΠΌΠ°Π½, Π’. Π’. Π›Π°Π·Π°Ρ€Π΅Π².

Аннотация

Данная Ρ€Π°Π±ΠΎΡ‚Π° посвящСна ΠΏΡ€ΠΎΠ±Π»Π΅ΠΌΠ°Ρ‚ΠΈΠΊΠ΅ структурного распознавания слоТных Ρ‚Π°Π±Π»ΠΈΡ‡Π½Ρ‹Ρ… Ρ„ΠΎΡ€ΠΌ, Π²ΡΡ‚Ρ€Π΅Ρ‡Π°ΡŽΡ‰ΠΈΡ…ΡΡ Π² ΠΈΡΡ‚оричСских источниках. ΠŸΡ€Π΅Π΄Π»ΠΎΠΆΠ΅Π½Π° ΠΎΡ€ΠΈΠ³ΠΈΠ½Π°Π»ΡŒΠ½Π°Ρ модСль «ΡΠ²ΡΠ·Π°Π½Π½Ρ‹Ρ… ΠΈΠ΅Ρ€Π°Ρ€Ρ…ΠΈΠΉ », Π² Ρ€Π°ΠΌΠΊΠ°Ρ… ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠΉ ΠΌΠΎΠΆΠ΅Ρ‚ Π±Ρ‹Ρ‚ΡŒ распознано ΠΈ ΠΎΠΏΠΈΡΠ°Π½ΠΎ ΠΎΠ±ΡˆΠΈΡ€Π½ΠΎΠ΅ сСмСйство Ρ‚Π°Π±Π»ΠΈΡ‡Π½Ρ‹Ρ… Ρ„ΠΎΡ€ΠΌ ΠΈ Π±Π»Π°Π½ΠΊΠΎΠ². ΠŸΡ€ΠΈΠΌΠ΅Π½Π΅Π½ΠΈΠ΅ ΠΌΠΎΠ΄Π΅Π»ΠΈ «ΡΠ²ΡΠ·Π°Π½Π½Ρ‹Ρ… ΠΈΠ΅Ρ€Π°Ρ€Ρ…ΠΈΠΉ «Π² Ρ‚Π°Π±Π»ΠΈΡ‡Π½ΠΎΠΌ структуризаторС OCR-систСмы Cript ΠΏΠΎΠ·Π²ΠΎΠ»ΠΈΠ»ΠΎ ΡƒΡΠΏΠ΅ΡˆΠ½ΠΎ Ρ€Π°ΡΠΏΠΎΠ·Π½Π°Π²Π°Ρ‚ΡŒ слоТноструктурированныС Ρ‚Π°Π±Π»ΠΈΡ‡Π½Ρ‹Π΅ Ρ„ΠΎΡ€ΠΌΡ‹ ΠΈΠ· Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹Ρ… историчСских источников [1].

Π’Π²Π΅Π΄Π΅Π½ΠΈΠ΅

Π‘Ρ„Π΅Ρ€Π° примСнСния систСм оптичСского распознавания Π½Π΅ΠΏΡ€Π΅Ρ€Ρ‹Π²Π½ΠΎ Ρ€Π°ΡΡˆΠΈΡ€ΡΠ΅Ρ‚ΡΡ Π½Π΅ Ρ‚ΠΎΠ»ΡŒΠΊΠΎ Π²ΡˆΠΈΡ€ΡŒ (ΠΏΠΎ Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹ΠΌ областям чСловСчСской Π΄Π΅ΡΡ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΠΈ), Π½ΠΎ ΠΈ Π²Π³Π»ΡƒΠ±ΡŒ (ΠΏΠΎ ΡƒΡ€ΠΎΠ²Π½ΡŽ слоТности Π²Π²ΠΎΠ΄ΠΈΠΌΡ‹Ρ… Π΄ΠΎΠΊΡƒΠΌΠ΅Π½Ρ‚ΠΎΠ²). Π£Ρ€ΠΎΠ²Π΅Π½ΡŒ слоТности зависит ΠΎΡ‚ ΠΌΠ½ΠΎΠ³ΠΈΡ… Ρ„Π°ΠΊΡ‚ΠΎΡ€ΠΎΠ² ΠΈ ΠΌΠΎΠΆΠ΅Ρ‚ Π±Ρ‹Ρ‚ΡŒ ΠΎΡ…Π°Ρ€Π°ΠΊΡ‚Π΅Ρ€ΠΈΠ·ΠΎΠ²Π°Π½ с Ρ‚ΠΎΡ‡ΠΊΠΈ зрСния содСрТания Π²Π²ΠΎΠ΄ΠΈΠΌΡ‹Ρ… листов (структура прСдставлСнной Π½Π° Π»ΠΈΡΡ‚Π΅ ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΠΈ, ΡˆΡ€ΠΈΡ„Ρ‚Ρ‹ ΠΈ Π΄Ρ€ΡƒΠ³ΠΈΠ΅ типографскиС ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€Ρ‹), качСства ΠΏΠ΅Ρ‡Π°Ρ‚ΠΈ ΠΈ ΡƒΡΠ»ΠΎΠ²ΠΈΠΉ сканирования. Π‘ΠΏΠ΅ΠΊΡ‚Ρ€ доступных для оптичСского распознавания структур ΠΏΠ΅Ρ‡Π°Ρ‚Π½Ρ‹Ρ… листов достаточно ΡˆΠΈΡ€ΠΎΠΊ, ΠΈ Ρ‚Π΅ΠΌ Π½Π΅ ΠΌΠ΅Π½Π΅Π΅ ΠΈΠΌ Π½Π΅ ΠΈΡΡ‡Π΅Ρ€ΠΏΡ‹Π²Π°ΡŽΡ‚ся потрСбности практичСского использования OCR для распознавания Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹Ρ… историчСских источников. Π’ Π΄Π°Π½Π½ΠΎΠΉ Ρ€Π°Π±ΠΎΡ‚Π΅ ΠΏΡ€ΠΎΠ²Π΅Π΄Π΅Π½ ΠΎΠ±Π·ΠΎΡ€ соврСмСнных ΠΌΠ΅Ρ‚ΠΎΠ΄ΠΎΠ² структурного распознавания ΠΏΠ΅Ρ‡Π°Ρ‚Π½ΠΎΠΉ ΠΏΡ€ΠΎΠ΄ΡƒΠΊΡ†ΠΈΠΈ ΠΈ ΠΏΡ€Π΅Π΄ΠΏΡ€ΠΈΠ½ΡΡ‚Π° ΠΏΠΎΠΏΡ‹Ρ‚ΠΊΠ° Ρ€Π°ΡΡˆΠΈΡ€ΠΈΡ‚ΡŒ Π΄ΠΈΠ°ΠΏΠ°Π·ΠΎΠ½ автоматичСски ΠΎΠ±Ρ€Π°Π±Π°Ρ‚Ρ‹Π²Π°Π΅ΠΌΡ‹Ρ… OCRсистСмами структур Π΄ΠΎΠΊΡƒΠΌΠ΅Π½Ρ‚ΠΎΠ² Π² ΡΡ‚ΠΎΡ€ΠΎΠ½Ρƒ слоТнооорганизованных Ρ‚Π°Π±Π»ΠΈΡ‡Π½Ρ‹Ρ… Ρ„ΠΎΡ€ΠΌ, распространСнных Π² ΠΈΡΡ‚оричСских исслСдованиях. ΠŸΠΎΠ΄Π»Π΅ΠΆΠ°Ρ‰ΠΈΠ΅ ΠΎΠ±Ρ€Π°Π±ΠΎΡ‚ΠΊΠ΅ Ρ‚Π°Π±Π»ΠΈΡ†Ρ‹ ΠΌΠΎΠ³ΡƒΡ‚ ΠΎΠ±Π»Π°Π΄Π°Ρ‚ΡŒ ΠΌΠ½ΠΎΠ³ΠΎΡƒΡ€ΠΎΠ²Π½Π΅Π²ΠΎΠΉ Π³ΠΎΡ€ΠΈΠ·ΠΎΠ½Ρ‚Π°Π»ΡŒΠ½ΠΎΠΉ ΠΈ Π²Π΅Ρ€Ρ‚ΠΈΠΊΠ°Π»ΡŒΠ½ΠΎΠΉ иСрархиями, ΡƒΡ€ΠΎΠ²Π½ΠΈ ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… ΠΌΠΎΠ³ΡƒΡ‚ ΠΈΠΌΠ΅Ρ‚ΡŒ Π½Π΅Ρ€Π΅Π³ΡƒΠ»ΡΡ€Π½ΡƒΡŽ (Π½Π΅ Π²ΡΠ΅Π³Π΄Π° Π»ΠΈΠ½Π΅ΠΉΠ½ΠΎ ΡƒΠΏΠΎΡ€ΡΠ΄ΠΎΡ‡Π΅Π½Π½ΡƒΡŽ) структуру. Помимо Ρ‚ΠΎΠ³ΠΎ, структура ячССк Ρ‚Π°Π±Π»ΠΈΡ†Ρ‹ ΠΌΠΎΠΆΠ΅Ρ‚ Π±Ρ‹Ρ‚ΡŒ достаточно слоТной, нСсводимой ΠΊ Ρ‚Ρ€Π°Π΄ΠΈΡ†ΠΈΠΎΠ½Π½ΠΎΠΌΡƒ описанию тСкстов «ΠΏΠ°Ρ€Π°Π³Ρ€Π°Ρ„-строка-слово-символ ». Π’ ΡΡ‡Π΅ΠΉΠΊΠ°Ρ… ΠΌΠΎΠ³ΡƒΡ‚ Π²ΡΡ‚Ρ€Π΅Ρ‡Π°Ρ‚ΡŒΡΡ ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Ρ‹ Ρ€Π°Π·Π»ΠΈΡ‡Π½ΠΎΠΉ структуры, Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€ матСматичСскиС выраТСния (индСксы, Π΄Ρ€ΠΎΠ±ΠΈ, спСцсимволы), многоточия, Π½Π΅Π»ΠΈΠ½Π΅ΠΉΠ½ΠΎ-связанныС строки. Для Π°Π½Π°Π»ΠΈΠ·Π° ΠΏΠΎΠ΄ΠΎΠ±Π½Ρ‹Ρ… структур Π°Π²Ρ‚ΠΎΡ€Π°ΠΌΠΈ ΠΏΡ€Π΅Π΄Π»ΠΎΠΆΠ΅Π½Π° достаточно ΡƒΠ½ΠΈΠ²Π΅Ρ€ΡΠ°Π»ΡŒΠ½Π°Ρ модСль «ΡΠ²ΡΠ·Π°Π½Π½Ρ‹Ρ… ΠΈΠ΅Ρ€Π°Ρ€Ρ…ΠΈΠΉ », ΠΏΠΎΠ·Π²ΠΎΠ»ΡΡŽΡ‰Π°Ρ Ρ€Π°ΡΠΏΠΎΠ·Π½Π°Π²Π°Ρ‚ΡŒ, ΠΎΠΏΠΈΡΡ‹Π²Π°Ρ‚ΡŒ ΠΈ ΠΏΡ€Π΅Π΄ΡΡ‚Π°Π²Π»ΡΡ‚ΡŒ Π² Ρ‚Скстовой Ρ„ΠΎΡ€ΠΌΠ΅ ΡˆΠΈΡ€ΠΎΠΊΠΈΠΉ класс Ρ‚Π°Π±Π»ΠΈΡ‡Π½Ρ‹Ρ… Ρ„ΠΎΡ€ΠΌ ΠΈ Π±Π»Π°Π½ΠΊΠΎΠ². Разработанная мСтодология структурного распознавания Ρ‚Π°Π±Π»ΠΈΡ† основана Π½Π° ΠΌΠΎΠ΄Π΅Π»ΠΈ «ΡΠ²ΡΠ·Π°Π½Π½Ρ‹Ρ… ΠΈΠ΅Ρ€Π°Ρ€Ρ…ΠΈΠΉ ». ΠŸΡ€ΠΎΠ³Ρ€Π°ΠΌΠΌΠ½ΠΎΠΉ Ρ€Π΅Π°Π»ΠΈΠ·Π°Ρ†ΠΈΠ΅ΠΉ этой ΠΌΠ΅Ρ‚ΠΎΠ΄ΠΎΠ»ΠΎΠ³ΠΈΠΈ являСтся Ρ‚Π°Π±Π»ΠΈΡ‡Π½Ρ‹ΠΉ структуризатор Cript, входящий Π² ΠΎΠ΄Π½ΠΎΠΈΠΌΠ΅Π½Π½ΡƒΡŽ OCR-систСму.

ΠŸΡ€ΠΈΠΌΠ΅Π½Π΅Π½ΠΈΠ΅ Ρ‚Π°Π±Π»ΠΈΡ‡Π½ΠΎΠΉ вСрсии OCR-систСмы Cript ΠΊ Π°Π½Π°Π»ΠΈΠ·Ρƒ Ρ‚Π°Π±Π»ΠΈΡ‡Π½Ρ‹Ρ… Ρ„ΠΎΡ€ΠΌ ΠΈΠ· Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹Ρ… историчСских источников ΠΏΠΎΠΊΠ°Π·Π°Π»ΠΎ ΠΊΠΎΠ½ΡΡ‚Ρ€ΡƒΠΊΡ‚ΠΈΠ²Π½ΠΎΡΡ‚ΡŒ ΠΏΡ€Π΅Π΄Π»ΠΎΠΆΠ΅Π½Π½ΠΎΠΉ ΠΌΠΎΠ΄Π΅Π»ΠΈ ΠΈ Π΅Π΅ Π°Π»Π³ΠΎΡ€ΠΈΡ‚мичСского наполнСния. Π’ ΡΡ‚Π°Ρ‚ΡŒΠ΅ ΠΏΡ€ΠΈΠ²Π΅Π΄Π΅Π½Ρ‹ ΠΈΠ»Π»ΡŽΡΡ‚Ρ€Π°Ρ†ΠΈΠΈ основных этапов структурного распознавания Ρ‚Π°Π±Π»ΠΈΡ† историчСского Ρ…Π°Ρ€Π°ΠΊΡ‚Π΅Ρ€Π°.

ΠžΠ±Π·ΠΎΡ€ ΠΌΠ΅Ρ‚ΠΎΠ΄ΠΎΠ² Π°Π½Π°Π»ΠΈΠ·Π° слоТных иСрархичСских Ρ„ΠΎΡ€ΠΌ

Π’ ΠΏΠΎΡΠ»Π΅Π΄Π½ΠΈΠ΅ Π³ΠΎΠ΄Ρ‹ систСмы оптичСского распознавания символов (OCR-систСмы) ΠΏΡ€ΠΈΠΌΠ΅Π½ΡΡŽΡ‚ΡΡ ΠΊ Ρ€Π°ΡΠΏΠΎΠ·Π½Π°Π²Π°Π½ΠΈΡŽ источников Ρ€Π°Π·Π»ΠΈΡ‡Π½ΠΎΠΉ ΠΏΡ€ΠΈΡ€ΠΎΠ΄Ρ‹: рукописных тСкстов, тСхничСских ΠΏΡƒΠ±Π»ΠΈΠΊΠ°Ρ†ΠΈΠΉ[2], бизнСс-ΠΊΠ°Ρ€Ρ‚[3], записСй ΡˆΠ°Ρ…ΠΌΠ°Ρ‚Π½Ρ‹Ρ… ΠΏΠ°Ρ€Ρ‚ΠΈΠΉ[4] ΠΈ ΠΌΡƒΠ·Ρ‹ΠΊΠ°Π»ΡŒΠ½Ρ‹Ρ… ΠΏΡ€ΠΎΠΈΠ·Π²Π΅Π΄Π΅Π½ΠΈΠΉ[5], историчСских источников[6]. Π’ΠΎ ΠΌΠ½ΠΎΠ³ΠΈΡ… случаях листы Π΄ΠΎΠΊΡƒΠΌΠ΅Π½Ρ‚ΠΎΠ², ΠΏΡ€Π΅Π΄Π½Π°Π·Π½Π°Ρ‡Π΅Π½Π½Ρ‹Ρ… для автоматичСского Π²Π²ΠΎΠ΄Π°, ΠΎΠΏΡ€Π΅Π΄Π΅Π»Π΅Π½Π½Ρ‹ΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ структурированы. НапримСр, страница ΠΊΠ½ΠΈΠ³ΠΈ ΠΈΠ»ΠΈ Π½Π°ΡƒΡ‡Π½ΠΎΠ³ΠΎ ΠΆΡƒΡ€Π½Π°Π»Π° ΠΌΠΎΠΆΠ΅Ρ‚ Π±Ρ‹Ρ‚ΡŒ Ρ€Π°Π·Π±ΠΈΡ‚Π° Π½Π° ΠΊΠΎΠ»ΠΎΠ½ΠΊΠΈ, ΠΌΠΎΠΆΠ΅Ρ‚ ΡΠΎΠ΄Π΅Ρ€ΠΆΠ°Ρ‚ΡŒ Π·Π°Π³ΠΎΠ»ΠΎΠ²ΠΊΠΈ, примСчания, Ρ‡Π΅Ρ€Ρ‚Π΅ΠΆΠΈ ΠΈ Ρ€ΠΈΡΡƒΠ½ΠΊΠΈ, страница Π³Π°Π·Π΅Ρ‚ ΠΌΠΎΠΆΠ΅Ρ‚ Π±Ρ‹Ρ‚ΡŒ Ρ€Π°Π·Π±ΠΈΡ‚Π° Π½Π° Π±Π»ΠΎΠΊΠΈ, ΡΠΎΠ΄Π΅Ρ€ΠΆΠ°Ρ‚ΡŒ ΠΎΠΊΠΎΠ½Ρ‚ΡƒΡ€ΠΈΠ²Π°ΡŽΡ‰ΠΈΠ΅ Ρ€Π°ΠΌΠΊΠΈ ΠΈ ΠΏΡ€ΠΎΡ‡ΠΈΠ΅ Ρ€Π°Π·Π΄Π΅Π»ΡΡŽΡ‰ΠΈΠ΅ графичСскиС элСмСнты.

Одним ΠΈΠ· Π½Π°ΠΈΠ±ΠΎΠ»Π΅Π΅ Ρ‚ΠΈΠΏΠΈΡ‡Π½Ρ‹Ρ… ΠΏΡ€ΠΈΠΌΠ΅Ρ€ΠΎΠ² структурированного способа прСдставлСния ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΠΈ ΡΠ²Π»ΡΡŽΡ‚ΡΡ Ρ‚Π°Π±Π»ΠΈΡ†Ρ‹. Для ΠΏΡ€Π°Π²ΠΈΠ»ΡŒΠ½ΠΎΠΉ ΠΈΠ½Ρ‚Π΅Ρ€ΠΏΡ€Π΅Ρ‚Π°Ρ†ΠΈΠΈ структурированных Π΄ΠΎΠΊΡƒΠΌΠ΅Π½Ρ‚ΠΎΠ² Π½Π΅ΠΎΠ±Ρ…ΠΎΠ΄ΠΈΠΌΠΎ сначала Π²Ρ‹Π΄Π΅Π»ΠΈΡ‚ΡŒ элСмСнты структуры (ΠΊΠΎΠ»ΠΎΠ½ΠΊΠΈ ΠΈ Π±Π»ΠΎΠΊΠΈ Π² Ρ‚СхничСских публикациях, Π³Ρ€Π°Ρ„Ρ‹, строки ΠΈ ΡΡ‡Π΅ΠΉΠΊΠΈ Π² Ρ‚Π°Π±Π»ΠΈΡ†Π°Ρ…) ΠΈ Ρ‚ΠΎΠ»ΡŒΠΊΠΎ послС этого Ρ€Π°ΡΠΏΠΎΠ·Π½Π°Π²Π°Ρ‚ΡŒ ΠΎΡ‚Π΄Π΅Π»ΡŒΠ½Ρ‹Π΅ символы этих элСмСнтов[7].

ΠŸΡ€ΠΎΠ±Π»Π΅ΠΌΡ‹ выдСлСния структурных Π±Π»ΠΎΠΊΠΎΠ² Π½Π° ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½ΠΈΠΈ листа Π΄ΠΎΠΊΡƒΠΌΠ΅Π½Ρ‚Π° рассмотрСны Π² Ρ€ΡΠ΄Π΅ Ρ€Π°Π±ΠΎΡ‚. Π’Π°ΠΊ, создана систСма выдСлСния Π±Π»ΠΎΠΊΠΎΠ² тСкста, основанная Π½Π° ΡΠΈΠ½Ρ‚аксичСском Π°Π½Π°Π»ΠΈΠ·Π΅ «ΡΠ½ΠΈΠ·Ρƒ-Π²Π²Π΅Ρ€Ρ… «ΠΈ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡŽΡ‰Π°Ρ Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€ΡƒΡŽ ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΡŽ ΠΎ ΡΡ‚Ρ€ΡƒΠΊΡ‚ΡƒΡ€Π΅ Π΄ΠΎΠΊΡƒΠΌΠ΅Π½Ρ‚Π°, ΠΏΡ€Π΅Π΄Π²Π°Ρ€ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ Π·Π°Π΄Π°Π½Π½ΡƒΡŽ ΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚Π΅Π»Π΅ΠΌ [8]. Π­Ρ‚Π° систСма позволяСт Π²Ρ‹Π΄Π΅Π»ΡΡ‚ΡŒ Π½Π° Π»ΠΈΡΡ‚Π΅ ΠΈΠ·ΠΎΡ‚Π΅Ρ‚ΠΈΡ‡Π½Ρ‹Π΅ ΠΏΡ€ΡΠΌΠΎΡƒΠ³ΠΎΠ»ΡŒΠ½Ρ‹Π΅ Π±Π»ΠΎΠΊΠΈ. ΠŸΡ€ΠΈ Ρ€Π°Π·Π΄Π΅Π»Π΅Π½ΠΈΠΈ тСкста Π½Π° Π±Π»ΠΎΠΊΠΈ Π°Π²Ρ‚ΠΎΡ€Ρ‹ этих Ρ€Π°Π±ΠΎΡ‚ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡŽΡ‚ Ρ‚ΠΎΡ‚ Ρ„Π°ΠΊΡ‚, Ρ‡Ρ‚ΠΎ тСкстовыС Π±Π»ΠΎΠΊΠΈ ΠΎΠ±Ρ‹Ρ‡Π½ΠΎ ΠΎΡ‚Π΄Π΅Π»Π΅Π½Ρ‹ Π΄Ρ€ΡƒΠ³ ΠΎΡ‚ Π΄Ρ€ΡƒΠ³Π° Π±Π΅Π»Ρ‹ΠΌΠΈ ΠΏΡ€ΠΎΠΌΠ΅ΠΆΡƒΡ‚ΠΊΠ°ΠΌΠΈ, ΡˆΠΈΡ€ΠΈΠ½Π° ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… большС мСТсловного ΠΈΠ½Ρ‚Π΅Ρ€Π²Π°Π»Π° ΠΈ ΠΈΠ½Ρ‚Π΅Ρ€Π²Π°Π»Π° ΠΌΠ΅ΠΆΠ΄Ρƒ строками. Π­Ρ‚ΠΎΡ‚ ΠΆΠ΅ Ρ„Π°ΠΊΡ‚ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ΡΡ для выдСлСния тСкстовых Π±Π»ΠΎΠΊΠΎΠ² Π² Π΄Ρ€ΡƒΠ³ΠΈΡ… Ρ€Π°Π±ΠΎΡ‚Π°Ρ…[9], Π½ΠΎ Π·Π΄Π΅ΡΡŒ ΠΌΠΎΠ³ΡƒΡ‚ ΠΈΠΌΠ΅Ρ‚ΡŒ Π±ΠΎΠ»Π΅Π΅ ΡΠ»ΠΎΠΆΠ½ΡƒΡŽ Ρ„ΠΎΡ€ΠΌΡƒ. ΠžΡΠΎΠ±Π΅Π½Π½ΠΎΡΡ‚ΡŒ ΠΏΡ€Π΅Π΄Π»ΠΎΠΆΠ΅Π½Π½ΠΎΠ³ΠΎ Π² ΡΡ‚ΠΈΡ… Ρ€Π°Π±ΠΎΡ‚Π°Ρ… ΠΏΠΎΠ΄Ρ…ΠΎΠ΄Π° Π² Ρ‚ΠΎΠΌ, Ρ‡Ρ‚ΠΎ ΠΎΠ½ Π½Π΅ Ρ‚Ρ€Π΅Π±ΡƒΠ΅Ρ‚ ΠΊΠ°ΠΊΠΈΡ…-Π»ΠΈΠ±ΠΎ ΠΏΡ€Π΅Π΄Π²Π°Ρ€ΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹Ρ… Π·Π½Π°Π½ΠΈΠΉ ΠΎ ΡΡ‚Ρ€ΡƒΠΊΡ‚ΡƒΡ€Π΅ листа ΠΈ ΠΎΡΡƒΡ‰Π΅ΡΡ‚вляСт Ρ€Π°Π·ΠΌΠ΅Ρ‚ΠΊΡƒ листа, ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡ Ρ‚ΠΎΠ»ΡŒΠΊΠΎ ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΡŽ ΠΎ Ρ€Π°Π·ΠΌΠ΅Ρ€Π°Ρ… Π±Π΅Π»Ρ‹Ρ… ΠΏΡ€ΠΎΠΌΠ΅ΠΆΡƒΡ‚ΠΊΠΎΠ² ΠΌΠ΅ΠΆΠ΄Ρƒ Π³Π°Π±Π°Ρ€ΠΈΡ‚Π½Ρ‹ΠΌΠΈ Ρ€Π°ΠΌΠΊΠ°ΠΌΠΈ ΠΊΠΎΠΌΠΏΠΎΠ½Π΅Π½Ρ‚. ΠœΠ΅Ρ‚ΠΎΠ΄ основан Π½Π° ΠΎΠ±Ρ‰Π΅ΠΌ для Π±ΠΎΠ»ΡŒΡˆΠΈΠ½ΡΡ‚Π²Π° Ρ„ΠΎΡ€ΠΌΠ°Ρ‚ΠΎΠ² тСкстовых Π΄ΠΎΠΊΡƒΠΌΠ΅Π½Ρ‚ΠΎΠ² ΠΏΡ€Π΅Π΄ΠΏΠΎΠ»ΠΎΠΆΠ΅Π½ΠΈΠΈ ΠΎ Ρ‚ΠΎΠΌ, Ρ‡Ρ‚ΠΎ тСкстовыС Π±Π»ΠΎΠΊΠΈ ΠΎΡ‚Π΄Π΅Π»ΡΡŽΡ‚ΡΡ Π΄Ρ€ΡƒΠ³ ΠΎΡ‚ Π΄Ρ€ΡƒΠ³Π° Π±Π΅Π»Ρ‹ΠΌΠΈ (Ρ‚ΠΎ Π΅ΡΡ‚ΡŒ Π½Π΅Π·Π°ΠΏΠΎΠ»Π½Π΅Π½Π½Ρ‹ΠΌΠΈ тСкстом) ΠΏΡ€ΠΎΠΌΠ΅ΠΆΡƒΡ‚ΠΊΠ°ΠΌΠΈ. МоТно ввСсти понятиС ΠΌΠ°ΠΊΡΠΈΠΌΠ°Π»ΡŒΠ½Ρ‹Ρ… Π±Π΅Π»Ρ‹Ρ… ΠΏΡ€ΡΠΌΠΎΡƒΠ³ΠΎΠ»ΡŒΠ½ΠΈΠΊΠΎΠ² (ΠΏΠΎΠ΄ ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΌΠΈ ΠΏΠΎΠ½ΠΈΠΌΠ°ΡŽΡ‚ΡΡ ΠΏΡ€ΡΠΌΠΎΡƒΠ³ΠΎΠ»ΡŒΠ½ΠΈΠΊΠΈ Ρ„ΠΎΠ½Π°, всС стороны ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… ΠΊΠ°ΡΠ°ΡŽΡ‚ΡΡ Π³Ρ€Π°Π½ΠΈΡ† Ρ€Π°ΠΌΠΎΠΊ ΠΊΠΎΠΌΠΏΠΎΠ½Π΅Π½Ρ‚ тСкста) ΠΈ Ρ€Π°ΡΡΠΌΠ°Ρ‚риваСтся Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ нахоТдСния всСх ΠΌΠ°ΠΊΡΠΈΠΌΠ°Π»ΡŒΠ½Ρ‹Ρ… Π±Π΅Π»Ρ‹Ρ… ΠΏΡ€ΡΠΌΠΎΡƒΠ³ΠΎΠ»ΡŒΠ½ΠΈΠΊΠΎΠ² Π½Π° Ρ€Π°ΡΡ‚Ρ€Π΅ [10].

ΠœΠ΅Ρ‚ΠΎΠ΄Ρ‹, ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅ΠΌΡ‹Π΅ ΠΏΡ€ΠΈ Π²Ρ‹Π΄Π΅Π»Π΅Π½ΠΈΠΈ тСкстовых Π±Π»ΠΎΠΊΠΎΠ², ΠΌΠΎΠ³ΡƒΡ‚ Π±Ρ‹Ρ‚ΡŒ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Π½Ρ‹ ΠΈ Π΄Π»Ρ Π°Π½Π°Π»ΠΈΠ·Π° структуры Ρ‚Π°Π±Π»ΠΈΡ†. ΠžΡ‚ΠΌΠ΅Ρ‚ΠΈΠΌ, Ρ‡Ρ‚ΠΎ Π²ΠΎ ΠΌΠ½ΠΎΠ³ΠΈΡ… случаях (хотя ΠΈ Π½Π΅ Π²ΡΠ΅Π³Π΄Π°) ΠΊΠΎΠ»ΠΎΠ½ΠΊΠΈ ΠΈ ΡΡ‚Ρ€ΠΎΠΊΠΈ Ρ‚Π°Π±Π»ΠΈΡ† ΠΌΠΎΠ³ΡƒΡ‚ Π±Ρ‹Ρ‚ΡŒ Ρ€Π°Π·Π΄Π΅Π»Π΅Π½Ρ‹ линиями Ρ€Π°Π·Π³Ρ€Π°Ρ„ΠΊΠΈ. Π˜ΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡ ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΡŽ ΠΎ Ρ€Π°ΡΠΏΠΎΠ»ΠΎΠΆΠ΅Π½ΠΈΠΈ этих Π»ΠΈΠ½ΠΈΠΉ, ΠΌΠΎΠΆΠ½ΠΎ Π±ΠΎΠ»Π΅Π΅ Π½Π°Π΄Π΅ΠΆΠ½ΠΎ Ρ€Π°Π·Π΄Π΅Π»ΠΈΡ‚ΡŒ элСмСнты Ρ‚Π°Π±Π»ΠΈΡ†Ρ‹, Ρ‡Π΅ΠΌ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡ Ρ‚ΠΎΠ»ΡŒΠΊΠΎ ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΡŽ ΠΎ ΠΌΠ΅ΠΆΠΊΠΎΠ»ΠΎΠ½Π½Ρ‹Ρ… ΠΈ ΠΌΠ΅ΠΆΡΡ‚Ρ€ΠΎΡ‡Π½Ρ‹Ρ… ΠΏΡ€ΠΎΠΌΠ΅ΠΆΡƒΡ‚ΠΊΠ°Ρ… Π² Ρ‚Π°Π±Π»ΠΈΡ†Π΅. Однако для этого систСма Π°Π½Π°Π»ΠΈΠ·Π° структуры листа Π΄ΠΎΠ»ΠΆΠ½Π° Ρ€Π°ΡΠΏΠΎΠ»Π°Π³Π°Ρ‚ΡŒ срСдствами обнаруТСния Π»ΠΈΠ½ΠΈΠΉ. НСобходимы Ρ‚Π°ΠΊΠΆΠ΅ срСдства объСдинСния ΠΎΡ‚Ρ€Π΅Π·ΠΊΠΎΠ² Π»ΠΈΠ½ΠΈΠΉ Π² ΠΏΡ€ΡΠΌΠΎΡƒΠ³ΠΎΠ»ΡŒΠ½Ρ‹Π΅ Ρ€Π°ΠΌΠΊΠΈ, ΠΎΠ³Ρ€Π°Π½ΠΈΡ‡ΠΈΠ²Π°ΡŽΡ‰ΠΈΠ΅ элСмСнты Ρ‚Π°Π±Π»ΠΈΡ†. Один ΠΈΠ· Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠΎΠ² быстрого обнаруТСния Π³ΠΎΡ€ΠΈΠ·ΠΎΠ½Ρ‚Π°Π»Π΅ΠΉ ΠΈ Π²Π΅Ρ€Ρ‚ΠΈΠΊΠ°Π»Π΅ΠΉ Π½Π° ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½ΠΈΠΈ ΠΈ Π²Ρ‹Π΄Π΅Π»Π΅Π½ΠΈΡ ΠΎΠ³Ρ€Π°Π½ΠΈΡ‡Π΅Π½Π½Ρ‹Ρ… ΠΈΠΌΠΈ элСмСнтов Ρ‚Π°Π±Π»ΠΈΡ†Ρ‹ ΠΏΡ€Π΅Π΄ΡΡ‚Π°Π²Π»ΡΠ΅ΡŒΡ‚ΡΡ вСсьма эффСктивным [11]. ΠŸΡ€ΠΈΠ²Π΅Π΄Π΅ΠΌ ΠΊΡ€Π°Ρ‚ΠΊΠΎΠ΅ описаниС Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ° поиска ΡΠΏΠ»ΠΎΡˆΠ½Ρ‹Ρ… Π³ΠΎΡ€ΠΈΠ·ΠΎΠ½Ρ‚Π°Π»ΡŒΠ½Ρ‹Ρ… Π»ΠΈΠ½ΠΈΠΉ. РастровоС Π±ΠΈΠ½Π°Ρ€Π½ΠΎΠ΅ ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½ΠΈΠ΅ просматриваСтся Π² Π½Π°ΠΏΡ€Π°Π²Π»Π΅Π½ΠΈΠΈ свСрху Π²Π½ΠΈΠ· ΠΈ Π½Π° Π½Π΅ΠΌ Ρ„ΠΈΠΊΡΠΈΡ€ΡƒΡŽΡ‚ΡΡ ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΠΈ Ρ‡Π΅Ρ€Π½Ρ‹Ρ… пиксСлов, Π΄Π»ΠΈΠ½Π° ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… ΠΏΡ€Π΅Π²Ρ‹ΡˆΠ°Π΅Ρ‚ Π·Π°Ρ€Π°Π½Π΅Π΅ Π·Π°Π΄Π°Π½Π½Ρ‹ΠΉ ΠΏΠΎΡ€ΠΎΠ³. Π—Π°Ρ‚Π΅ΠΌ связанныС (Π³Ρ€Π°Π½ΠΈΡ‡Π°Ρ‰ΠΈΠ΅ Π΄Ρ€ΡƒΠ³ с Π΄Ρ€ΡƒΠ³ΠΎΠΌ Π² ΡΠΌΡ‹ΡΠ»Π΅ 8-связности) ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΠΈ ΠΎΠ±ΡŠΠ΅Π΄ΠΈΠ½ΡΡŽΡ‚ΡΡ, образуя элСмСнты Π»ΠΈΠ½ΠΈΠΉ ΠΈ Π΄Π»Ρ ΠΊΠ°ΠΆΠ΄ΠΎΠ³ΠΎ Ρ‚Π°ΠΊΠΎΠ³ΠΎ элСмСнта вычисляСтся Π΅Π³ΠΎ срСдняя Ρ‚ΠΎΠ»Ρ‰ΠΈΠ½Π°. Блишком толстыС элСмСнты ΠΎΡ‚Π±Ρ€Π°ΡΡ‹Π²Π°ΡŽΡ‚ΡΡ. Π’ ΠΊΠ°Ρ‡Π΅ΡΡ‚Π²Π΅ ΠΊΠ°Π½Π΄ΠΈΠ΄Π°Ρ‚ΠΎΠ² Π² ΡΠ»Π΅ΠΌΠ΅Π½Ρ‚Ρ‹ ΠΏΡƒΠ½ΠΊΡ‚ΠΈΡ€Π½Ρ‹Ρ… Π»ΠΈΠ½ΠΈΠΉ Ρ€Π°ΡΡΠΌΠ°Ρ‚Ρ€ΠΈΠ²Π°ΡŽΡ‚ΡΡ всС ΠΊΠΎΠΌΠΏΠΎΠ½Π΅Π½Ρ‚Ρ‹ связности, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ Π½Π΅ ΡΠ»ΠΈΡˆΠΊΠΎΠΌ Π²Π΅Π»ΠΈΠΊΠΈ ΠΈ ΡΠ²Π»ΡΡŽΡ‚ся достаточно «ΠΏΠ»ΠΎΡ‚Π½Ρ‹ΠΌΠΈ «(«ΠΏΠ»ΠΎΡ‚Π½ΠΎΡΡ‚ΡŒ «ΠΊΠΎΠΌΠΏΠΎΠ½Π΅Π½Ρ‚Ρ‹ опрСдСляСтся ΠΊΠ°ΠΊ ΠΎΡ‚Π½ΠΎΡˆΠ΅Π½ΠΈΠ΅ числа Ρ‡Π΅Ρ€Π½Ρ‹Ρ… пиксСлов ΠΊ ΠΏΠ»ΠΎΡ‰Π°Π΄ΠΈ Π΅Π΅ Ρ€Π°ΠΌΠΊΠΈ). Π—Π°Ρ‚Π΅ΠΌ для объСдинСния ΠΎΡΡ‚Π°Π²ΡˆΠΈΡ…ΡΡ ΠΊΠΎΠΌΠΏΠΎΠ½Π΅Π½Ρ‚ Π² Π³ΠΎΡ€ΠΈΠ·ΠΎΠ½Ρ‚Π°Π»ΡŒΠ½Ρ‹Π΅ ΠΏΡƒΠ½ΠΊΡ‚ΠΈΡ€Π½Ρ‹Π΅ Π»ΠΈΠ½ΠΈΠΈ выполняСтся ΡΠ»Π΅Π΄ΡƒΡŽΡ‰Π°Ρ ΠΏΡ€ΠΎΡ†Π΅Π΄ΡƒΡ€Π°: для ΠΊΠ°ΠΆΠ΄ΠΎΠΉ ΠΏΠ°Ρ€Ρ‹ элСмСнтов Π»ΠΈΠ½ΠΈΠΈ провСряСтся Π²Ρ‹ΠΏΠΎΠ»Π½Π΅Π½ΠΈΠ΅ Π΄Π²ΡƒΡ… условий: 1) Π³ΠΎΡ€ΠΈΠ·ΠΎΠ½Ρ‚Π°Π»ΡŒΠ½Ρ‹ΠΉ ΠΏΡ€ΠΎΠΌΠ΅ΠΆΡƒΡ‚ΠΎΠΊ ΠΌΠ΅ΠΆΠ΄Ρƒ двумя элСмСнтами Π»ΠΈΠ½ΠΈΠΉ мСньшС Π·Π°Ρ€Π°Π½Π΅Π΅ Π·Π°Π΄Π°Π½Π½ΠΎΠ³ΠΎ ΠΏΠΎΡ€ΠΎΠ³Π°; 2) эти элСмСнты Π»ΠΈΠ½ΠΈΠΉ ΠΏΠ΅Ρ€Π΅ΠΊΡ€Ρ‹Π²Π°ΡŽΡ‚ΡΡ ΠΏΠΎ Π²Π΅Ρ€Ρ‚ΠΈΠΊΠ°Π»ΠΈ. Если нСкоторая ΠΏΠ°Ρ€Π° элСмСнтов Π»ΠΈΠ½ΠΈΠΈ удовлСтворяСт ΠΎΠ±ΠΎΠΈΠΌ этим условиям, Ρ‚ΠΎ ΡΡ‚ΠΈ элСмСнты ΡΡ‡ΠΈΡ‚Π°ΡŽΡ‚ΡΡ Π±Π»ΠΈΠ·ΠΊΠΈΠΌΠΈ. Π’ Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Π΅ выполнСния этой ΠΏΡ€ΠΎΡ†Π΅Π΄ΡƒΡ€Ρ‹ Π²Ρ‹Π΄Π΅Π»ΡΡŽΡ‚ΡΡ кластСры Π»ΠΈΠ½Π΅ΠΉΠ½Ρ‹Ρ… Ρ„Ρ€Π°Π³ΠΌΠ΅Π½Ρ‚ΠΎΠ².

ΠžΡΠΎΠ±Π΅Π½Π½ΠΎΡΡ‚ΡŒ Π΄Ρ€ΡƒΠ³ΠΎΠ³ΠΎ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ° выдСлСния ΠΏΡ€ΡΠΌΠΎΡƒΠ³ΠΎΠ»ΡŒΠ½Ρ‹Ρ… Π±Π»ΠΎΠΊΠΎΠ², ΠΎΠ³Ρ€Π°Π½ΠΈΡ‡Π΅Π½Π½Ρ‹Ρ… Π³ΠΎΡ€ΠΈΠ·ΠΎΠ½Ρ‚Π°Π»ΡŒΠ½Ρ‹ΠΌΠΈ ΠΈ Π²Π΅Ρ€Ρ‚ΠΈΠΊΠ°Π»ΡŒΠ½Ρ‹ΠΌΠΈ линиями состоит Π² Ρ‚ΠΎΠΌ, Ρ‡Ρ‚ΠΎ сначала посрСдством скСлСтизации изобраТСния находятся Ρ‚ΠΎΡ‡ΠΊΠΈ пСрСсСчСния Π»ΠΈΠ½ΠΈΠΉ, Π° Π·Π°Ρ‚Π΅ΠΌ провСряСтся Π½Π°Π»ΠΈΡ‡ΠΈΠ΅ самих Π»ΠΈΠ½ΠΈΠΉ[12]. БрСдствами выдСлСния тСкстовых Π±Π»ΠΎΠΊΠΎΠ² ΠΈ ΠΎΠ±Ρ€Π°Π±ΠΎΡ‚ΠΊΠΈ Ρ‚Π°Π±Π»ΠΈΡ† располагаСт Ρ‚Π°ΠΊΠΆΠ΅ систСма ExpertVision[1].

* * *.

Π˜ΡΡ‚ΠΎΡ€ΠΈΠΊΠ°ΠΌΠΈ-исслСдоватСлями Π·Π° ΠΏΠΎΡΠ»Π΅Π΄Π½ΠΈΠ΅ Π³ΠΎΠ΄Ρ‹ Π½Π°ΠΊΠΎΠΏΠ»Π΅Π½ ΠΎΠΏΡ€Π΅Π΄Π΅Π»Π΅Π½Π½Ρ‹ΠΉ ΠΎΠΏΡ‹Ρ‚ ΠΏΠΎ Π°Π²Ρ‚ΠΎΠΌΠ°Ρ‚ΠΈΠ·ΠΈΡ€ΠΎΠ²Π°Π½Π½ΠΎΠΌΡƒ Π²Π²ΠΎΠ΄Ρƒ Π΄ΠΎΠΊΡƒΠΌΠ΅Π½Ρ‚ΠΎΠ² слоТной сруктуруры Π² ΠΊΠΎΠΌΠΏΡŒΡŽΡ‚Π΅Ρ€ с ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Π½ΠΈΠ΅ΠΌ Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹Ρ… OCR-ΠΏΠ°ΠΊΠ΅Ρ‚ΠΎΠ². Π’Π°ΠΊ, Π² Ρ€ΡΠ΄Π΅ Ρ€Π°Π±ΠΎΡ‚ ΠΏΡ€ΠΈΠ²Π΅Π΄Π΅Π½Ρ‹ ΠΏΡ€ΠΈΠΌΠ΅Ρ€Ρ‹ распознавания отсканированных историчСских Π΄ΠΎΠΊΡƒΠΌΠ΅Π½Ρ‚ΠΎΠ², ΠΏΡ€Π΅Π΄ΡΡ‚Π°Π²Π»ΡΡŽΡ‰ΠΈΡ… собой Ρ‚Π°Π±Π»ΠΈΡ†Ρ‹ Ρ€Π°Π·Π»ΠΈΡ‡Π½ΠΎΠΉ структуры. Π’ ΡΡ‚Π°Ρ‚ΡŒΠ΅ Π“. Π’ΠΎΡ€Π²Π°Π»ΡŒΠ΄ΡΠ΅Π½Π° рассмотрСны Ρ‡Π΅Ρ‚Ρ‹Ρ€Π΅ ΠΏΡ€ΠΈΠΌΠ΅Ρ€Π° распознавания Π΄ΠΎΠΊΡƒΠΌΠ΅Π½Ρ‚ΠΎΠ², ΠΈΠΌΠ΅ΡŽΡ‰ΠΈΡ… Ρ‚Π°Π±Π»ΠΈΡ‡Π½ΡƒΡŽ структуру с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ OCR-систСмы Omnipage Professional[14]. На Ρ€ΠΈΡ. 1a этой ΡΡ‚Π°Ρ‚ΡŒΠΈ ΠΏΡ€ΠΈΠ²Π΅Π΄Π΅Π½Π° копия листа Π°Ρ€Ρ…ΠΈΠ²Π½ΠΎΠΉ ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΠΈ, содСрТащСго записи ΠΎ Ρ€ΠΎΠΆΠ΄Π΅Π½ΠΈΠΈ (ΠΎΡ‚ΠΌΠ΅Ρ‚ΠΈΠΌ, Ρ‡Ρ‚ΠΎ Π² Ρ‚Π°Π±Π»ΠΈΡ†Π΅ отсутствуСт Ρ€Π°Π·Π³Ρ€Π°Ρ„ΠΊΠ°), Π° Π½Π° Ρ€ΠΈΡ. 1b — Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚ распознавания. Π’ Ρ€Π°Π±ΠΎΡ‚Π΅ ΠΎΡ‚ΠΌΠ΅Ρ‡Π΅Π½ΠΎ, Ρ‡Ρ‚ΠΎ ΠΏΡ€ΠΈ ΠΎΠ±Ρ€Π°Π±ΠΎΡ‚ΠΊΠ΅ Π΄ΠΎΠΊΡƒΠΌΠ΅Π½Ρ‚ΠΎΠ² ΡƒΠΊΠ°Π·Π°Π½Π½ΠΎΠ³ΠΎ Ρ‚ΠΈΠΏΠ° Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚ ΠΌΠΎΠΆΠ΅Ρ‚ Π±Ρ‹Ρ‚ΡŒ ΠΈΠ½Ρ‚Π΅Ρ€ΠΏΡ€Π΅Ρ‚ΠΈΡ€ΠΎΠ²Π°Π½ Π² ΠΎΡ‚сутствиС ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΠΈ принадлСТности Π΄Π°Π½Π½Ρ‹Ρ… ΠΊ ΠΎΠΏΡ€Π΅Π΄Π΅Π»Π΅Π½Π½ΠΎΠΉ ΠΊΠΎΠ»ΠΎΠ½ΠΊΠ΅ Ρ‚Π°Π±Π»ΠΈΡ†Ρ‹, поэтому Π°Π²Ρ‚ΠΎΡ€ΠΎΠΌ Π½Π΅ ΠΏΡ€Π΅Π΄ΠΏΡ€ΠΈΠ½ΠΈΠΌΠ°Π»ΠΈΡΡŒ ΠΊΠ°ΠΊΠΈΠ΅-Π»ΠΈΠ±ΠΎ ΠΌΠ΅Ρ€Ρ‹ для сохранСния этой ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΠΈ ΠΏΡ€ΠΈ распознавании. Π’ Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Π΅ Π² Π²Ρ‹Ρ…ΠΎΠ΄Π½ΠΎΠΌ Π΄ΠΎΠΊΡƒΠΌΠ΅Π½Ρ‚Π΅ табличная структура Π΄Π°Π½Π½Ρ‹Ρ… Π½Π°Ρ€ΡƒΡˆΠ΅Π½Π°. На Ρ€ΠΈΡ. 2a этой ΡΡ‚Π°Ρ‚ΡŒΠΈ ΠΏΡ€ΠΈΠ²Π΅Π΄Π΅Π½ΠΎ ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½ΠΈΠ΅ списка эмигрантов. Π Π°Π·Π΄Π΅Π»ΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹Π΅ Π»ΠΈΠ½ΠΈΠΈ ΠΌΠ΅ΠΆΠ΄Ρƒ ΠΊΠΎΠ»ΠΎΠ½ΠΊΠ°ΠΌΠΈ ΠΈ ΡΡ‚Ρ€ΠΎΠΊΠ°ΠΌΠΈ Π² ΡΡ‚ΠΎΠΌ исходном Π΄ΠΎΠΊΡƒΠΌΠ΅Π½Ρ‚Π΅ Ρ‚Π°ΠΊΠΆΠ΅ ΠΎΡ‚ΡΡƒΡ‚ΡΡ‚Π²ΡƒΡŽΡ‚. Автор ΠΎΡ‚ΠΌΠ΅Ρ‡Π°Π΅Ρ‚, Ρ‡Ρ‚ΠΎ Π² ΡΡ‚ΠΎΠΌ ΠΏΡ€ΠΈΠΌΠ΅Ρ€Π΅ Ρ„ΠΎΡ€ΠΌΠ°Ρ‚ Π΄ΠΎΠΊΡƒΠΌΠ΅Π½Ρ‚Π° Π±ΠΎΠ»Π΅Π΅ Π²Π°ΠΆΠ΅Π½ для Π΅Π³ΠΎ понимания, ΠΏΠΎΡΠΊΠΎΠ»ΡŒΠΊΡƒ Π² ΠΎΠ΄Π½ΠΎΠΌ ΠΈΠ· ΡΡ‚ΠΎΠ»Π±Ρ†ΠΎΠ² Ρ‚Π°Π±Π»ΠΈΡ†Ρ‹ содСрТится информация ΠΎ ΠΏΡƒΠ½ΠΊΡ‚Π΅ назначСния ΠΈ ΡΡ‚оимости ΠΏΡ€ΠΎΠ΅Π·Π΄Π°, располоТСнная Π² Π΄Π²ΡƒΡ… смСТных строках ΠΈ ΠΎΡ‚носящаяся Π½Π΅ ΠΊ ΠΎΡ‚Π΄Π΅Π»ΡŒΠ½Ρ‹ΠΌ эмигрантам, Π° ΠΊ ΡΠ΅ΠΌΡŒΡΠΌ. ΠžΡ‚ΠΌΠ΅Ρ‡Π°Π΅Ρ‚ΡΡ, Ρ‡Ρ‚ΠΎ систСма Omnipage Π² Ρ†Π΅Π»ΠΎΠΌ способна ΠΏΡ€Π°Π²ΠΈΠ»ΡŒΠ½ΠΎ Ρ€Π°ΡΠΏΡ€Π΅Π΄Π΅Π»ΠΈΡ‚ΡŒ ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΡŽ ΠΏΠΎ ΠΊΠΎΠ»ΠΎΠ½ΠΊΠ°ΠΌ, вставляя Π² Π½ΡƒΠΆΠ½Ρ‹Π΅ мСста строки Π·Π½Π°ΠΊΠΈ табуляции, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ ΠΌΠΎΠ³ΡƒΡ‚ Π±Ρ‹Ρ‚ΡŒ ΠΎΠ±Ρ€Π°Π±ΠΎΡ‚Π°Π½Ρ‹ тСкстовым процСссором. Как Π²ΠΈΠ΄Π½ΠΎ ΠΈΠ· Ρ€ΠΈΡ. 2b, Π² Π²Ρ‹Ρ…ΠΎΠ΄Π½ΠΎΠΌ Π΄ΠΎΠΊΡƒΠΌΠ΅Π½Ρ‚Π΅ табличная структура Π²Ρ…ΠΎΠ΄Π½ΠΎΠ³ΠΎ Π΄ΠΎΠΊΡƒΠΌΠ΅Π½Ρ‚Π° сохранСна.

На Ρ€ΠΈΡ. 3a ΡΡ‚Π°Ρ‚ΡŒΠΈ ΠΏΡ€ΠΈΠ²Π΅Π΄Π΅Π½ΠΎ ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½ΠΈΠ΅ Π΄Ρ€ΡƒΠ³ΠΎΠ³ΠΎ списка эмигрантов, Π° Π½Π° Ρ€ΠΈΡ. 3b — Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Ρ‹ распознавания. На ΠΈΡΡ…ΠΎΠ΄Π½ΠΎΠΌ ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½ΠΈΠΈ ΠΊΠΎΠ»ΠΎΠ½ΠΊΠΈ Ρ€Π°Π·Π΄Π΅Π»Π΅Π½Ρ‹ Π²Π΅Ρ€Ρ‚ΠΈΠΊΠ°Π»ΡŒΠ½Ρ‹ΠΌΠΈ линиями, Ρ‡Ρ‚ΠΎ, ΠΏΠΎ ΠΌΠ½Π΅Π½ΠΈΡŽ Π°Π²Ρ‚ΠΎΡ€Π°, создаСт Π΄ΠΎΠΏΠΎΠ»Π½ΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹Π΅ ΠΏΡ€ΠΎΠ±Π»Π΅ΠΌΡ‹ для OCR, Π° ΠΈΠΌΠ΅Π½Π½ΠΎ, способствуСт ΠΏΠ΅Ρ€Π΅ΠΏΡƒΡ‚Ρ‹Π²Π°Π½ΠΈΡŽ символов ΠΌΠ΅ΠΆΠ΄Ρƒ ΠΊΠΎΠ»ΠΎΠ½ΠΊΠ°ΠΌΠΈ. Однако Π°Π²Ρ‚ΠΎΡ€ считаСт, Ρ‡Ρ‚ΠΎ Π² Π΄Π°Π½Π½ΠΎΠΌ случаС эта ΠΏΡ€ΠΎΠ±Π»Π΅ΠΌΠ° Π½Π΅ ΡΠ²Π»ΡΠ΅Ρ‚ся основным прСпятствиСм ΠΊ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Π½ΠΈΡŽ систСмы Omnipage. По Π΅Π³ΠΎ мнСнию, Π±ΠΎΠ»Π΅Π΅ ΡΠ΅Ρ€ΡŒΠ΅Π·Π½ΠΎΠΉ ΠΏΡ€ΠΎΠ±Π»Π΅ΠΌΠΎΠΉ являСтся Π² Π΄Π°Π½Π½ΠΎΠΌ случаС Π½Π΅ΠΏΡ€Π°Π²ΠΈΠ»ΡŒΠ½ΠΎΠ΅ распознаваниС ΠΎΡ‚Π΄Π΅Π»ΡŒΠ½Ρ‹Ρ… символов. На Ρ€ΠΈΡ. 4Π° этой ΡΡ‚Π°Ρ‚ΡŒΠΈ ΠΏΡ€ΠΈΠ²Π΅Π΄Π΅Π½ΠΎ ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½ΠΈΠ΅ страницы списка налогооблоТСния фСрмСрских хозяйств, Π° Π½Π° Ρ€ΠΈΡ. 4b — Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Ρ‹ ΠΎΠ±Ρ€Π°Π±ΠΎΡ‚ΠΊΠΈ этой страницы OCR-систСмой Omnipage. МоТно Π²ΠΈΠ΄Π΅Ρ‚ΡŒ, Ρ‡Ρ‚ΠΎ Ρ‚Π°Π±Π»ΠΈΡ†Π° Π² Π΄Π°Π½Π½ΠΎΠΌ случаС ΠΈΠΌΠ΅Π΅Ρ‚ ΡΠ»ΠΎΠΆΠ½ΡƒΡŽ ΠΈΠ΅Ρ€Π°Ρ€Ρ…ΠΈΡ‡Π΅ΡΠΊΡƒΡŽ структуру ΠΊΠ°ΠΊ ΠΏΠΎ Π²Π΅Ρ€Ρ‚ΠΈΠΊΠ°Π»ΠΈ, Ρ‚Π°ΠΊ ΠΈ ΠΏΠΎ Π³ΠΎΡ€ΠΈΠ·ΠΎΠ½Ρ‚Π°Π»ΠΈ, ΠΏΡ€ΠΈΡ‡Π΅ΠΌ ΠΊΠΎΠ»ΠΎΠ½ΠΊΠΈ Ρ€Π°Π·Π΄Π΅Π»Π΅Π½Ρ‹ Π²Π΅Ρ€Ρ‚ΠΈΠΊΠ°Π»ΡŒΠ½Ρ‹ΠΌΠΈ линиями Ρ€Π°Π·Π»ΠΈΡ‡Π½ΠΎΠΉ Ρ‚ΠΎΠ»Ρ‰ΠΈΠ½Ρ‹ ΠΈ Ρ‚ΠΈΠΏΠ° (ΠΎΠ΄ΠΈΠ½Π°Ρ€Π½Ρ‹ΠΌΠΈ ΠΈ Π΄Π²ΠΎΠΉΠ½Ρ‹ΠΌΠΈ). ΠžΡ‚ΠΌΠ΅Ρ‡Π΅Π½ΠΎ, Ρ‡Ρ‚ΠΎ Π² Π΄Π°Π½Π½ΠΎΠΌ случаС использованиС систСмы Omnipage Π½Π΅ ΠΏΠΎΠ·Π²ΠΎΠ»ΠΈΠ»ΠΎ ΠΎΠ±Π΅ΡΠΏΠ΅Ρ‡ΠΈΡ‚ΡŒ соотвСтствиС структуры Π²Ρ‹Ρ…ΠΎΠ΄Π½ΠΎΠ³ΠΎ Π΄ΠΎΠΊΡƒΠΌΠ΅Π½Ρ‚Π° структурС исходной Ρ‚Π°Π±Π»ΠΈΡ†Ρ‹. Π˜Π½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΡ часто ΠΏΠΎΠΏΠ°Π΄Π°Π΅Ρ‚ Π² Π½Π΅ΡΠΎΠΎΡ‚Π²Π΅Ρ‚ΡΡ‚Π²ΡƒΡŽΡ‰ΡƒΡŽ ΠΊΠΎΠ»ΠΎΠ½ΠΊΡƒ, лСвая ΠΊΠΎΠ»ΠΎΠ½ΠΊΠ° ΠΎΠΏΡƒΡ‰Π΅Π½Π°. Π’ Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… случаях (Π½ΠΎ Π½Π΅ Π²ΡΠ΅Π³Π΄Π°) Π²Π΅Ρ€Ρ‚ΠΈΠΊΠ°Π»ΡŒΠ½Ρ‹Π΅ Π»ΠΈΠ½ΠΈΠΈ пСрСносятся Π² Π²Ρ‹Ρ…ΠΎΠ΄Π½ΠΎΠΉ тСкстовый Ρ„Π°ΠΉΠ». Π’ Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Π΅, ΠΏΠΎ ΠΌΠ½Π΅Π½ΠΈΡŽ Π°Π²Ρ‚ΠΎΡ€Π°, для Π΄Π°Π½Π½ΠΎΠ³ΠΎ Π΄ΠΎΠΊΡƒΠΌΠ΅Π½Ρ‚Π° эффСктивнСС Π²Π²ΠΎΠ΄ΠΈΡ‚ΡŒ Π΄Π°Π½Π½Ρ‹Π΅ Π²Ρ€ΡƒΡ‡Π½ΡƒΡŽ, Ρ‡Π΅ΠΌ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ ΡΡ‚Π°Π½Π΄Π°Ρ€Ρ‚Π½ΡƒΡŽ OCR-систСму. Π’Π°ΠΊΠΆΠ΅, ΠΏΠΎ Π΅Π³ΠΎ мнСнию, ΠΌΠΎΠΆΠ½ΠΎ для Π°Π²Ρ‚ΠΎΠΌΠ°Ρ‚ΠΈΠ·ΠΈΡ€ΠΎΠ²Π°Π½Π½ΠΎΠ³ΠΎ чтСния этих Π΄ΠΎΠΊΡƒΠΌΠ΅Π½Ρ‚ΠΎΠ² ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ Π»ΡƒΡ‡ΡˆΡƒΡŽ OCR-систСму. Π’ Ρ€Π°Π±ΠΎΡ‚Π΅ Π“. Π’ΠΎΡ€Π²Π°Π»ΡŒΠ΄ΡΠ΅Π½Π°[15] описана дальнСйшая ΠΎΠ±Ρ€Π°Π±ΠΎΡ‚ΠΊΠ° Π΄ΠΎΠΊΡƒΠΌΠ΅Π½Ρ‚Π°, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΉ Π±Ρ‹Π» ΠΏΡ€ΠΈΠ²Π΅Π΄Π΅Π½ ΠΈΠΌ Ρ€Π°Π½Π΅Π΅ [16] Π² ΠΊΠ°Ρ‡Π΅ΡΡ‚Π²Π΅ ΠΏΡ€ΠΈΠΌΠ΅Ρ€Π°. Π£ΠΊΠ°Π·Π°Π½ΠΎ, Ρ‡Ρ‚ΠΎ ΠΏΡ€Π΅ΠΎΠ±Ρ€Π°Π·ΠΎΠ²Π°Π½ΠΈΠ΅ тСкстового Ρ„Π°ΠΉΠ»Π°, сформированного OCR-систСмой, Π² Ρ„Π°ΠΉΠ», ΠΏΡ€ΠΈΠ³ΠΎΠ΄Π½Ρ‹ΠΉ для Π²Π²ΠΎΠ΄Π° Π² Ρ€Π΅Π»ΡΡ†ΠΈΠΎΠ½Π½ΡƒΡŽ Π±Π°Π·Ρƒ Π΄Π°Π½Π½Ρ‹Ρ…, ΠΎΡΡƒΡ‰Π΅ΡΡ‚Π²Π»ΡΠ»ΠΎΡΡŒ ΠΏΡ€ΠΎΠ³Ρ€Π°ΠΌΠΌΠΎΠΉ, Ρ€Π°Π·Ρ€Π°Π±ΠΎΡ‚Π°Π½Π½ΠΎΠΉ для этой Ρ†Π΅Π»ΠΈ Π°Π²Ρ‚ΠΎΡ€ΠΎΠΌ. ΠžΡ‚ΠΌΠ΅Ρ‡Π΅Π½Π° ошибка Π½Π΅ΠΏΡ€Π°Π²ΠΈΠ»ΡŒΠ½ΠΎΠΉ классификации Π΄Π°Π½Π½Ρ‹Ρ… ΠΏΠΎ ΠΏΠΎΠ»ΡΠΌ Π±Π°Π·Ρ‹.

Π’ Ρ€Π°Π±ΠΎΡ‚Π΅ А. МаквСйг рассмотрСны вопросы, связанныС с Π°Π²Ρ‚ΠΎΠΌΠ°Ρ‚ΠΈΠ·ΠΈΡ€ΠΎΠ²Π°Π½Π½Ρ‹ΠΌ Ρ‡Ρ‚Π΅Π½ΠΈΠ΅ΠΌ Ρ‚Π°Π±Π»ΠΈΡ†, содСрТащих ΡΡ‚Π°Ρ‚ΠΈΡΡ‚ΠΈΡ‡Π΅ΡΠΊΡƒΡŽ ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΡŽ ΠΎ ΡΠ΅ΠΌΠ΅ΠΉΠ½ΠΎΠΌ ΠΏΠΎΠ»ΠΎΠΆΠ΅Π½ΠΈΠΈ людСй Π² Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹Ρ… Ρ€Π°ΠΉΠΎΠ½Π°Ρ… Π˜Ρ€Π»Π°Π½Π΄ΠΈΠΈ Π² XIX—XX Π²Π². [17]. ΠžΠ±Ρ€Π°Π±ΠΎΡ‚ΠΊΠ° ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½ΠΈΠΉ Π²Ρ‹ΠΏΠΎΠ»Π½ΡΠ»Π°ΡΡŒ OCR-систСмой ProLector. ΠŸΠΎΠ»ΡƒΡ‡Π΅Π½Π½Ρ‹ΠΉ Π² Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Π΅ Ρ€Π°Π±ΠΎΡ‚Ρ‹ OCR тСкстовый Ρ„Π°ΠΉΠ» подвСргался Π΄ΠΎΠΏΠΎΠ»Π½ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΠΉ ΠΏΡ€ΠΎΠ³Ρ€Π°ΠΌΠΌΠ½ΠΎΠΉ ΠΎΠ±Ρ€Π°Π±ΠΎΡ‚ΠΊΠ΅ с Ρ†Π΅Π»ΡŒΡŽ выявлСния ошибок (такая ΠΎΠ±Ρ€Π°Π±ΠΎΡ‚ΠΊΠ° оказалась Π²ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎΠΉ, ΠΏΠΎΡΠΊΠΎΠ»ΡŒΠΊΡƒ Ρ‚Π°Π±Π»ΠΈΡ†Ρ‹ содСрТали ΠΊΠΎΠ½Ρ‚Ρ€ΠΎΠ»ΡŒΠ½Ρ‹Π΅ суммы), Π·Π°Ρ‚Π΅ΠΌ эти ошибки ΠΈΡΠΏΡ€Π°Π²Π»ΡΠ»ΠΈΡΡŒ Π²Ρ€ΡƒΡ‡Π½ΡƒΡŽ ΠΈ ΠΎΡΡƒΡ‰Π΅ΡΡ‚влялся Π²Π²ΠΎΠ΄ исправлСнной ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΠΈ Π² Π±Π°Π·Ρƒ Π΄Π°Π½Π½Ρ‹Ρ…. Π˜ΡΡ…ΠΎΠ΄Π½Ρ‹Π΅ Ρ‚Π°Π±Π»ΠΈΡ†Ρ‹ ΠΈΠΌΠ΅ΡŽΡ‚ ΡΠ»ΠΎΠΆΠ½ΡƒΡŽ ΠΈΠ΅Ρ€Π°Ρ€Ρ…ΠΈΡ‡Π΅ΡΠΊΡƒΡŽ структуру, столбцы этих Ρ‚Π°Π±Π»ΠΈΡ† ΠΈΠΌΠ΅ΡŽΡ‚ Ρ€Π°Π·Π»ΠΈΡ‡Π½ΡƒΡŽ ΡˆΠΈΡ€ΠΈΠ½Ρƒ ΠΈ Ρ€Π°Π·Π΄Π΅Π»Π΅Π½Ρ‹ Π²Π΅Ρ€Ρ‚ΠΈΠΊΠ°Π»ΡŒΠ½Ρ‹ΠΌΠΈ линиями. Π‘Ρ‚Ρ€ΠΎΠΊΠΈ, содСрТащиС ΠΊΠΎΠ½Ρ‚Ρ€ΠΎΠ»ΡŒΠ½Ρ‹Π΅ суммы, Π²Ρ‹Π΄Π΅Π»Π΅Π½Ρ‹ Π³ΠΎΡ€ΠΈΠ·ΠΎΠ½Ρ‚Π°Π»ΡŒΠ½Ρ‹ΠΌΠΈ линиями. Автор ΠΎΡ‚ΠΌΠ΅Ρ‡Π°Π΅Ρ‚, Ρ‡Ρ‚ΠΎ Ρ€Π°Π·Π΄Π΅Π»ΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹Π΅ Π»ΠΈΠ½ΠΈΠΈ ΠΈΠΌΠ΅Π»ΠΈ Π½Π΅ΠΎΠ΄ΠΈΠ½Π°ΠΊΠΎΠ²ΡƒΡŽ Ρ‚ΠΎΠ»Ρ‰ΠΈΠ½Ρƒ, Ρ‡Ρ‚ΠΎ ΠΏΡ€ΠΈΠ²ΠΎΠ΄ΠΈΠ»ΠΎ ΠΊ Π΄ΠΎΠΏΠΎΠ»Π½ΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹ΠΌ затруднСниям ΠΏΡ€ΠΈ ΠΈΡ… ΡƒΠ΄Π°Π»Π΅Π½ΠΈΠΈ срСдствами систСмы ProLector: послС удалСния Π»ΠΈΠ½ΠΈΠΉ ΠΎΡΡ‚Π°Π²Π°Π»ΠΈΡΡŒ ΠΏΠΎΠΌΠ΅Ρ…ΠΈ. Автор ΡƒΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚ Ρ‚Π°ΠΊΠΆΠ΅ Π½Π° ΠΏΡ€ΠΎΠ±Π»Π΅ΠΌΡ‹, связанныС с ΡΠΎΡ…Ρ€Π°Π½Π΅Π½ΠΈΠ΅ΠΌ структуры Ρ‚Π°Π±Π»ΠΈΡ†Ρ‹ Π² Ρ‚Скстовом Ρ„Π°ΠΉΠ»Π΅, сформированном OCR-систСмой.

Π’ Ρ€Π°Π±ΠΎΡ‚Π΅ М. ОлсСна рассмотрСно ΠΏΡ€ΠΈΠΌΠ΅Π½Π΅Π½ΠΈΠ΅ OCR ΠΊ ΠΎΠ±Ρ€Π°Π±ΠΎΡ‚ΠΊΠ΅ списка налогооблоТСния Π½Π°Ρ‡Π°Π»Π° XX Π²Π΅ΠΊΠ° Π² ΠΎΠ΄Π½ΠΎΠΌ ΠΈΠ· Π³ΠΎΡ€ΠΎΠ΄ΠΎΠ² ΠΏΡ€ΠΎΠ²ΠΈΠ½Ρ†ΠΈΠΈ Нью-Брунсвик (Канада) [18]. На Ρ€ΠΈΡ. 2 этой ΡΡ‚Π°Ρ‚ΡŒΠΈ ΠΏΡ€ΠΈΠ²Π΅Π΄Π΅Π½ΠΎ ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½ΠΈΠ΅ страницы исходного Π΄ΠΎΠΊΡƒΠΌΠ΅Π½Ρ‚Π°, Π° Π² Ρ‚Π°Π±Π». 3 — Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Ρ‹ ΠΎΠ±Ρ€Π°Π±ΠΎΡ‚ΠΊΠΈ изобраТСния систСмой Kurzweil (послС Π΄ΠΎΠΏΠΎΠ»Π½ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΠΉ ΠΊΠΎΡ€Ρ€Π΅ΠΊΡ‚ΠΈΡ€ΠΎΠ²ΠΊΠΈ). Как Π²ΠΈΠ΄Π½ΠΎ ΠΈΠ· Ρ€ΠΈΡ. 2, исходная Ρ‚Π°Π±Π»ΠΈΡ†Π° ΠΈΠΌΠ΅Π΅Ρ‚ ΠΏΡ€ΠΎΡΡ‚ΡƒΡŽ структуру, ΠΊΠΎΠ»ΠΎΠ½ΠΊΠΈ Π΅Π΅ Ρ€Π°Π·Π΄Π΅Π»Π΅Π½Ρ‹ Π²Π΅Ρ€Ρ‚ΠΈΠΊΠ°Π»ΡŒΠ½Ρ‹ΠΌΠΈ линиями, ΠΈΠΌΠ΅ΡŽΡ‰ΠΈΠΌΠΈ многочислСнныС Ρ€Π°Π·Ρ€Ρ‹Π²Ρ‹. Автор ΠΎΡ‚ΠΌΠ΅Ρ‡Π°Π΅Ρ‚, Ρ‡Ρ‚ΠΎ OCR-систСма Kurzweil испытываСт Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ трудности ΠΏΡ€ΠΈ ΠΎΠ±Ρ€Π°Π±ΠΎΡ‚ΠΊΠ΅ Π²Π΅Ρ€Ρ‚ΠΈΠΊΠ°Π»ΡŒΠ½Ρ‹Ρ… Π»ΠΈΠ½ΠΈΠΉ, вслСдствиС Ρ‡Π΅Π³ΠΎ Π²ΠΎΠ·Π½ΠΈΠΊΠ°ΡŽΡ‚ ошибки, связанныС с Π½Π΅ΠΏΡ€Π°Π²ΠΈΠ»ΡŒΠ½Ρ‹ΠΌ Ρ€Π°Π·ΠΌΠ΅Ρ‰Π΅Π½ΠΈΠ΅ΠΌ Π΄Π°Π½Π½Ρ‹Ρ… Π² ΠΊΠΎΠ»ΠΎΠ½ΠΊΠ°Ρ….

Авторы всСх Π²Ρ‹ΡˆΠ΅ΡƒΠΏΠΎΠΌΡΠ½ΡƒΡ‚Ρ‹Ρ… Ρ€Π°Π±ΠΎΡ‚ ΠΏΠΎ ΠΏΡ€ΠΈΠΌΠ΅Π½Π΅Π½ΠΈΡŽ OCR ΠΏΡ€ΠΈ Π²Ρ‹ΠΏΠΎΠ»Π½Π΅Π½ΠΈΠΈ историчСских ΠΏΡ€ΠΎΠ΅ΠΊΡ‚ΠΎΠ² ΠΎΡ‚ΠΌΠ΅Ρ‡Π°ΡŽΡ‚, Ρ‡Ρ‚ΠΎ использованиС OCR-систСм для Π°Π²Ρ‚ΠΎΠΌΠ°Ρ‚ΠΈΠ·ΠΈΡ€ΠΎΠ²Π°Π½Π½ΠΎΠ³ΠΎ Π²Π²ΠΎΠ΄Π° Π² Π­Π’Πœ Π΄ΠΎΠΊΡƒΠΌΠ΅Π½Ρ‚ΠΎΠ², содСрТащих Ρ‚Π°Π±Π»ΠΈΡ†Ρ‹, ΠΏΠΎΠ·Π²ΠΎΠ»ΠΈΠ»ΠΎ Π·Π½Π°Ρ‡ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ ΡΡΠΊΠΎΠ½ΠΎΠΌΠΈΡ‚ΡŒ врСмя ΠΏΠΎ ΡΡ€Π°Π²Π½Π΅Π½ΠΈΡŽ с Ρ€ΡƒΡ‡Π½Ρ‹ΠΌ Π²Π²ΠΎΠ΄ΠΎΠΌ Π΄Π°Π½Π½Ρ‹Ρ… Π² Π­Π’Πœ (ΠΏΠ΅Ρ€Π΅Π½Π°Π±ΠΈΠ²ΠΊΠΎΠΉ). ВмСстС с Ρ‚Π΅ΠΌ, Π·Π½Π°Ρ‡ΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹Π΅ усилия ΠΏΠΎΡ‚Ρ€Π΅Π±ΠΎΠ²Π°Π»ΠΈΡΡŒ для поиска ΠΈ ΠΈΡΠΏΡ€Π°Π²Π»Π΅Π½ΠΈΡ ошибок. Одной ΠΈΠ· ΠΏΡ€ΠΈΡ‡ΠΈΠ½ появлСния ошибок явилось отсутствиС достаточно ΠΌΠΎΡ‰Π½Ρ‹Ρ… срСдств описания ΠΈ Ρ€Π°ΡΠΏΠΎΠ·Π½Π°Π²Π°Π½ΠΈΡ структуры Ρ‚Π°Π±Π»ΠΈΡ† Π² ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Π½Π½Ρ‹Ρ… OCRсистСмах.

МодСли описания структуры тСкстовых ΠΈ Ρ‚Π°Π±Π»ΠΈΡ‡Π½Ρ‹Ρ… Π΄ΠΎΠΊΡƒΠΌΠ΅Π½Ρ‚ΠΎΠ²

МодСль описания структуры тСкстовых Π΄ΠΎΠΊΡƒΠΌΠ΅Π½Ρ‚ΠΎΠ² — Π΄Π΅Ρ€Π΅Π²ΠΎ рСгулярного ΠΎΡ€Ρ‚ΠΎΠ³ΠΎΠ½Π°Π»ΡŒΠ½ΠΎΠ³ΠΎ чСрСдования Ρ€Π°Π·Π±ΠΈΠ΅Π½ΠΈΠΉ.

Π’Ρ€Π°Π΄ΠΈΡ†ΠΈΠΎΠ½Π½ΠΎΠΉ для тСкстовых Π΄ΠΎΠΊΡƒΠΌΠ΅Π½Ρ‚ΠΎΠ² являСтся ΡΠ»Π΅Π΄ΡƒΡŽΡ‰Π°Ρ дрСвовидная структура листа: лист Ρ€Π°Π·Π±ΠΈΡ‚ Π½Π° Ρ‚СкстовыС Π±Π»ΠΎΠΊΠΈ, Π½Π°Π·Ρ‹Π²Π°Π΅ΠΌΡ‹Π΅ ΠΊΠΎΠ»ΠΎΠ½ΠΊΠ°ΠΌΠΈ, ΠΊΠΎΠ»ΠΎΠ½ΠΊΠΈ Ρ€Π°Π·Π±ΠΈΡ‚Ρ‹ Π½Π° ΠΏΠ°Ρ€Π°Π³Ρ€Π°Ρ„Ρ‹, ΠΏΠ°Ρ€Π°Π³Ρ€Π°Ρ„Ρ‹ состоят ΠΈΠ· ΡΠ»ΠΎΠ², слова — ΠΈΠ· ΡΠΈΠΌΠ²ΠΎΠ»ΠΎΠ², символы — ΠΈΠ· ΠΎΠ΄Π½ΠΎΠΉ ΠΈΠ»ΠΈ Π½Π΅ΡΠΊΠΎΠ»ΡŒΠΊΠΈΡ… ΠΊΠΎΠΌΠΏΠΎΠ½Π΅Π½Ρ‚ связности.

Π˜ΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅ΠΌΠ°Ρ Π² ΡΠΈΡΡ‚Π΅ΠΌΠ΅ CRIPT структура описания листа прСдставляСт собой ΠΎΠ±ΠΎΠ±Ρ‰Π΅Π½ΠΈΠ΅ Ρ‚Ρ€Π°Π΄ΠΈΡ†ΠΈΠΎΠ½Π½ΠΎΠΉ Π΄Ρ€Π΅Π²ΠΎΠ²ΠΈΠ΄Π½ΠΎΠΉ схСмы. БущСствСнными ΡΠ²Π»ΡΡŽΡ‚ΡΡ ΡΠ»Π΅Π΄ΡƒΡŽΡ‰ΠΈΠ΅ особСнности Ρ€Π΅Π°Π»ΡŒΠ½ΠΎΠ³ΠΎ Π³Ρ€Π°Ρ„Π° описания Ρ„ΠΎΡ€ΠΌΠ°Ρ‚Π° листа:

.

Рис. 2. Π”Π΅Ρ€Π΅Π²ΠΎ ΠΊΠΎΠ»ΠΎΠ½ΠΎΠΊ, ΡΠΎΠΎΡ‚Π²Π΅Ρ‚ΡΡ‚Π²ΡƒΡŽΡ‰Π΅Π΅ структурС листа, схСматичСски ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½Π½ΠΎΠ³ΠΎ Π½Π° Ρ€ΠΈΡ. 1a.

Для ΠΊΠ°ΠΆΠ΄ΠΎΠ³ΠΎ Π½Π΅Ρ‚Π΅Ρ€ΠΌΠΈΠ½Π°Π»ΡŒΠ½ΠΎΠ³ΠΎ ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Π° (Ρ‚.Π΅. ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Π°, ΠΈΠΌΠ΅ΡŽΡ‰Π΅Π³ΠΎ «Π΄ΠΎΡ‡Π΅Ρ€Π΅ΠΉ »), сохраняСтся информация ΠΎΠ± ΠΎΡ‚Π½ΠΎΡΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΠΌ Π²Π·Π°ΠΈΠΌΠ½ΠΎΠΌ располоТСнии Π΅Π³ΠΎ Π΄ΠΎΡ‡Π΅Ρ€Π΅ΠΉ Π½Π° Π»ΠΈΡΡ‚Π΅, Ρ‡Ρ‚ΠΎ позволяСт Π² ΡΠ»ΡƒΡ‡Π°Π΅ нСобходимости ΡΠΎΡ…Ρ€Π°Π½ΠΈΡ‚ΡŒ Π² Π²Ρ‹Ρ…ΠΎΠ΄Π½ΠΎΠΌ Π΄ΠΎΠΊΡƒΠΌΠ΅Π½Ρ‚Π΅ Ρ‚ΠΎ ΠΆΠ΅ Π²Π·Π°ΠΈΠΌΠ½ΠΎΠ΅ располоТСниС структурных элСмСнтов тСкста Π² ΠΏΡ€Π΅Π΄Π΅Π»Π°Ρ… иСрархичСского Π±Π»ΠΎΠΊΠ° Π±ΠΎΠ»Π΅Π΅ высокого уровня, Ρ‡Ρ‚ΠΎ ΠΈ Π² ΠΈΡΡ…ΠΎΠ΄Π½ΠΎΠΌ Π΄ΠΎΠΊΡƒΠΌΠ΅Π½Ρ‚Π΅. ΠŸΡ€Π΅Π΄ΡƒΡΠΌΠΎΡ‚Ρ€Π΅Π½Ρ‹, Π² Ρ‡Π°ΡΡ‚ности, ΡΠ»Π΅Π΄ΡƒΡŽΡ‰ΠΈΠ΅ Π²Π°Ρ€ΠΈΠ°Π½Ρ‚Ρ‹ Π²Π·Π°ΠΈΠΌΠ½ΠΎΠ³ΠΎ располоТСния ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ΠΎΠ²: упорядочСниС ΠΏΠΎ Π³ΠΎΡ€ΠΈΠ·ΠΎΠ½Ρ‚Π°Π»ΠΈ, упорядочСниС ΠΏΠΎ Π²Π΅Ρ€Ρ‚ΠΈΠΊΠ°Π»ΠΈ, ΠΌΠ°Ρ‚Ρ€ΠΈΡ‡Π½Ρ‹ΠΉ порядок, индСксный порядок (ΠΎΠ΄Π½Π° ΠΈΠ· Π΄ΠΎΡ‡Π΅Ρ€Π΅ΠΉ являСтся индСксом Π΄Ρ€ΡƒΠ³ΠΎΠΉ), нСупорядочСнноС располоТСниС.

.

Рис. 1 ΠŸΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½Ρ‹Π΅ шаги расщСплСния листа Π½Π° ΠΊΠΎΠ»ΠΎΠ½ΠΊΠΈ ΠΏΠΎ ΠΌΠ΅Ρ‚ΠΎΠ΄Ρƒ «ΡΠ²Π΅Ρ€Ρ…Ρƒ Π²Π½ΠΈΠ· «.

Колонки ΠΎΠ±Ρ€Π°Π·ΡƒΡŽΡ‚ ΠΈΠ΅Ρ€Π°Ρ€Ρ…ΠΈΡ‡Π΅ΡΠΊΡƒΡŽ структуру, Ρ‚. Π΅. каТдая ΠΊΠΎΠ»ΠΎΠ½ΠΊΠ° ΠΌΠΎΠΆΠ΅Ρ‚ Π±Ρ‹Ρ‚ΡŒ Ρ€Π°Π·Π±ΠΈΡ‚Π° Π½Π° ΠΏΠΎΠ΄ΠΊΠΎΠ»ΠΎΠ½ΠΊΠΈ, ΠΏΡ€ΠΈΡ‡Π΅ΠΌ Π½Π° ΡΠΎΡΠ΅Π΄Π½ΠΈΡ… уровнях ориСнтация Ρ€Π°Π·Π΄Π΅Π»ΡΡŽΡ‰ΠΈΡ… ΠΊΠΎΠ»ΠΎΠ½ΠΊΠΈ Π»ΠΈΠ½ΠΈΠΉ мСняСтся Π½Π° ΠΎΡ€Ρ‚ΠΎΠ³ΠΎΠ½Π°Π»ΡŒΠ½ΡƒΡŽ (Ρ‚Π°ΠΊ, Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, Ссли Π½Π° Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠΌ ΡƒΡ€ΠΎΠ²Π½Π΅ ΠΊΠΎΠ»ΠΎΠ½ΠΊΠΈ ΠΌΠΎΠ³ΡƒΡ‚ Π±Ρ‹Ρ‚ΡŒ Ρ€Π°Π·Π΄Π΅Π»Π΅Π½Ρ‹ горизонталями, Ρ‚ΠΎ Π½Π° ΡΠ»Π΅Π΄ΡƒΡŽΡ‰Π΅ΠΌ ΡƒΡ€ΠΎΠ²Π½Π΅ ΠΎΠ½ΠΈ Ρ€Π°Π·Π΄Π΅Π»ΡΡŽΡ‚ΡΡ вСртикалями). ИмСнно поэтому такая модСль описания структуры Π΄ΠΎΠΊΡƒΠΌΠ΅Π½Ρ‚ΠΎΠ² Π±Ρ‹Π»Π° Π½Π°Π·Π²Π°Π½Π° Π΄Π΅Ρ€Π΅Π²ΠΎΠΌ рСгулярного ΠΎΡ€Ρ‚ΠΎΠ³ΠΎΠ½Π°Π»ΡŒΠ½ΠΎΠ³ΠΎ чСрСдования Ρ€Π°Π·Π±ΠΈΠ΅Π½ΠΈΠΉ. На Ρ€ΠΈΡ. 1 ΠΏΡ€ΠΈΠ²Π΅Π΄Π΅Π½Π° схСма, ΠΏΠΎΡΡΠ½ΡΡŽΡ‰Π°Ρ Π΄Π°Π½Π½ΡƒΡŽ модСль. На Ρ€ΠΈΡ. 1, a ΡΡ…СматичСски ΠΏΠΎΠΊΠ°Π·Π°Π½ΠΎ располоТСниС ΠΊΠΎΠ»ΠΎΠ½ΠΎΠΊ Π½Π° Π»ΠΈΡΡ‚Π΅, Π½Π° Ρ€ΠΈΡ. 1, b-d — ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½Ρ‹Π΅ шаги расщСплСния, Π½Π° Ρ€ΠΈΡ. 2 — построСнноС «Π΄Π΅Ρ€Π΅Π²ΠΎ рСгулярного ΠΎΡ€Ρ‚ΠΎΠ³ΠΎΠ½Π°Π»ΡŒΠ½ΠΎΠ³ΠΎ чСрСдования Ρ€Π°Π·Π±ΠΈΠ΅Π½ΠΈΠΉ «.

.

Рис. 3. ΠŸΡ€ΠΈΠΌΠ΅Ρ€Ρ‹ Ρ‚Π°Π±Π»ΠΈΡ† иСрархичСской структуры: a) Π’Π°Π±Π»ΠΈΡ†Π° с Π³ΠΎΡ€ΠΈΠ·ΠΎΠ½Ρ‚Π°Π»ΡŒΠ½ΠΎΠΉ ΠΈΠ΅Ρ€Π°Ρ€Ρ…ΠΈΠ΅ΠΉ; b) Π’Π°Π±Π»ΠΈΡ†Π° с Π²Π΅Ρ€Ρ‚ΠΈΠΊΠ°Π»ΡŒΠ½ΠΎΠΉ ΠΈΠ΅Ρ€Π°Ρ€Ρ…ΠΈΠ΅ΠΉ; c) Π’Π°Π±Π»ΠΈΡ†Π° с Π³ΠΎΡ€ΠΈΠ·ΠΎΠ½Ρ‚Π°Π»ΡŒΠ½ΠΎΠΉ ΠΈ Π²Π΅Ρ€Ρ‚ΠΈΠΊΠ°Π»ΡŒΠ½ΠΎΠΉ ΠΈΠ΅Ρ€Π°Ρ€Ρ…ΠΈΠ΅ΠΉ; d) Π’Π°Π±Π»ΠΈΡ†Π° с Π΄Π²ΡƒΠΌΡ уровнями Π³ΠΎΡ€ΠΈΠ·ΠΎΠ½Ρ‚Π°Π»ΡŒΠ½ΠΎΠΉ ΠΈΠ΅Ρ€Π°Ρ€Ρ…ΠΈΠΈ.

Π‘Ρ‚Ρ€ΠΎΠΊΠΈ ΠΌΠΎΠ³ΡƒΡ‚ Π±Ρ‹Ρ‚ΡŒ Ρ€Π°Π·Π±ΠΈΡ‚Ρ‹ Π½Π° ΠΏΠΎΠ΄ΡΡ‚Ρ€ΠΎΠΊΠΈ, Ρ€Π°Π·Π»ΠΈΡ‡Π°ΡŽΡ‰ΠΈΠ΅ΡΡ ΠΊΠ°ΠΊΠΈΠΌΠΈ-Ρ‚ΠΎ свойствами (Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, ΡˆΡ€ΠΈΡ„Ρ‚ΠΎΠΌ).

ΠžΠ±ΡŠΠ΅ΠΊΡ‚Ρ‹ иСрархичСской структуры ΠΌΠΎΠ³ΡƒΡ‚ ΠΈΠΌΠ΅Ρ‚ΡŒ Π΄ΠΎΡ‡Π΅Ρ€Π΅ΠΉ ΠΊΠ°ΠΊ Π½Π° ΡΠ»Π΅Π΄ΡƒΡŽΡ‰Π΅ΠΌ ΠΏΠΎ ΠΏΠΎΡ€ΡΠ΄ΠΊΡƒ иСрархичСском ΡƒΡ€ΠΎΠ²Π½Π΅ (Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, Π΄ΠΎΡ‡Π΅Ρ€ΡŒΠΌΠΈ ΠΏΠ°Ρ€Π°Π³Ρ€Π°Ρ„Π° ΠΌΠΎΠ³ΡƒΡ‚ Π±Ρ‹Ρ‚ΡŒ строки), Ρ‚Π°ΠΊ ΠΈ Π½Π° Π±ΠΎΠ»Π΅Π΅ Π½ΠΈΠ·ΠΊΠΎΠΌ иСрархичСском ΡƒΡ€ΠΎΠ²Π½Π΅ (Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, Π΄ΠΎΡ‡Π΅Ρ€ΡŒΠΌΠΈ ΠΊΠΎΠ»ΠΎΠ½ΠΊΠΈ ΠΌΠΎΠ³ΡƒΡ‚ Π±Ρ‹Ρ‚ΡŒ символы).

МодСль описания структуры Ρ‚Π°Π±Π»ΠΈΡ‡Π½Ρ‹Ρ… Ρ„ΠΎΡ€ΠΌ — обобщСнная модСль связанных ΠΎΡ€Ρ‚ΠΎΠ³ΠΎΠ½Π°Π»ΡŒΠ½Ρ‹Ρ… ΠΈΠ΅Ρ€Π°Ρ€Ρ…ΠΈΠΉ;

Рассмотрим особСнности Ρ‚Π°Π±Π»ΠΈΡ‡Π½Ρ‹Ρ… структур, ΠΎΠΏΡ€Π΅Π΄Π΅Π»ΡΡŽΡ‰ΠΈΠ΅ Π½Π΅ΠΎΠ±Ρ…ΠΎΠ΄ΠΈΠΌΠΎΡΡ‚ΡŒ использования ΡΠΏΠ΅Ρ†ΠΈΠ°Π»ΡŒΠ½ΠΎΠΉ ΠΌΠΎΠ΄Π΅Π»ΠΈ для ΠΈΡ… ΠΎΠΏΠΈΡΠ°Π½ΠΈΡ:

ΠŸΡ€Π°Π²ΠΈΠ»ΡŒΠ½ΠΎΠ΅ ΠΏΠΎΠ½ΠΈΠΌΠ°Π½ΠΈΠ΅ Ρ‚Π°Π±Π»ΠΈΡ†Ρ‹ Ρ‡ΠΈΡ‚Π°Ρ‚Π΅Π»Π΅ΠΌ Π½Π΅Π²ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎ Π±Π΅Π· ΡƒΡ‡Π΅Ρ‚Π° ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΠΈ ΠΎ Π²Π·Π°ΠΈΠΌΠ½ΠΎΠΌ располоТСнии строк, ΠΊΠΎΠ»ΠΎΠ½ΠΎΠΊ ΠΈ ΡΡ‡Π΅Π΅ΠΊ Ρ‚Π°Π±Π»ΠΈΡ†Ρ‹. ΠŸΠΎΡΡ‚ΠΎΠΌΡƒ ΠΏΡ€ΠΈ Π°Π²Ρ‚ΠΎΠΌΠ°Ρ‚ΠΈΠ·ΠΈΡ€ΠΎΠ²Π°Π½Π½ΠΎΠΌ распознавании Ρ‚Π°Π±Π»ΠΈΡ‡Π½Ρ‹Ρ… Ρ„ΠΎΡ€ΠΌ Π½Π΅ΠΎΠ±Ρ…ΠΎΠ΄ΠΈΠΌΠΎ Π² Π²Ρ‹Ρ…ΠΎΠ΄Π½ΠΎΠΌ Π΄ΠΎΠΊΡƒΠΌΠ΅Π½Ρ‚Π΅ ΡΠΎΡ…Ρ€Π°Π½ΠΈΡ‚ΡŒ Ρ‚ΠΎ ΠΆΠ΅ Π²Π·Π°ΠΈΠΌΠ½ΠΎΠ΅ располоТСниС этих структурных Ρ‚Π°Π±Π»ΠΈΡ‡Π½Ρ‹Ρ… элСмСнтов, Ρ‡Ρ‚ΠΎ ΠΈ Π² ΠΈΡΡ…ΠΎΠ΄Π½ΠΎΠΉ Ρ‚Π°Π±Π»ΠΈΡ†Π΅.

Π‘Ρ‚Ρ€ΠΎΠΊΠΈ ΠΈ ΠΊΠΎΠ»ΠΎΠ½ΠΊΠΈ Ρ‚Π°Π±Π»ΠΈΡ† ΠΌΠΎΠ³ΡƒΡ‚ ΠΈΠΌΠ΅Ρ‚ΡŒ ΠΈΠ΅Ρ€Π°Ρ€Ρ…ΠΈΡ‡Π΅ΡΠΊΡƒΡŽ структуру (рис. 3), ΠΏΡ€ΠΈΡ‡Π΅ΠΌ иСрархия ΠΌΠΎΠΆΠ΅Ρ‚ Π±Ρ‹Ρ‚ΡŒ ΠΌΠ½ΠΎΠ³ΠΎΡƒΡ€ΠΎΠ²Π½Π΅Π²ΠΎΠΉ (рис. 3, d).

Колонки ΠΈ Π³ΠΎΡ€ΠΈΠ·ΠΎΠ½Ρ‚Π°Π»ΡŒΠ½Ρ‹Π΅ Π±Π»ΠΎΠΊΠΈ Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹Ρ… иСрархичСских ΡƒΡ€ΠΎΠ²Π½Π΅ΠΉ Π² Ρ‚Π°Π±Π»ΠΈΡ†Π°Ρ… ΠΌΠΎΠ³ΡƒΡ‚ ΠΈΠΌΠ΅Ρ‚ΡŒ Π·Π°Π³ΠΎΠ»ΠΎΠ²ΠΊΠΈ. ΠžΡ€ΠΈΠ΅Π½Ρ‚Π°Ρ†ΠΈΡ тСкста Π² Π·Π°Π³ΠΎΠ»ΠΎΠ²ΠΊΠ°Ρ… ΠΌΠΎΠΆΠ΅Ρ‚ Π±Ρ‹Ρ‚ΡŒ ΠΊΠ°ΠΊ Π³ΠΎΡ€ΠΈΠ·ΠΎΠ½Ρ‚Π°Π»ΡŒΠ½ΠΎΠΉ, Ρ‚Π°ΠΊ ΠΈ Π²Π΅Ρ€Ρ‚ΠΈΠΊΠ°Π»ΡŒΠ½ΠΎΠΉ.

Колонки ΠΈ ΡΡ‚Ρ€ΠΎΠΊΠΈ Π² Ρ‚Π°Π±Π»ΠΈΡ†Π°Ρ… ΠΌΠΎΠ³ΡƒΡ‚ Π±Ρ‹Ρ‚ΡŒ Ρ€Π°Π·Π΄Π΅Π»Π΅Π½Ρ‹ линиями. Π’ΠΎΠ»Ρ‰ΠΈΠ½Π° Π»ΠΈΠ½ΠΈΠΈ, Π΅Π΅ Ρ‚ΠΈΠΏ (Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, одинарная ΠΈΠ»ΠΈ двойная, сплошная ΠΈΠ»ΠΈ пунктирная), Π° Ρ‚Π°ΠΊΠΆΠ΅ сам Ρ„Π°ΠΊΡ‚ наличия ΠΈΠ»ΠΈ отсутствия Ρ€Π°Π·Π΄Π΅Π»ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΠΉ Π»ΠΈΠ½ΠΈΠΈ ΠΌΠ΅ΠΆΠ΄Ρƒ двумя ΠΊΠΎΠ»ΠΎΠ½ΠΊΠ°ΠΌΠΈ ΠΈΠ»ΠΈ строками Ρ‚Π°Π±Π»ΠΈΡ†Ρ‹ ΠΌΠΎΠ³ΡƒΡ‚ Π±Ρ‹Ρ‚ΡŒ связаны ΠΎΠΏΡ€Π΅Π΄Π΅Π»Π΅Π½Π½Ρ‹ΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ со ΡΡ‚Ρ€ΡƒΠΊΡ‚ΡƒΡ€ΠΎΠΉ ΠΈ ΡΠ΅ΠΌΠ°Π½Ρ‚ΠΈΠΊΠΎΠΉ Ρ‚Π°Π±Π»ΠΈΡ†Ρ‹ ΠΈ, ΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎ, ΠΏΡ€ΠΈ Π°Π²Ρ‚ΠΎΠΌΠ°Ρ‚ΠΈΠ·ΠΈΡ€ΠΎΠ²Π°Π½Π½ΠΎΠΌ распознавании Ρ‚Π°Π±Π»ΠΈΡ† Π΄ΠΎΠ»ΠΆΠ½Ρ‹ Π±Ρ‹Ρ‚ΡŒ ΠΎΡ‚Ρ€Π°ΠΆΠ΅Π½Ρ‹ Π² ΡΠ»ΡƒΡ‡Π°Π΅ нСобходимости Π² Π²Ρ‹Ρ…ΠΎΠ΄Π½ΠΎΠΌ Π΄ΠΎΠΊΡƒΠΌΠ΅Π½Ρ‚Π΅.

Π‘ ΡƒΡ‡Π΅Ρ‚ΠΎΠΌ пСрСчислСнных особСнностСй ясно, Ρ‡Ρ‚ΠΎ Π½ΠΈ Π΄Π΅Ρ€Π΅Π²ΠΎ рСгулярного ΠΎΡ€Ρ‚ΠΎΠ³ΠΎΠ½Π°Π»ΡŒΠ½ΠΎΠ³ΠΎ чСрСдования, Π½ΠΈ ΠΌΠ°Ρ‚ричная структура Π² Π±ΠΎΠ»ΡŒΡˆΠΈΠ½ΡΡ‚Π²Π΅ случаСв Π½Π΅ ΠΏΠΎΠ΄Ρ…одят для модСлирования структуры Ρ‚Π°Π±Π»ΠΈΡ‡Π½Ρ‹Ρ… Ρ„ΠΎΡ€ΠΌ. Π₯отя Π΄Π΅Ρ€Π΅Π²ΠΎ рСгулярного ΠΎΡ€Ρ‚ΠΎΠ³ΠΎΠ½Π°Π»ΡŒΠ½ΠΎΠ³ΠΎ чСрСдования ΠΈ ΡΠΎΡ…раняСт Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€ΡƒΡŽ ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΡŽ ΠΎ Π²Π·Π°ΠΈΠΌΠ½ΠΎΠΌ располоТСнии элСмСнтов Ρ‚Π°Π±Π»ΠΈΡ†Ρ‹, этой ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΠΈ нСдостаточно, Ρ‡Ρ‚ΠΎΠ±Ρ‹ воспроизвСсти ΠΈΡΡ…ΠΎΠ΄Π½ΡƒΡŽ структуру Ρ‚Π°Π±Π»ΠΈΡ†Ρ‹ Π² Π²Ρ‹Ρ…ΠΎΠ΄Π½ΠΎΠΌ Π΄ΠΎΠΊΡƒΠΌΠ΅Π½Ρ‚Π΅. ΠŸΡ€ΠΈΠΌΠ΅Ρ€ ΠΏΡ€ΠΈΠ²Π΅Π΄Π΅Π½ Π½Π° Ρ€ΠΈΡ. 4. Π₯отя структура Ρ‚Π°Π±Π»ΠΈΡ† Π½Π° Ρ€ΠΈΡ. 4, a) ΠΈ b), Ρ€Π°Π·Π»ΠΈΡ‡Π½Π°, Π΄Π΅Ρ€Π΅Π²ΡŒΡ рСгулярного ΠΎΡ€Ρ‚ΠΎΠ³ΠΎΠ½Π°Π»ΡŒΠ½ΠΎΠ³ΠΎ чСрСдования, ΠΎΠΏΠΈΡΡ‹Π²Π°ΡŽΡ‰ΠΈΠ΅ структуру этих Ρ‚Π°Π±Π»ΠΈΡ†, ΡΠΎΠ²ΠΏΠ°Π΄Π°ΡŽΡ‚ (см. Ρ€ΠΈΡ. 4c). НСпримСнима Π² ΠΎΠ±Ρ‰Π΅ΠΌ случаС ΠΊ Ρ‚Π°Π±Π»ΠΈΡ†Π°ΠΌ ΠΈ ΠΌΠ°Ρ‚ричная структура, Ρ‚Π°ΠΊ ΠΊΠ°ΠΊ ΠΎΠ½Π° Π½Π΅ ΠΏΠΎΠ·Π²ΠΎΠ»ΡΠ΅Ρ‚ ΠΎΠΏΠΈΡΡ‹Π²Π°Ρ‚ΡŒ Ρ‚Π°Π±Π»ΠΈΡ†Ρ‹ с ΠΈΠ΅Ρ€Π°Ρ€Ρ…ичСской ΠΎΡ€Π³Π°Π½ΠΈΠ·Π°Ρ†ΠΈΠ΅ΠΉ.

Π§Ρ‚ΠΎΠ±Ρ‹ Π²Ρ‹ΡΡΠ½ΠΈΡ‚ΡŒ, какая модСль Π΄Π°Π½Π½Ρ‹Ρ… ΠΌΠΎΠΆΠ΅Ρ‚ Π±Ρ‹Ρ‚ΡŒ использована для прСдставлСния Ρ‚Π°Π±Π»ΠΈΡ†, рассмотрим сначала ΠΎΠ±Ρ‰Π΅ΠΏΡ€ΠΈΠ½ΡΡ‚ΡƒΡŽ Π² Ρ‚СхничСской Π΄ΠΎΠΊΡƒΠΌΠ΅Π½Ρ‚Π°Ρ†ΠΈΠΈ структуру Ρ‚Π°Π±Π»ΠΈΡ†. ΠžΠ±Ρ‹Ρ‡Π½ΠΎ Ρ‚Π°Π±Π»ΠΈΡ†Π° состоит ΠΈΠ· ΡˆΠ°ΠΏΠΊΠΈ, ΠΌΠΎΠΆΠ΅Ρ‚ Π±Ρ‹Ρ‚ΡŒ, Π±ΠΎΠΊΠΎΠ²ΠΈΠΊΠ° ΠΈ Ρ‚Π°ΠΊ Π½Π°Π·Ρ‹Π²Π°Π΅ΠΌΠΎΠ³ΠΎ «Ρ‚Π΅Π»Π° «Ρ‚Π°Π±Π»ΠΈΡ†Ρ‹ (рис. 5), ΠΏΡ€ΠΈΡ‡Π΅ΠΌ ΠΊΠ°ΠΊ шапка, Ρ‚Π°ΠΊ ΠΈ Π±ΠΎΠΊΠΎΠ²ΠΈΠΊ ΠΌΠΎΠ³ΡƒΡ‚ ΠΈΠΌΠ΅Ρ‚ΡŒ ΠΈΠ΅Ρ€Π°Ρ€Ρ…ΠΈΡ‡Π΅ΡΠΊΡƒΡŽ структуру (рис. 6). МодСль Ρ‚Π°ΠΊΠΎΠΉ Ρ‚Π°Π±Π»ΠΈΡ†Ρ‹ ΠΌΠΎΠΆΠ΅Ρ‚ ΡΠΎΡΡ‚ΠΎΡΡ‚ΡŒ ΠΈΠ· Π΄Π΅Ρ€Π΅Π²Π° Π³ΠΎΡ€ΠΈΠ·ΠΎΠ½Ρ‚Π°Π»ΡŒΠ½ΠΎΠΉ ΠΈΠ΅Ρ€Π°Ρ€Ρ…ΠΈΠΈ, ΠΎΠΏΠΈΡΡ‹Π²Π°ΡŽΡ‰Π΅Π³ΠΎ структуру Π±ΠΎΠΊΠΎΠ²ΠΈΠΊΠ°, Π΄Π΅Ρ€Π΅Π²Π° Π²Π΅Ρ€Ρ‚ΠΈΠΊΠ°Π»ΡŒΠ½ΠΎΠΉ ΠΈΠ΅Ρ€Π°Ρ€Ρ…ΠΈΠΈ, ΠΎΠΏΠΈΡΡ‹Π²Π°ΡŽΡ‰Π΅Π³ΠΎ структуру шапки ΠΈ ΡΠ²ΡΠ·Π΅ΠΉ ΠΌΠ΅ΠΆΠ΄Ρƒ Π΄Π΅Ρ€Π΅Π²ΡŒΡΠΌΠΈ Π³ΠΎΡ€ΠΈΠ·ΠΎΠ½Ρ‚Π°Π»ΡŒΠ½ΠΎΠΉ ΠΈ Π²Π΅Ρ€Ρ‚ΠΈΠΊΠ°Π»ΡŒΠ½ΠΎΠΉ ΠΈΠ΅Ρ€Π°Ρ€Ρ…ΠΈΠΉ.

Π Π°ΡΡΠΌΠΎΡ‚Ρ€Π΅Π½Π½ΡƒΡŽ модСль Π±ΡƒΠ΄Π΅ΠΌ Π½Π°Π·Ρ‹Π²Π°Ρ‚ΡŒ ΠΎΠ±ΠΎΠ±Ρ‰Π΅Π½Π½ΠΎΠΉ модСлью связанных ΠΎΡ€Ρ‚ΠΎΠ³ΠΎΠ½Π°Π»ΡŒΠ½Ρ‹Ρ… ΠΈΠ΅Ρ€Π°Ρ€Ρ…ΠΈΠΉ. ΠŸΡ€ΠΈΠΌΠ΅Ρ€ описания структуры Ρ‚Π°Π±Π»ΠΈΡ†Ρ‹ с ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Π½ΠΈΠ΅ΠΌ этой ΠΌΠΎΠ΄Π΅Π»ΠΈ ΠΏΡ€ΠΈΠ²Π΅Π΄Π΅Π½ Π½Π° Ρ€ΠΈΡ. 7 (b, c).

ΠžΠ±Ρ‰ΠΈΠΉ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ распознавания Ρ‚Π°Π±Π»ΠΈΡ†

БистСма распознавания Ρ‚Π°Π±Π»ΠΈΡ‡Π½Ρ‹Ρ… Ρ„ΠΎΡ€ΠΌ состоит ΠΈΠ· ΡΠ»Π΅Π΄ΡƒΡŽΡ‰ΠΈΡ… основных ΠΊΠΎΠΌΠΏΠΎΠ½Π΅Π½Ρ‚: 1) подсистСмы ΠΏΡ€Π΅Π΄ΠΎΠ±Ρ€Π°Π±ΠΎΡ‚ΠΊΠΈ; 2) Ρ‚Π°Π±Π»ΠΈΡ‡Π½ΠΎΠ³ΠΎ структуризатора; 3) подсистСмы распознавания символов (OCR-систС-ΠΌΡ‹); 4) Ρ‚Π°Π±Π»ΠΈΡ‡Π½ΠΎΠ³ΠΎ Ρ„ΠΎΡ€ΠΌΠ°Ρ‚ΠΈΠ·Π°Ρ‚ΠΎΡ€Π°; 5) подсистСмы постобработки.

OCR-систСма осущСствляСт распознаваниС тСкстовой ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΠΈ Π½Π° ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½ΠΈΠΈ (основа ΠΌΠ΅Ρ‚ΠΎΠ΄Π° распознавания рассмотрСна Π² Ρ€Π°Π±ΠΎΡ‚Π΅[19].

Π’Π°Π±Π»ΠΈΡ‡Π½Ρ‹ΠΉ Ρ„ΠΎΡ€ΠΌΠ°Ρ‚ΠΈΠ·Π°Ρ‚ΠΎΡ€ Π²Ρ‹Π²ΠΎΠ΄ΠΈΡ‚ Ρ‚Π°Π±Π»ΠΈΡ†Ρƒ, структура ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠΉ ΠΎΠΏΡ€Π΅Π΄Π΅Π»Π΅Π½Π° структуризатором, Π² Π²ΠΈΠ΄Π΅ тСкстового Ρ„Π°ΠΉΠ»Π°, располагая распознанныС OCR-систСмой символы Π² Π½Π°Π΄Π»Π΅ΠΆΠ°Ρ‰Π΅ΠΌ порядкС Π² ΡΠΎΠΎΡ‚Π²Π΅Ρ‚ΡΡ‚Π²ΡƒΡŽΡ‰ΠΈΡ… ячСйках Ρ‚Π°Π±Π»ΠΈΡ†Ρ‹. ΠŸΠΎΠ΄ΡΠΈΡΡ‚Π΅ΠΌΠ° постобработки осущСствляСт ΠΊΠΎΠ½Ρ‚Π΅ΠΊΡΡ‚Π½ΠΎΠ·Π°Π²ΠΈΡΠΈΠΌΡƒΡŽ ΠΊΠΎΡ€Ρ€Π΅ΠΊΡ†ΠΈΡŽ символов (Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, замСняСт ΠΏΡ€ΠΈ нСобходимости строчныС Π±ΡƒΠΊΠ²Ρ‹ Π½Π° ΠΏΡ€ΠΎΠΏΠΈΡΠ½Ρ‹Π΅ Π² Π·Π°Π²ΠΈΡΠΈΠΌΠΎΡΡ‚ΠΈ ΠΎΡ‚ Ρ€Π°ΡΠΏΠΎΠ»ΠΎΠΆΠ΅Π½ΠΈΡ ΠΈΡ… Π² ΡΠ»ΠΎΠ²Π΅).

Рассмотрим Π±ΠΎΠ»Π΅Π΅ ΠΏΠΎΠ΄Ρ€ΠΎΠ±Π½ΠΎ Ρ€Π°Π±ΠΎΡ‚Ρƒ Ρ‚Π°Π±Π»ΠΈΡ‡Π½ΠΎΠ³ΠΎ структуризатора. Π­Ρ‚Π° подсистСма ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎ выполняСт ΡΠ»Π΅Π΄ΡƒΡŽΡ‰ΠΈΠ΅ дСйствия: 1) ΠΎΠ±Π½Π°Ρ€ΡƒΠΆΠ΅Π½ΠΈΠ΅ ΠΈ ΡƒΠ΄Π°Π»Π΅Π½ΠΈΠ΅ Π»ΠΈΠ½ΠΈΠΉ Π½Π° Ρ€Π°ΡΡ‚Ρ€Π΅; 2) Π°Π²Ρ‚ΠΎΠ½ΠΎΠΌΠ½ΡƒΡŽ ΠΎΠ±Ρ€Π°Π±ΠΎΡ‚ΠΊΡƒ Π»ΠΈΠ½ΠΈΠΉ; 3) Π°Π²Ρ‚ΠΎΠ½ΠΎΠΌΠ½ΡƒΡŽ ΠΎΠ±Ρ€Π°Π±ΠΎΡ‚ΠΊΡƒ тСкста; 4) распознаваниС структуры Ρ‚Π°Π±Π»ΠΈΡ†; 5) Π°Π½Π°Π»ΠΈΠ· ячССк Ρ‚Π°Π±Π»ΠΈΡ†Ρ‹.

ΠŸΡ€ΠΎΡ†Π΅Π΄ΡƒΡ€Π° обнаруТСния Π»ΠΈΠ½ΠΈΠΉ ΠΎΠ±Ρ€Π°Π±Π°Ρ‚Ρ‹Π²Π°Π΅Ρ‚ растровоС ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½ΠΈΠ΅ листа Π΄ΠΎΠΊΡƒΠΌΠ΅Π½Ρ‚Π° ΠΈ ΠΎΠ±Π½Π°Ρ€ΡƒΠΆΠΈΠ²Π°Π΅Ρ‚ Π½Π° Π½Π΅ΠΌ ΠΎΡ‚Ρ€Π΅Π·ΠΊΠΈ прямых Π»ΠΈΠ½ΠΈΠΉ. Π—Π°Ρ‚Π΅ΠΌ эти Π»ΠΈΠ½ΠΈΠΈ ΡƒΠ΄Π°Π»ΡΡŽΡ‚ΡΡ с Ρ€Π°ΡΡ‚Ρ€ΠΎΠ²ΠΎΠ³ΠΎ изобраТСния, Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΠΎΡ‚Π΄Π΅Π»ΠΈΡ‚ΡŒ ΠΈΡ… ΠΎΡ‚ ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½ΠΈΠΉ символов ΠΈ ΠΎΠ±Π΅ΡΠΏΠ΅Ρ‡ΠΈΡ‚ΡŒ Π²ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎΡΡ‚ΡŒ Π°Π²Ρ‚ΠΎΠ½ΠΎΠΌΠ½ΠΎΠΉ ΠΎΠ±Ρ€Π°Π±ΠΎΡ‚ΠΊΠΈ Π»ΠΈΠ½ΠΈΠΉ ΠΈ Ρ‚Скста.

ΠŸΡ€ΠΎΡ†Π΅Π΄ΡƒΡ€Π° Π°Π²Ρ‚ΠΎΠ½ΠΎΠΌΠ½ΠΎΠΉ ΠΎΠ±Ρ€Π°Π±ΠΎΡ‚ΠΊΠΈ Π»ΠΈΠ½ΠΈΠΉ выполняСт ΡΠ»Π΅Π΄ΡƒΡŽΡ‰ΠΈΠ΅ дСйствия: Π°) сращиваниС Ρ€Π°Π·Ρ€Ρ‹Π²ΠΎΠ² Π»ΠΈΠ½ΠΈΠΉ; Π±) ΠΎΡ†Π΅Π½ΠΈΠ²Π°Π½ΠΈΠ΅ ΠΈ Π»ΠΈΠΊΠ²ΠΈΠ΄Π°Ρ†ΠΈΡ пСрСкоса; Π²) Π²Ρ‹Π΄Π΅Π»Π΅Π½ΠΈΠ΅ кластСров соосных Π»ΠΈΠ½ΠΈΠΉ; Π³) ΠΎΠΏΡ€Π΅Π΄Π΅Π»Π΅Π½ΠΈΠ΅ Ρ‚ΠΈΠΏΠΎΠ² Π»ΠΈΠ½ΠΈΠΉ. ΠŸΡ€ΠΎΡ†Π΅Π΄ΡƒΡ€Π° Π°Π²Ρ‚ΠΎΠ½ΠΎΠΌΠ½ΠΎΠΉ ΠΎΠ±Ρ€Π°Π±ΠΎΡ‚ΠΊΠΈ тСкста состоит Π² ΠΎΡΠ½ΠΎΠ²Π½ΠΎΠΌ Π² ΠΊΠΎΠ½Ρ‚Скстно-нСзависимой Ρ„ΠΈΠ»ΡŒΡ‚Ρ€Π°Ρ†ΠΈΠΈ ΠΎΠ±Ρ€Ρ‹Π²ΠΊΠΎΠ² Π»ΠΈΠ½ΠΈΠΉ ΠΈ Ρ„ΠΈΠ»ΡŒΡ‚Ρ€Π°Ρ†ΠΈ ΡˆΡƒΠΌΠΎΠ² Π½Π° Ρ‚Скстовом слоС растра. Π’Ρ…ΠΎΠ΄Π½Ρ‹ΠΌΠΈ Π΄Π°Π½Π½Ρ‹ΠΌΠΈ для ΠΏΡ€ΠΎΡ†Π΅Π΄ΡƒΡ€Ρ‹ распознавания Ρ‚Π°Π±Π»ΠΈΡ‡Π½ΠΎΠΉ структуры ΡΠ²Π»ΡΡŽΡ‚ΡΡ: Π°ΠΏΡ€ΠΈΠΎΡ€Π½ΠΎΠ΅ описаниС структуры Ρ‚Π°Π±Π»ΠΈΡ†Ρ‹; Π½Π°Π±ΠΎΡ€ ΠΎΡ‚Ρ€Π΅Π·ΠΊΠΎΠ² Π³ΠΎΡ€ΠΈΠ·ΠΎΠ½Ρ‚Π°Π»ΡŒΠ½Ρ‹Ρ… ΠΈ Π²Π΅Ρ€Ρ‚ΠΈΠΊΠ°Π»ΡŒΠ½Ρ‹Ρ… Π»ΠΈΠ½ΠΈΠΉ, классифицированных ΠΏΠΎ Ρ‚ΠΈΠΏΠ°ΠΌ; информация ΠΎ ΠΏΠΎΠ»ΠΎΠΆΠ΅Π½ΠΈΠΈ ΠΈ Ρ€Π°Π·ΠΌΠ΅Ρ€Π°Ρ… Ρ€Π°ΠΌΠΎΠΊ тСкстовых ΠΊΠΎΠΌΠΏΠΎΠ½Π΅Π½Ρ‚ связности.

Π­Ρ‚Π° ΠΏΡ€ΠΎΡ†Π΅Π΄ΡƒΡ€Π° провСряСт, соотвСтствуСт Π»ΠΈ структура ΠΎΠ±Ρ€Π°Π±Π°Ρ‚Ρ‹Π²Π°Π΅ΠΌΠΎΠ³ΠΎ изобраТСния Π°ΠΏΡ€ΠΈΠΎΡ€Π½ΠΎΠΌΡƒ описанию, ΠΈ Π² ΡΠ»ΡƒΡ‡Π°Π΅ соотвСтствия Ρ„ΠΎΡ€ΠΌΠΈΡ€ΡƒΠ΅Ρ‚ ΠΈΠ΅Ρ€Π°Ρ€Ρ…ΠΈΡ‡Π΅ΡΠΊΡƒΡŽ модСль структуры Ρ‚Π°Π±Π»ΠΈΡ†Ρ‹. Для Ρ‚ΠΎΠ³ΠΎ, Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΠΎΠ±Π΅ΡΠΏΠ΅Ρ‡ΠΈΡ‚ΡŒ устойчивоС распознаваниС, эта ΠΏΡ€ΠΎΡ†Π΅Π΄ΡƒΡ€Π° ΡƒΡ‡ΠΈΡ‚Ρ‹Π²Π°Π΅Ρ‚ спСцифичСскиС особСнности Ρ‚Π°Π±Π»ΠΈΡ† ΠΎΠΏΡ€Π΅Π΄Π΅Π»Π΅Π½Π½ΠΎΠ³ΠΎ Ρ‚ΠΈΠΏΠ°. ΠžΡΠ½ΠΎΠ²Π½Ρ‹Π΅ дСйствия, выполняСмыС этой ΠΏΡ€ΠΎΡ†Π΅Π΄ΡƒΡ€ΠΎΠΉ:

идСнтификация Π³ΠΎΡ€ΠΈΠ·ΠΎΠ½Ρ‚Π°Π»ΡŒΠ½Ρ‹Ρ… Π»ΠΈΠ½ΠΈΠΉ, ΠΎΠ³Ρ€Π°Π½ΠΈΡ‡ΠΈΠ²Π°ΡŽΡ‰ΠΈΡ… ΡˆΠ°ΠΏΠΊΡƒ;

глобальная контСкстно-зависимая Ρ„ΠΈΠ»ΡŒΡ‚Ρ€Π°Ρ†ΠΈΡ Π»ΠΈΠ½ΠΈΠΉ;

идСнтификация Π²Π΅Ρ€Ρ‚ΠΈΠΊΠ°Π»ΡŒΠ½Ρ‹Ρ… Π»ΠΈΠ½ΠΈΠΉ Π² ΡΠΎΠΎΡ‚вСтствии с Π°ΠΏΡ€ΠΈΠΎΡ€Π½Ρ‹ΠΌ описаниСм ΠΈ ΠΏΡ€ΠΎΠ²Π΅Ρ€ΠΊΠ° соотвСтствия структуры Ρ‚Π°Π±Π»ΠΈΡ†Ρ‹ этому описанию;

контСкстно-зависимая Ρ„ΠΈΠ»ΡŒΡ‚Ρ€Π°Ρ†ΠΈΡ ΠΊΠΎΠΌΠΏΠΎΠ½Π΅Π½Ρ‚ (ΠΎΠ±Ρ€Ρ‹Π²ΠΊΠΎΠ² Π»ΠΈΠ½ΠΈΠΉ ΠΈ ΡˆΡƒΠΌΠ°);

построСниС Π²Π΅Ρ€Ρ‚ΠΈΠΊΠ°Π»ΡŒΠ½ΠΎΠΉ ΠΈΠ΅Ρ€Π°Ρ€Ρ…ΠΈΠΈ (структуры ΠΊΠΎΠ»ΠΎΠ½ΠΎΠΊ);

ΠΎΡ†Π΅Π½ΠΈΠ²Π°Π½ΠΈΠ΅ Π³ΠΎΡ€ΠΈΠ·ΠΎΠ½Ρ‚Π°Π»ΡŒΠ½ΠΎΠΉ ΠΈΠ΅Ρ€Π°Ρ€Ρ…ΠΈΠΈ.

НазначСниС ΠΏΡ€ΠΎΡ†Π΅Π΄ΡƒΡ€Ρ‹ Π°Π½Π°Π»ΠΈΠ·Π° ячССк — структуризация тСкста Π²Π½ΡƒΡ‚Ρ€ΠΈ ячССк Ρ‚Π°Π±Π»ΠΈΡ†Ρ‹. ΠŸΡ€ΠΎΡ†Π΅Π΄ΡƒΡ€Π° выполняСт ΡΠ»Π΅Π΄ΡƒΡŽΡ‰ΠΈΠ΅ дСйствия: Π²Ρ‹Π΄Π΅Π»Π΅Π½ΠΈΠ΅ строк ΠΈ ΡΠ»ΠΎΠ², ΠΎΠ±Π½Π°Ρ€ΡƒΠΆΠ΅Π½ΠΈΠ΅ Π·Π½Π°ΠΊΠΎΠ² прСпинания, индСксных Π²Ρ‹Ρ€Π°ΠΆΠ΅Π½ΠΈΠΉ, Π΄Ρ€ΠΎΠ±Π΅ΠΉ ΠΈ ΠΌΠ½ΠΎΠ³ΠΎΡ‚ΠΎΡ‡ΠΈΠΉ Π²Π½ΡƒΡ‚Ρ€ΠΈ ячССк Ρ‚Π°Π±Π»ΠΈΡ†Ρ‹.

Π—Π°ΠΊΠ»ΡŽΡ‡Π΅Π½ΠΈΠ΅

Π’Π°ΠΊΠΈΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ, Π² Π½Π°ΡΡ‚оящСй Ρ€Π°Π±ΠΎΡ‚Π΅ ΠΏΡ€ΠΎΠ²Π΅Π΄Π΅Π½ ΠΎΠ±Π·ΠΎΡ€ соврСмСнных Ρ‚Π΅Ρ…Π½ΠΎΠ»ΠΎΠ³ΠΈΠΉ Π°Π²Ρ‚ΠΎΠΌΠ°Ρ‚ΠΈΠ·ΠΈΡ€ΠΎΠ²Π°Π½Π½ΠΎΠ³ΠΎ Π²Π²ΠΎΠ΄Π° Π² ΠΊΠΎΠΌΠΏΡŒΡŽΡ‚Π΅Ρ€ слоТноструктурированных ΠΏΠ΅Ρ‡Π°Ρ‚Π½Ρ‹Ρ… Π΄ΠΎΠΊΡƒΠΌΠ΅Π½Ρ‚ΠΎΠ² ΠΈ ΡΠ΄Π΅Π»Π°Π½ Π²Ρ‹Π²ΠΎΠ΄ ΠΎ Π½Π°Π»ΠΈΡ‡ΠΈΠΈ ΠΎΠΏΡ€Π΅Π΄Π΅Π»Π΅Π½Π½ΠΎΠΉ ограничСнности срСдств структурного распознавания Ρ‚Π°Π±Π»ΠΈΡ† слоТной Ρ„ΠΎΡ€ΠΌΡ‹.

Авторами ΠΏΡ€Π΅Π΄Π»ΠΎΠΆΠ΅Π½Π° достаточно ΡƒΠ½ΠΈΠ²Π΅Ρ€ΡΠ°Π»ΡŒΠ½Π°Ρ структурная модСль связанных ΠΈΠ΅Ρ€Π°Ρ€Ρ…ΠΈΠΉ, пригодная для описания ΡˆΠΈΡ€ΠΎΠΊΠΎΠ³ΠΎ класса тСкстовых Π΄ΠΎΠΊΡƒΠΌΠ΅Π½Ρ‚ΠΎΠ², Ρ‚Π°Π±Π»ΠΈΡ‡Π½Ρ‹Ρ… Ρ„ΠΎΡ€ΠΌ ΠΈ Π±Π»Π°Π½ΠΊΠΎΠ². Π’ Ρ€Π°Π±ΠΎΡ‚Π΅ описываСтся основанная Π½Π° ΠΌΠΎΠ΄Π΅Π»ΠΈ связанных ΠΈΠ΅Ρ€Π°Ρ€Ρ…ΠΈΠΉ мСтодология распознавания Ρ‚Π°Π±Π»ΠΈΡ‡Π½Ρ‹Ρ… структур. Данная мСтодология Π±Ρ‹Π»Π° ΠΏΠΎΠ»ΠΎΠΆΠ΅Π½Π° Π² ΠΎΡΠ½ΠΎΠ²Ρƒ Ρ€Π°Π·Ρ€Π°Π±ΠΎΡ‚Π°Π½Π½ΠΎΠ³ΠΎ Π² Ρ€Π°ΠΌΠΊΠ°Ρ… OCR-систСмы Cript ΡƒΠ½ΠΈΠ²Π΅Ρ€ΡΠ°Π»ΡŒΠ½ΠΎΠ³ΠΎ тСкстово-Ρ‚Π°Π±Π»ΠΈΡ‡Π½ΠΎΠ³ΠΎ структуризатора.

ΠŸΡ€ΠΈΠ²Π΅Π΄Π΅Π½Π½Ρ‹Π΅ Π² Ρ€Π°Π±ΠΎΡ‚Π΅ Π±Π°Π·ΠΎΠ²Ρ‹Π΅ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ структуризатора Cript ΠΌΠΎΠ³ΡƒΡ‚ Π½Π°ΠΉΡ‚ΠΈ ΠΏΡ€ΠΈΠΌΠ΅Π½Π΅Π½ΠΈΠ΅ Π²ΠΎ ΠΌΠ½ΠΎΠ³ΠΈΡ… Π·Π°Π΄Π°Ρ‡Π°Ρ… Π°Π²Ρ‚ΠΎΠΌΠ°Ρ‚ΠΈΠ·ΠΈΡ€ΠΎΠ²Π°Π½Π½ΠΎΠΉ ΠΎΠ±Ρ€Π°Π±ΠΎΡ‚ΠΊΠΈ тСкстов ΠΈ Ρ‚Π°Π±Π»ΠΈΡ† Ρ€Π°Π·Π»ΠΈΡ‡Π½ΠΎΠΉ ΠΏΡ€ΠΈΡ€ΠΎΠ΄Ρ‹, Ρ‡Ρ‚ΠΎ дСмонстрируСтся ΠΏΡ€ΠΈΠΌΠ΅Ρ€Π°ΠΌΠΈ структурного распознавания Ρ‚Π°Π±Π»ΠΈΡ† ΠΈΠ· Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹Ρ… историчСских источников. ΠŸΠΎΡΡ‚ΠΎΠΌΡƒ ΠΏΠΎΠ³Ρ€ΡƒΠΆΠ΅Π½ΠΈΠ΅ OCR систСмы Cript Π² Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹Π΅ Π°Π²Ρ‚ΠΎΠΌΠ°Ρ‚ΠΈΠ·ΠΈΡ€ΠΎΠ²Π°Π½Π½Ρ‹Π΅ систСмы Π²Π²ΠΎΠ΄Π° ΠΈ ΠΎΠ±Ρ€Π°Π±ΠΎΡ‚ΠΊΠΈ историчСских источников ΠΏΠΎΠ·Π²ΠΎΠ»ΠΈΡ‚ ΠΏΠΎΠ²Ρ‹ΡΠΈΡ‚ΡŒ ΡΡ„Ρ„Π΅ΠΊΡ‚ΠΈΠ²Π½ΠΎΡΡ‚ΡŒ ΠΈ ΡΡ‚Π΅ΠΏΠ΅Π½ΡŒ Π°Π²Ρ‚ΠΎΠΌΠ°Ρ‚ΠΈΠ·Π°Ρ†ΠΈΠΈ ΠΏΠΎΠ΄ΠΎΠ±Π½Ρ‹Ρ… систСм. Π“ΠΈΠ±ΠΊΠΎΡΡ‚ΡŒ ΠΈ ΠΏΡ€ΠΎΡΡ‚ΠΎΡ‚Π° Ρ€Π°Π·Ρ€Π°Π±ΠΎΡ‚Π°Π½Π½ΠΎΠ³ΠΎ Π² Ρ€Π°ΠΌΠΊΠ°Ρ… ΠΏΡ€ΠΎΠ΅ΠΊΡ‚Π° Cript языка описания Ρ‚Π°Π±Π»ΠΈΡ‡Π½Ρ‹Ρ… Ρ„ΠΎΡ€ΠΌ сущСствСнно упростят ΠΏΡ€ΠΎΡ†Π΅Π΄ΡƒΡ€Ρƒ настройки ΠΊΠΎΠ½Π΅Ρ‡Π½Ρ‹ΠΌ ΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚Π΅Π»Π΅ΠΌ OCR-систСмы Π½Π° ΡΠΏΠ΅Ρ†ΠΈΡ„ичСскиС особСнности Π²Π²ΠΎΠ΄ΠΈΠΌΡ‹Ρ… Ρ‚Π°Π±Π»ΠΈΡ‡Π½Ρ‹Ρ… структур.

Авторы Π²Ρ‹Ρ€Π°ΠΆΠ°ΡŽΡ‚ ΠΏΡ€ΠΈΠ·Π½Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΡŒ А. Π’. Π’ΡŽΠ»Π΅Π½Π΅Π²Ρƒ ΠΈ Π›. И. Π‘ΠΎΡ€ΠΎΠ΄ΠΊΠΈΠ½Ρƒ, благодаря ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΌ Π²ΠΎ ΠΌΠ½ΠΎΠ³ΠΎΠΌ ΠΈ ΡΠΎΡΡ‚ΠΎΡΠ»Π°ΡΡŒ данная ΡΡ‚Π°Ρ‚ΡŒΡ.

Бписок Π»ΠΈΡ‚Π΅Ρ€Π°Ρ‚ΡƒΡ€Ρ‹

1.OCR (Optical Character Recognition) — оптичСскоС распознаваниС ΠΎΠ±Ρ€Π°Π·ΠΎΠ², Cript — ΠΎΠ΄Π½Π° ΠΈΠ· ΡΡ„Ρ„Π΅ΠΊΡ‚ΠΈΠ²Π½Ρ‹Ρ… отСчСствСнных OCR-систСм (ΠŸΡ€ΠΈΠΌ. Ρ€Π΅Π΄.).

2.L. O «Gorman, «The document spectrum for page layout analysis », IEEE Journal on Pattern Analysis and Machine Intelligence, vol. 15, no. 11, p. 1162−1173, 1993; M. Krishnamoorthy, G. Nagy, S. Seth, M. Viswanathan, «Syntactic segmentation and labelling of digitized pages from technical journals », IEEE Journal on Pattern Analysis and Machine Intelligence, vol.15, no.7, p.737−747, 1993; G. Nagy, S. Seth, M. Viswanathan, A prototype document image analysis system for technical journals, Computer, no.7, p.10−21, 1992.

3.L. O «Gorman, The document spectrum for page layout analysis, IEEE Journal on Pattern Analysis and Machine Intelligence, vol. 15, no. 11, p. 1162−1173, 1993.

4.H.S. Baird, K. Thompson, Reading Chess, Proc. of Workshop on ComputerVision, Washington, 1987.

5.V. Poulian d «Andecy, J. Camillerapp, I. Lemplumey, Kalman Filtering for Segment Detection: Application to Music Scores Analysis, Proc. IAPR 12-th Intern. Conf. on Pattern Recognition, Los Alamos, 1994. — v.1.

6.M. Thaller. The Processing of Manuscripts, Images and Manuscripts in Historical Computing, Goettingen, 1992; T. Kruyt, J. van der Voort van der Kleij. Converting the Historical Dictionary of Dutch to Electronic Form, Optical Character Recognitionin The Historical Discipline., Goettingen, 1993; 22. L. Borodkin, V. Lazarev, E. Zlobin, Applications of OCR in Russian Historical Sources: a Comparison of various programs, Optical Character Recognition in The Historical Discipline, Goettingen, 1993.

7.V. Klyahzkin, E. Shchepin, K. Zingerman. Application of hierarchical methods of cluster analysis to the printedtext structure recognition, Shape, Structure, and Pattern Recognition, Dov Dori and Alfred Bruckstein, Eds. World Scientific, 1995; V. Klyahzkin, E. Shchepin, K. Zingerman. Hierarchical analysis of multi-column texts, Pattern Recognition and Image Analysis, Vol.5, No.1, 1995, Interperiodica, pp. 1−12; Π’. М. ΠšΠ»ΡΡ†ΠΊΠΈΠ½. Π˜Π΅Ρ€Π°Ρ€Ρ…ΠΈΡ‡Π΅ΡΠΊΠΈΠΉ кластСранализ ΠΌΠ½ΠΎΠ³ΠΎΠΊΠΎΠ»ΠΎΠ½Π½Ρ‹Ρ… тСкстов, ОдСсса, 1994, Π’Ρ€ΡƒΠ΄Ρ‹ V ΠœΠ΅ΠΆΠ΄ΡƒΠ½Π°Ρ€ΠΎΠ΄Π½ΠΎΠΉ ΠΊΠΎΠ½Ρ„Π΅Ρ€Π΅Π½Ρ†ΠΈΠΈ (БтатистичСский ΠΈ Π΄ΠΈΡΠΊΡ€Π΅Ρ‚Π½Ρ‹ΠΉ Π°Π½Π°Π»ΠΈΠ· Π΄Π°Π½Π½Ρ‹Ρ… ΠΈ ΡΠΊΡΠΏΠ΅Ρ€Ρ‚Π½Ρ‹Π΅ ΠΎΡ†Π΅Π½ΠΊΠΈ), Изд-Π²ΠΎ ОдСсского политСхничСского унивСрситСта, стр. 132−134.

8.M. Krishnamoorthy, G. Nagy, S. Seth, M. Viswanathan, Syntactic segmentation and labelling of digitized pages from technical journals, IEEE Journal on Pattern Analysis and Machine Intelligence, vol.15, no.7, p.737−747, 1993.

9.H.S. Baird, S.E. Jones, S.J. Fortune, Image Segmentation by Shape-Directed Covers, Proc. IAPR 10-th Intern. Conf. on Pattern Recognition, Atlantic City, 1990; H.S.Baird, Background Structure in Document Images, Proc. IAPR Workshop on Structural and Syntactic Pattern Recognition, Bern, 1992.

10.H.S. Baird, Background Structure in Document Images, Proc. IAPR Workshop on Structural and Syntactic Pattern Recognition, Bern, 1992.

11.H. Saiga, Y. Kitumura, S. Ida, «High-Speed Recognition of Tabulated Data », Proc. IAPR 12-th Intern. Conf. on Pattern Recognition, Los Alamos, 1994. — v.2.

12.J. F. Arias, A. Prasad, R. Kasturi, A. Chhabra, Interpretation of Telephone Company Central Office Equipment Drawings, Proc. IAPR 12-th Intern. Conf. on Pattern Recognition, Los Alamos, 1994. — v.2.

13.P. Wayner, Optimal Character Recognition, Byte, 1993, no. 12, p.203−210.

14.G. Thorvaldsen. Making Printed Historical Sources Machine Readable: Some Experiences with OCR, History and Computing, Vol.5 No 2, Edinburgh University Press, 1993.

15.G. Thorvaldsen. Historical OCR Projects in Norway, Optical Character Recognition in The Historical Discipline., Goettingen, 1993.

16.G. Thorvaldsen. Making Printed Historical Sources Machine Readable: Some Experiences with OCR, History and Computing, Vol.5 No 2, Edinburgh University Press, 1993.

17.A. McVeigh. The Irish Database Project: A Case for OCR?, Optical Character Recognition in The Historical Discipline., Goettingen, 1993.

18.M. Olsen. Scanning, Keyboarding and Data Verification: Factors in Selecting Data Collection Technologies, Optical Character Recognition in The Historical Discipline., Goettingen, 1993.

19.E. Shchepin, G. Nepomnyashchii, Character recognition via critical points, International Journal of Imaging Systems and Technology, vol.3, pp.213−221, 1991.

20.ΠœΠ°Ρ‚Π΅Ρ€ΠΈΠ°Π»Ρ‹ для Π³Π΅ΠΎΠ³Ρ€Π°Ρ„iΠΈ ΠΈ ΡΡ‚атистики РоссiΠΈ, собранныС ΠΎΡ„ΠΈΡ†Π΅Ρ€Π°ΠΌΠΈ Π“Π΅Π½Π΅Ρ€Π°Π»ΡŒΠ½Π°Π³ΠΎ ΡˆΡ‚Π°Π±Π°. Казанская Π³ΡƒΠ±Π΅Ρ€Π½iя. (ΡΠΎΡΡ‚Π°Π²ΠΈΡ‚Π΅Π»ΡŒ М. Π›Π°ΠΏΡ‚Π΅Π²) — Π‘Π°Π½ΠΊΡ‚-ΠŸΠ΅Ρ‚Π΅Ρ€Π±ΡƒΡ€Π³, ВоСнная типография. — 1861.

ΠŸΠΎΠΊΠ°Π·Π°Ρ‚ΡŒ вСсь тСкст
Π—Π°ΠΏΠΎΠ»Π½ΠΈΡ‚ΡŒ Ρ„ΠΎΡ€ΠΌΡƒ Ρ‚Π΅ΠΊΡƒΡ‰Π΅ΠΉ Ρ€Π°Π±ΠΎΡ‚ΠΎΠΉ