Патент тижня: штучний інтелект перетворить зображення в текст

Наука і техніка

Системи розпізнавання тексту були винайдені ще в минулому двадцятому столітті, коли з допомогою сканерів листи віддрукованих документів стало можна переводити в редаговані комп’ютерні файли. Технологічний прорив в цій області заощадив чимало часу тим, хто працював над дипломами, дисертаціями, науковими доповідями, в яких було потрібно процитувати великий обсяг тексту.

Редакція ПМ

Патент недели: искусственный интеллект превратит картинки в текст

При безпосередній участі Федеральної служби з інтелектуальної власності («Роспатенту») ми вирішили ввести на сайті рубрику «Патент тижня». Щотижня в Росії патентуються десятки цікавих винаходів і вдосконалень — чому б не розповідати про них в числі перших.

Патент: 2691214

Автори: Микита Орлов, Володимир Рибкін, Костянтин Онисимович, Азат Давлетшін

Патентовласники: ТОВ «Абі Продакшн»

Проблема, з якою стикався більшість систем розпізнавання тексту, — складність роботи з «нестандартними» шрифтами, а також, наприклад, арабською в’яззю або китайськими ієрогліфами. Варіантів накреслення і написання подібних символів — незліченна безліч, аж до індивідуальних особливостей, а нескінченне оновлення бази даних символів — майже нерозв’язна задача.

Людський мозок в подібній ситуації орієнтується на ключові елементи текстових символів: скажімо, літеру «а», написану різними людьми, люди, так чи інакше, дізнаються, незважаючи на індивідуальні особливості почерку або стиль друку. Інша справа — машини. По суті, ранні системи розпізнавання тексту були побудовані на порівнянні відсканованої зображення символу з символами в пам’яті програми: невелика зміна — і ось уже програма видає зовсім не ту букву або знак, що вам потрібен. «Розпізнаний текст доводилося вичитувати щоб уникнути помилок навіть при скануванні простих документів на кирилиці або латиниці.

Читайте также:
Apple патентує технологію, яка блокує відеозйомку на концертах

Лідер російського і міжнародного ринку систем розпізнавання, компанія ABBYY, включила в свою нову систему перекладу текстів в редагований файл елементи штучного інтелекту. Завдяки такому підходу система починає працювати, фактично як людський мозок, який за індивідуальними особливостями почерку або печатки все одно бачить знайомі ще зі школи літери.

Система не просто «чекає» додавання до неї нових графічних символів, а проводить порівняльний аналіз відсканованого символу з уже відомим їй набором, розширюючи варіанти можливого написання і накреслення однієї і тієї ж графеми, що особливо важливо для роботи з дуже «графічними» шрифтами — ієрогліфами, арабською в’яззю. Якщо в документі є особливості або недоліки друку: пливуть рядки, непропечатаные елементи тощо, «розуму» системи вистачить, щоб видати вам правильний варіант.

Подробиці винаходи — в опублікованому патенті.

Source
Оцініть статтю
Популярний портал | Proexpress.com.ua | все найцікавіше в Україні

Thanks!

Our editors are notified.