Нейросеть «Яндекса» расшифровала данные о миллионах предков россиян

Нейросеть «Яндекса» всего за год распознала в сервисе «Поиск по архивам» более 60 тысяч рукописных и печатных текстов середины XVIII — начала XX веков. В сумме это более 10 миллионов страниц или 492 миллионов строк информации о людях, родившихся в России до революции.

Сервис «Поиск по архивам» предоставляет историкам, социологам, демографам и журналистам данные об исторических событиях и личностях, а обычным людям — информацию о своих предках. Необходимо лишь ввести слово, упоминание которого нужно найти, в поисковую строку. За год пользователи просмотрели расшифрованные нейросетью документы уже более 20 миллионов раз.

«Поиск по архивам»

Технология «Яндекса» основана на оптическом распознавании символов: нейросеть узнаёт утратившие актуальность знаки, учитывает особенности почерка и преобразует трудночитаемые записи в печатный текст. Для работы с вёрсткой газетных страниц ИИ специально адаптировали: он научился распознавать текст на огромных полосах, набранный мелким шрифтом на низкоплотной бумаге.

Сейчас в «Поиске по архивам» доступны документы из архивов 11 регионов, в том числе Москвы, Московской, Оренбургской, Новгородской, Иркутской, Астраханской и других областей. Там хранятся расшифрованные архивные дела и оцифрованные страницы периодических изданий, таких как «Советский спорт», «Вечерняя Москва» и епархиальные ведомости, а также данные о людях, родившихся в дореволюционные времена.

Источник

Поделиться ссылкой:

Total Views: 112 ,
 

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *